1、特征工程

寵の児 提交于 2019-11-27 15:34:34

特征工程是机器学习中最耗时、最繁重的部分。非常重要。

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

特征工程的目的:将信息使用更加高效的编码方式(特征)表示,信息损失最小,原始数据中包含的规律仍然存在。这种新的编码方式要尽量减少原始数据中的不确定因素(噪声、异常数据、数据缺失等)。

其中特征处理是核心环节。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!