scikit-learn 是基于 Python 语言的机器学习工具。
- 简单高效的数据挖掘和数据分析工具
- 可供大家在各种环境中重复使用
- 建立在 NumPy ,SciPy 和 matplotlib 上
- 开源,可商业使用 - BSD许可证
机器学习问题:
监督学习:数据带有我们想要预测的附加属性(各个属性已知)
1.分类:样本属于两个或更多类,从标记得数据训练并能预测出未标记的数据类别;另一个因素是,数据是离散的,我们想要使用正确的类别来标记这些数据。
2.回归:期望输出是一个或多个连续变量,则使用回归方法。比如预测人身高和体重的函数。
来源:oschina
链接:https://my.oschina.net/u/3955849/blog/2997421