机器学习是人工智能中不可或缺的一部分,这篇随笔将记录这段时间学习机器学习的几点感悟,希望对以后的学习有所帮助。参考了以下几本书:
- 《机器学习》-周志华
- 《机器学习实践》-Peter Harrington
在这里我也发现了一篇很不错的文章《从机器学习谈起》,生动有趣,可以加深大家对机器学习的认识。
第一章 机器学习基础
1.什么是机器学习?
机器学习就是把无序的数据转换成有用的信息。
机器学习方法是计算机利用已有的数据(经验),得出了某种模型,并利用此模型预测未来的一种方法。
一般来说,数据越多,最后机器学习生成的模型预测的效果越好。
机器学习的过程与人类对历史经验归纳的过程做个比对,如下图:
2.关键术语
特征:下图测量的四个属性为特征,也可以成为属性。它们通常是训练样本集的列,他们是独立测量得到的结果,逗哥特征联系在一起共同组成一个训练样本。
分类:机器学习的主要任务。这部分工作可以看成:知识表示。
算法训练:学习如何分类。通常为算法输入大量已分类数据作为算法的训练集。
通常建立两套独立的样本集:训练数据和测试数据。
3.机器学习的主要任务
(1)监督学习(知道预测什么):
- 分类(将数据分到合适的分类)
- 回归 (用于测试数值型数据)eg:数据拟合曲线
(2)无监督学习(没有类别信息,也不会给定目标值):
- 聚类
- 密度估计(寻找描述数据统计值的过程)
4.如何选择合适的算法
需要考虑两个问题:
(1)使用机器学习算法的目的
(2)需要分析或收集的数据是什么
5.开发机器学习应用程序的顺序
- 收集数据(网络爬虫、传感器等)
- 准备输入数据(数据格式可以使用Python的List、字符串、整数类型)
- 分析输入数据
- 训练算法(使用监督或无监督算法)
- 测试算法(使用上一步学习得到的知识信息,评估算法)
- 使用算法(转换为应用程序)
6.Python语言特点
优点:
- 可执行伪代码
- 流行
- 清晰简练、易于理解
缺点:
- 运行效率较低
来源:https://www.cnblogs.com/hanxuanfei/p/6797093.html