机器学习(1)

感情迁移 提交于 2020-01-10 08:56:45

   机器学习是人工智能中不可或缺的一部分,这篇随笔将记录这段时间学习机器学习的几点感悟,希望对以后的学习有所帮助。参考了以下几本书:

  • 《机器学习》-周志华
  • 《机器学习实践》-Peter Harrington

   在这里我也发现了一篇很不错的文章《从机器学习谈起》,生动有趣,可以加深大家对机器学习的认识。

 

第一章 机器学习基础

1.什么是机器学习?

机器学习就是把无序的数据转换成有用的信息。

机器学习方法是计算机利用已有的数据(经验),得出了某种模型,并利用此模型预测未来的一种方法。 

一般来说,数据越多,最后机器学习生成的模型预测的效果越好。

机器学习的过程与人类对历史经验归纳的过程做个比对,如下图:

 

2.关键术语

特征:下图测量的四个属性为特征,也可以成为属性。它们通常是训练样本集的列,他们是独立测量得到的结果,逗哥特征联系在一起共同组成一个训练样本。

分类:机器学习的主要任务。这部分工作可以看成:知识表示。

算法训练:学习如何分类。通常为算法输入大量已分类数据作为算法的训练集

通常建立两套独立的样本集:训练数据和测试数据。

 

 3.机器学习的主要任务

(1)监督学习(知道预测什么):

  • 分类(将数据分到合适的分类)
  • 回归 (用于测试数值型数据)eg:数据拟合曲线

       (2)无监督学习(没有类别信息,也不会给定目标值):

  •  聚类
  •  密度估计(寻找描述数据统计值的过程)

 

 4.如何选择合适的算法

需要考虑两个问题:

(1)使用机器学习算法的目的

(2)需要分析或收集的数据是什么

 

 

 

 5.开发机器学习应用程序的顺序

  • 收集数据(网络爬虫、传感器等)
  • 准备输入数据(数据格式可以使用Python的List、字符串、整数类型)
  • 分析输入数据
  • 训练算法(使用监督或无监督算法)
  • 测试算法(使用上一步学习得到的知识信息,评估算法)
  • 使用算法(转换为应用程序)

 

6.Python语言特点

优点:

  • 可执行伪代码
  • 流行
  • 清晰简练、易于理解

     缺点:

  • 运行效率较低

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!