机器学习介绍

瘦欲@ 提交于 2020-01-09 20:50:06

1. 监督学习(supervised learning):

给定输入样本集,机器可以从中推演出指定目标的可能结果。
一般采用两种类型的目标变量:标称型和数值型。
- 标称型:标称型目标变量的结果只有在有限目标集中取值,如真与假,动物分类集合
{爬行类,鱼类, 哺乳类,两栖类}
- 数值型:数值型目标变量可以在无限数值集合中取值,如 0.001、
42.001、 1000.743 等。数 值型目标变量主要用于回归分析。

2. 无监督学习:数据没有类别信息,不会给定目标值。
- 聚类:无监督学习中,将数据集合分成由类似对象组成的多个类的过程
- 密度估计:将寻找数据统计值的过程称为密度估计

 

机器学习基础
------------

1. 概念:何为机器学习,将无序的数据转换成有用的信息
2. 数据获取:譬如可以在人们手机上装app,通过许多手机的磁力计得到信息
3. 术语:
- 专家系统
- 属性/特征
- 分类
- 目标变量(类别)
- 训练数据和测试数据

4. 任务:
1. 监督学习(知道预测什么,即目标变量的分类信息)
- 分类:将实例数据划分到合适的分类中,譬如数据拟合曲线
- 回归:主要用于预测数值型数据

2. 无监督学习(数据无类别信息,不给目标值)
- 聚类:数据集合分成类似对象组成的集合
- 密度估计:寻找数据统计值的过程
- 无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形展示数据

5. 开发步骤
1. 收集数据
2. 准备输入数据
3. 分析输入数据
4. 训练算法
5. 测试算法
6. 使用算法

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!