python机器学习基本概念快速入门
//2019.08.01 机器学习基础入门1-2 1、 半监督学习的数据特征在于其数据集一部分带有一定的"标记"和或者"答案",而另一部分数据没有特定的标记 ,而更常见的半监督学习数据集产生的原因是各种原因引起的数据缺失。 2、半监督学习的数据集处理方式大多采用: 先用无监督学习算法对数据进行相关的处理,再利用监督学习算法对其进行模型的训练和预测。 3、增强学习: 它是指根据周围的环境进行相应的行动,然后根据采取行动的结果,学习行动的方式 ,其算法得到整体闭环原理图如下图所示: 图1 4、机器学习算法的其他分类方式: (1)在线学习(online learning)和批量学习(离线学习)(batch learning) (2)参数学习(parametric learning)与非参数学习(nonparametric learning) 5、批量学习算法的整体流程如下图所示: 图2 它的优点在于比较简单,它适应环境变化的方式是:进行定时重新批量学习,不过这种方式也有比较大的缺点就是:每次重新批量学习,其运算量巨大;另外在某些环境变化非常迅速的情况下,其实现是基本不可能的。 6、在线学习:它是指在批量学习的基础上将新的产生的数据集输入到机器学习算法的学习资料中进行实时的训练和迭代优化,从而及时地适应环境的变化,其具体原理图如下: 图3 它的优点在于能够及时地反映新的环境的变化