机器学习笔记-----01绪论
1.1 引言 生活中,我们经常会运用经验做出一些预判,比如小时候看见蚂蚁搬家就会推测即将下雨,晚上星空璀璨的话第二天一般都会阳光普照......这些都是我们人类利用自己的经验来完成的,那么这份工作计算机可以做吗? 机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能,且在计算机系统中,“经验”通常是以“数据”的形式存在的。 机器学习的主要内容,是关于在计算机上从数据中产生“模型(model)”的算法,即学习算法(learning algorithm)。 PS:如果说计算机科学是研究关于“算法”的学问,那么类似的,可以说机器学习是研究“关于算法”的学问。 学习算法的作用: 1.基于提供的经验数据产生 模型 ; 2.面对新情况时, 模型 可提供相应的判断。 模型: 泛指从数据中学得的结果。 学习器: 学习算法在给定数据和参数空间上的实例化。 1997年,Mitchell给出了一个更形象化的定义:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。 1.2 基本术语 数据集(data set):数据记录的集合 示例(instance)/样本(sample):数据集中的每条记录,即关于一个事件或对象的描述(有时整个数据集也称为一个“样本”) 特征向量(feature