机器学习系列1:线性回归
写在前面:机器学习主要分为监督学习、无监督学习和强化学习。本节内容主要针对监督学习下的线性回归进行简要说明及实现。机器学习开篇模型就是线性回归,简言之就是用一条直线较为准确的描述数据之间的关系,当出现新的数据的时候的时候,给出一个简单的预测值。 一、回归问题 回归问题是监督学习的一个重要问题,回归用于预测输入变量(自变量)和输出变量(因变量)之间的关系,特别的当输入变量的值发生变化时,输出变量的值随之发生改变。回归模型正是表示输入变量到输出变量之间映射的函数。 回归按照输入变量的个数,分为 一元回归 和 多元回归 ; 回归按照输入变量和输出变量的关系类型,分为 线性回归 和 非线性回归 。 回归问题分为学习和预测两个过程,首先给定一个训练数据集: T={(x 1 ,y 1 ),(x 2 ,y 2 ),...,(x N ,y N )} 这里xi€R n 是输入,y€R是对应的输出,i=1,2,...,N. 二、线性回归 假定:模型假定服从线性关系,即 y = ax+b or y = a 1 x 1 +a 2 x 2 +...+a N x N 输出为离散的就是分类,输出为连续值就是回归,而我们初中学过的直线方程就是线性的。所以线性回归就是用线性的线来拟合一些回归的值。 损失函数:常用的是平方损失 平方损失即欧氏距离