损失函数

北城余情 提交于 2020-01-17 08:56:59

loss function

损失函数 loss function:是针对于单个样本而言的,是指一个样本的误差。

代价函数 cost function:是定义在整个训练数据集上的,是所有单个样本和损失的平均,

目标函数 object function:是指最中要优化的函数,一般而言是经验风险+结构风险(也就是代价函数+正则化项)

其中下面的解释yy代表真实的值,f(x)f(x)代表模型得出的值

loss function

(1),0-1损失函数

L(y,f(x))={1y = f(x)0y != f(x)L(y,f(x))=\begin{cases} 1& \text{y = f(x)}\\ 0& \text{y != f(x)} \end{cases}

(2),平方损失函数

L(y,f(x))=[yf(x)]2L(y,f(x)) = [y-f(x)]^2

(3),绝对值损失函数

L(y,f(x))=yf(x)L(y,f(x)) = |y - f(x)|

(4),对数损失函数

L(y,p(yx))=logp(yx)L(y,p(y|x)) = -\log p(y|x)

该损失函数用了极大似然估计的思想,

(5),合页损失函数

L(w,b)=max{0,1yf(x)}L(w,b) = \max\{ 0 , 1-yf(x)\}

尤其是SVM,其中$y = +1 y = -1时,f(x) = wx+b$

(6),Huber损失

Lϵ(y,f(x))={12(yf(x))2|y-f(x)|<ϵϵyf(x)12ϵ2otherL_{\epsilon}(y,f(x)) = \begin{cases} \frac{1}{2}(y-f(x))^2 & \text{|y-f(x)|<}\epsilon \\ \epsilon |y - f(x)| -\frac{1}{2}\epsilon^2 & \text{other} \end{cases}

cost function

(1),均方误差函数(Mean Squared Error)MSE

MSE=1Ni=1N(y(i)f(x(i))2MSE = \frac{1}{N} \sum_{i=1}^{N}(y^{(i)} - f(x^{(i)})^2

(2),均方根误差

RMSE=1Ni=1N(y(i)f(x(i))RMSE = \sqrt{\frac{1}{N} \sum_{i=1}^{N}(y^{(i)} - f(x^{(i)})}

(3),平均绝对误差

MAE=1Ni=1Ny(i)f(x(i)MAE = \frac{1}{N} \sum_{i=1}^{N}|y^{(i)} - f(x^{(i)}|

(4),交叉熵代价函数

H(p,q)=i=1Np(xi)logq(xi)H(p,q) = -\sum_{i=1}^{N}p(x^i)\log q(x^{-i})

交叉熵代价函数是用来评估当前训练到的模型的概率分布与真实分布的差异情况,减少交叉熵代价就是在提高模型的正确率

例如:对于二分类问题的交叉熵代价函数可表示为:

L(w,b)=1Ni=1N((yilogf(xi))+(1yi)(log(1f(xi))L(w,b) = -\frac{1}{N} \sum_{i=1}^{N}((y^i\log f(x^i)) + (1 - y^i)(\log (1- f(x^i))

其中f(x)f(x)可以是sigmoid函数,yi{0,1}y^i\in \{0,1\},通常作为分类问题的代价函数

object function

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!