统计学习三要素
统计学习方法都是由模型、策略和算法构成的,即统计学习方法由三要素构成,可以简单地表示为: 方法=模型+策略+算法 非监督学习、强化学习也同样拥有这三要素。构建一种统计学习方法就是确定具体的统计学习三要素。 1.模型 统计学习首要考虑的问题是学习什么样的模型。在监督学习过程中,模型就是所要学习的条件概率分布或决策函数。模型的假设空间(hypothesis space)包含所有可能的条件概率分布或决策函数。例如,假设决策函数是输入变量的线性函数,那么模型的假设空间就是所有这些线性函数构成的函数集合。假设空间中的模型一般有无穷多个。 假设空间用F表示,假设空间可以定义为决策函数的集合F={f|Y=f(x)},其中,X和Y是定义在输入空间x和输出空间y上的变量。这时y通常是由一个参数向量决定的函数族。参数向量取值于n维欧氏空间Rn,称为参数空间(parameter space)。假设空间也可以定义为条件概率的集合,其中,X和Y是定义在输入空间x和输出空间y上的随机变量。 这时通常是由一个参数向量决定的条件概率分布族, 参数向量取值于n维欧氏空间Rn,也称为参数空间。 一般由决策函数表示的模型为非概率模型,由条件概率表示的模型为概率模型。 2.策略 有了模型的假设空间,统计学习接着需要考虑的是按照什么样的准则学习或选择最优的模型