003 机器学习中的基础知识
有些知识还是记录下来比较容易复习。 懂原理, 会使用平台,使用语言实现常见算法。 1.大纲 机器学习的基本概念 机器学习的实质 机器学习方法的三要素 经验风险与结构风险 常见损失函数 一:基本概念 1.机器学习的方法流程 用监督学习为例 首先,有一个输入数据,然后根据这个输入数据做一些特征的加工和整理,基于特征进行模型的训练,去建模,然后做模型评估,得到一个可以接受的模型,然后对模型就行部署,使用模型对业务进行应用。 定期更新模型,对模型生命周期进行维护。 2.输入空间与输出空间 输入空间(input space):将输入的所有可能取值的集合称作输入空间 输出空间(output space):将输出的所有可能取值的集合作为输出空间 输入空间与输出空间可以是有限元素的集合,也可以是欧式空间 输出空间与输出空间可以是连续值的集合,也可以是离散集合 输入空间与输出空间可以是同一个空间 通常,输出空间比输入空间小 3.特征空间 特征:每个输入实例的各个部分称为原始特征,基于特征还可以扩展出衍生特征 特征向量:多个特征组合的集合 特征空间:将特征向量存在的空间称为特征空间 特征空间每一维都对应一个特性 特征空间可以与输入空间相同,也可以不同 需要将实例从输入空间映射到特征空间