机器学习(一)

不羁岁月 提交于 2020-01-04 08:40:03

       机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。主要研究计算机怎样模拟或实现人类的学习行为,以获取新的知识和技能,重新组织已有的知识结构,不断的改善自身的性能。

       机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。这些算法是一类能从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。简而言之,机器学习主要以数据为基础,通过大数据本身,运用计算机自我学习来寻找数据本身的规律,而这是机器学习与统计分析的基本区别。

       机器学习主要有三种方式:监督学习,无监督学习与半监督学习

(1)监督学习:通过一堆训练数据(含有特征及标签的数据)推导一个函数,当新的数据输入时,可以根据函数预测该数据对应的标签。监督学习的训练集要求是包括输入和输出,也就是特征和目标。如今机器学习已固有的监督学习算法有可以进行分类的,eg:贝叶斯分类,SVM,ID3,C4.5以及分类决策树,以及现在人工神经网络:BP神经网络,RBF神经网络,Hopfield神经网络、深度信念网络和卷积神经网络等。人工神经网络是模拟人大脑的思考方式来进行分析,在人工神经网络中有显层,隐层以及输出层,而每一层都会有神经元,神经元的状态或开启或关闭,这取决于大数据。同样监督机器学习算法也可以作回归,最常用是逻辑回归。

(2)无监督学习:与有监督学习相比,无监督学习的训练集的标签是未知的,且要学习的类的个数或集合可能事先不知道。常见的无监督学习算法包括聚类和关联,eg:K均值法、Apriori算法。

(3)半监督学习:介于监督学习和无监督学习之间,eg:EM算法。

      如今的机器学习领域主要的研究工作在三个方面进行:1)面向任务的研究,研究和分析改进一组预定任务的执行性能的学习系统;2)认知模型,研究人类学习过程并进行计算模拟;3)理论的分析,从理论的层面探索可能的算法和独立的应用领域算法。

    机器学习已经有了十分广泛的应用,eg:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、证券市场分析等。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!