学习机器学习必须具备一定的研究基础,应该仔细学习《模式识别与机器学习》,详略难易得当。由于内容选取的少而精,所以作者可以深入浅出的介绍每一种模型,不会因为太过简略而使读者疑惑,同时对于高阶的内容又点到为止,使得整本书的难度保持在了一个对于初学者可以接受的范围内。基本上,当年看这本书时,就是把它当成一个个的tutorial来看。比如在学EM算法的时候,主要就是以这本书的内容为主,配合网上其他资源学习。这一点在学习Graphical model的时候更加明显。众所周知这个领域比较经典的著作是Probabilistic GraphicalModels以及Bayesian Reasoning and Machine Learning,但是这是两本大部头的书,一开始读起来会比较吃力。而本书的作者Bishop本身就是搞Bayesian learning以及graphical model的,PRML这边书用几章的内容就把这个领域最核心的概念以及方法解释了一遍,不得不让人佩服作者的功力。
《模式识别与机器学习》内容选取得当。书中所介绍的所有模型以及算法,放到今天,依然是理解学习ML最最基本的组成部分,这些内容,对于读者了解更高级的算法,几乎都是必不可少的。这本书并没有试图涵盖当时所有的机器学习算法,而是精选了ML里面最本质最fundamental的方法,由此可以看出,作者对于这个领域的驾驭能力还是非常高的,准确的预见到了那些非常有生命力的模型,所以,如果你是一名ML的初学者的话,读这本书,即使过了十年,但是依然不会过时。
《Pattern Recognition and Machine Learning》中文翻译版:《模式识别与机器学习》PDF,476页,带书签目录,文字可以复制。
《Pattern Recognition and Machine Learning》英文PDF,758页,带书签目录,文字可以复制。
《PRML习题答案》完整版PDF,254页,带书签目录,文字可以复制。
配套《PRML源代码》。 配套《PRML学习笔记》。 配套《PRML勘误》。
下载: https://pan.baidu.com/s/1vniJ562spBKkMuyAVvT2mw
提取码: abwf
《模式识别与机器学习》主要内容:第1章的导论。第2章的概率分布,写的非常好,尽管只有几个简单的分布,但是对共轭先验的概念以及指数分布族介绍的很清楚,这一章是本书的基础。第3章以及第4章的线性分类和回归一个非常好的方面就是都是采用Bayesisan的观点来看,应该是理解Baysian思想的基础。第5章 神经网络,深度学习基础。
第6章 Guassian Process,一种非参数的Bayessian方法,统计学领域研究热门。第7章 SVM。第8章 是现代基于图模型的基础,需要仔细阅读,这一章概念介绍的非常清楚,很多的machine learning 和computer vision 的paper现在采用的图模型的表示都可以从这里得到解释。第9章 EM 算法,从最简单的K-mean出发,推导高斯混合模型,再到EM算法的推广,每一节都是精品。第10章 近似推断,第一节的近似推断的基本原理以及第二节的一个例子。采用mean-field 、 变分的方法。第11章采样,写的很精彩。第8章到第11章,学习最基本的Topic model:LDA
第12章是PCA及一些改进,用到的时候再看也来得及。第13章是HMM 模型和LDS,这两个的图模型是一样的。建议好好学习一下HMM,应该还有其他的资料供参考。第14章是整合。
机器学习是计算机科学与人工智能的重要分支领域,认真看了《机器学习》前面9章,基本上对算法原理,优点缺点,适用条件讲得非常清楚,详略得当。
《机器学习》作为机器学习的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免。
《机器学习》PDF,周志华著,443页,带书签目录,文字可以复制。
配套《机器学习》笔记;配套《机器学习》课件;配套《机器学习》习题部分解答及代码。
下载: https://pan.baidu.com/s/1hy7iL8oO3Z0CSG36dOfZqg
提取码: y36q
《机器学习》共16 章,大致分为3 个部分:第1 部分(第1~3 章)介绍机器学习的基础知识;第2 部分(第4~10 章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等.前3章之外的后续各章均相对独立, 读者可根据自己的兴趣和时间情况选择使用. 根据课时情况, 一个学期的本科生课程可考虑讲授前9章或前10章; 研究生课程则不妨使用全书.
书中除第1章外, 每章都给出了十道习题. 有的习题是帮助读者巩固本章学习, 有的是为了引导读者扩展相关知识. 一学期的一般课程可使用这些习题, 再辅以两到三个针对具体数据集的大作业. 带星号的习题则有相当难度, 有些并无现成答案, 谨供富有进取心的读者启发思考.
在学习和研究机器学习的时候,面临令人眼花缭乱的算法,机器学习新手往往会不知所措。从算法和Python 语言实现的角度,认识机器学习。专注于两类核心的“算法族”,即惩罚线性回归和集成方法,并通过代码实例来展示所讨论的算法的使用原则。详细讨论预测模型的两类核心算法、预测模型的构建、惩罚线性回归和集成方法的具体应用和实现。
《Python机器学习—预测分析核心算法》中文PDF+英文PDF+源代码
中文版,338页,带目录和书签,文字能够复制。英文版,361页,带目录和书签,文字能够复制。配套源代码。
下载: https://pan.baidu.com/s/1viZe2cnUdnOX9Js5HAvQbA
提取码: qqm9
机器学习是近年来渐趋热门的一个领域,同时Python 语言经过一段时间的发展也已逐渐成为主流的编程语言之一。《Python机器学习实践指南》结合了机器学习和Python 语言两个热门的领域,通过利用两种核心的机器学习算法来将Python 语言在数据分析方面的优势发挥到极致。
《Python机器学习实践指南》中文PDF,268页,带目录,彩色配图,文字可复制;英文PDF,324页,带目录,彩色配图,文字可复制;配有源代码。
下载: https://pan.baidu.com/s/183L7EG0JPf0ky8B8hx1PUA
提取码: ds6i
共有10 章。第1 章讲解了Python 机器学习的生态系统,剩余9 章介绍了众多与机器学习相关的算法,包括各类分类算法、数据可视化技术、推荐引擎等,主要包括机器学习在公寓、机票、IPO 市场、新闻源、内容推广、股票市场、图像、聊天机器人和推荐引擎等方面的应用。
在如今这个处处以数据驱动的世界中,机器学习正变得越来越大众化。它已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极端随机森林、隐马尔可夫模型、条件随机场、深度神经网络等等。是为想用机器学习算法开发应用程序的Python 程序员准备的。
《Python机器学习经典实例》中文PDF+英文PDF+代码
《Python机器学习经典实例》中文版,270页,带目录书签,文字可复制;英文版,295页,带目录书签,文字可复制;配有源代码。
下载: https://pan.baidu.com/s/1jUrmj187r-peemYoTC0J4A
提取码: uuyb
《Python机器学习经典实例》首先通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。本书是为想用机器学习算法开发应用程序的Python 程序员准备的。它适合Python 初学者阅读,不过熟悉Python 编程方法对体验示例代码大有裨益。
神经网络是计算智能和机器学习的重要分支,在诸多领域都取得了很大的成功。在众多神经网络著作中,影响最为广泛的是Simon Haykin的《神经网络原理》(第3版更名为《神经网络与机器学习》)。结合近年来神经网络和机器学习的最新进展,从理论和实际应用出发,全面、系统地介绍了神经网络的基本模型、方法和技术,并将神经网络和机器学习有机地结合在一起。
《神经网络与机器学习(第3版)》高清英文PDF+中文PDF
下载: https://pan.baidu.com/s/1s3M9o5kV-sckvOOHcQ_HCg
提取码: qe6r
注重对数学分析方法和理论的探讨,而且也非常关注神经网络在模式识别、信号处理以及控制系统等实际工程问题的应用。本书的可读性非常强,对神经网络的基本模型和主要学习理论进行了深入探讨和分析,通过大量的试验报告、例题和习题来帮助读者更好地学习神经网络。
1. 基于随机梯度下降的在线学习算法;小规模和大规模学习问题。2. 核方法,包括支持向量机和表达定理。3. 信息论学习模型,包括连接、独立分量分析(ICA)、一致独立分量分析和信息瓶颈。4. 随机动态规划,包括逼近和神经动态规划。5. 逐次状态估计算法,包括卡尔曼和粒子滤波器。6. 利用逐次状态估计算法训练递归神经网络。7. 富有洞察力的面向计算机的试验。
《实用机器学习》中文PDF+英文PDF+源代码
中文版PDF,223页,带书签目录。英文版PDF,266页,带书签目录。配套源代码。
下载: https://pan.baidu.com/s/1y5CbtC04Qe6H9vYNDgO2pQ
提取码: 7dtk
介绍了实用机器学习的工作流程,主要从实用角度进行了描述,没有数学公式和推导。本书涵盖了数据收集与处理、模型构建、评价和优化、特征的识别、提取和选择技术、高级特征工程、数据可视化技术以及模型的部署和安装,结合3个真实案例全面、详细地介绍了整个机器学习流程,还介绍了机器学习流程的扩展和大数据应用。