AI入门指南

本小妞迷上赌 提交于 2019-12-08 11:24:44

笔者公众号:技术杂学铺

笔者网站:mwhitelab.com

最近笔者身边越来越多,无论是不是计算机专业的人,都开始接触人工智能了。

笔者有一年多的AI自学经验,学过几门课程、看过几本书、参加过一些比赛项目,在这里做一个AI入门大全,希望可以解决萌新不知从何入门的难题。

1. 学什么?机器学习还是深度学习

笔者曾在何为AI中,介绍了人工智能,机器学习和深度学习的区别。

人工智能、机器学习、深度学习的逻辑关系图

总的来说,机器学习是人工智能的一种实现方法,深度学习是机器学习的一个分支。

不过当我们平时谈及机器学习和深度学习的时候,我们常常用机器学习指传统的统计学习方法,而深度学习指使用神经网络的方法。

1.1 机器学习

机器学习是用统计学的方法,来实现数据预测、分类等问题。

常见的使用场景有:商品推荐,个人信用评估,量化金融,医疗、交通领域大数据等等

常用的算法有:线性回归,SVM,朴素贝叶斯,决策树,模型集成等等。

经典机器学习算法表

机器学习很数学,很统计学。当你学习朴素贝叶斯、SVM这样的机器学习经典算法的时候就会理解数学的重要性。

除此之外,机器学习还需要有对数据有很强的敏感度。尤其是当你参加和机器学习有关的比赛和项目的时候,在做清洗数据、特征工程的时候,对数据的分析尤为重要。

有一句流传很广的话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。可见对数据敏感是很重要的能力。

1.2 深度学习

深度学习是用神经网络的方法,来解决计算机视觉,自然语言处理等问题。

常见的使用场景有:人脸识别,文本识别,文本翻译,语音转文本,客服机器人等等。

最基本的模型分类有:CNN,RNN等。

目前大部分萌新都是从深度学习开始入门。读者若是不知从机器学习还是深度学习学起的话,笔者建议先学深度学习。

在Coursera上可以找到大量AI课程

深度学习需要数据量远远大于传统的机器学习,常常是用来解决视觉或语言方面的问题

除此了用统计学和神经网络这两个主流的人工智能实现方法,还有强化学习。不过这对新人来说直接入门过难,还是不要考虑了。

至于要从机器学习还是深度学习开始入门,就要看个人的需求了。

2. 机器学习入门指南

机器学习主流语言为python/R/matlab。常用的python库有pandas,sklearn和matplotlib。

2.1 机器学习算法入门

视频可看吴恩达的machine learning课程

笔者当时是看书籍入门的。推荐《统计学习方法》、《机器学习实战》、《机器学习》(俗称西瓜书)。

耐心看完《统计学习方法》和《机器学习实战》前80%的部分就可以开始比赛了。

2.2 机器学习实战建议

记住,学会算法和应用算法是两回事!

在学习算法时我们会学习线性回归,SVM,决策树等等。但真正做项目的时候,我们面对的问题会复杂很多。

也许数据有残缺,有错误,我们需要清洗数据(使用pandas)

获得了合格的数据后,我们需要查看数据的分布(使用matplotlib等绘图工具),做特征工程,提取特征。

获得了特征后,我们可以应用机器学习算法了(使用sklearn机器学习算法库)

sklearn机器学习库

应用算法后,我们还需要评估我们的算法效果如何,要用到准确率、召回率、F1等等指标。同时还要考虑模型有没有过拟合。

在获得了模型的各类指标后,我们需要不断调整模型,提高模型的效果。可能会需要模型集成、重新筛选特征……

这一系列步骤需要大量的实战练习,仅仅知道几个经典的机器学习算法是远远不够的。推荐去kaggle阿里天池上做些和数据挖掘的比赛。

3. 深度学习入门指南

深度学习目前主流为python,主流框架为tensorflow和pytorch。

视频课程推荐吴恩达的DeepLearning课程,课程内容十分详细。五门大课,从基础知识、卷积网络、RNN网络、项目实现等多个角度,循序渐进讲解深度学习入门的方方面面,同时有配套的练习代码。

网易和其有合作,在网易云课堂上有中文字幕的视频。英语不好的同学可以直接在这里上学习就行了。

吴恩达的Deeplearning课程

DeepLearning课程资料

深度学习进阶内容

《深度学习》和其作者之一 Ian Goodfellow

学习完后可根据个人的需求,选择指定领域深入学习。

书目建议购买《深度学习》,俗称花书。(电子版: 
 英文原版 | 中文版 )

同时,建议读者逛一逛kaggle阿里天池,做些与深度学习相关的比赛。

4. 学习建议

4.1 网上两千块的人工智能专业课值得学吗?

曾有朋友向我吐槽,目前人工智能最大的赚钱项目就是开付费课程教其他人人工智能。

的确,网络上以某云课堂和某学城为代表的平台提供的人工智能专业课,宣称为专业从业人士指导,往届学员多数入职大公司。至于课程价格,则在2000+。

某平台的高额付费课程

笔者认为,买这类课程完全没必要!

网络上免费的优质课程质量并不差。笔者自学数月后,看其付费课程所提供的教学大纲,感觉自己可以讲授绝大部分内容。

至于付费课程宣传的一起做实战项目,读者平时逛逛kaggle和阿里天池,实战项目不愁做。

还有那宣传的“便捷的在线项目实战平台”,完全就是在线的jupyter,读者按着笔者以前写过的python环境安装教程,就可以在自己电脑上配置一个运行环境。

4.2 作为学生,AI入门差不多了该做什么

可去 kaggle阿里天池上做一下新手比赛,如kaggle上的Titanic(机器学习)或者Digit Recognizer(深度学习)。在暑假的时候欢迎报名Deecamp

kaggle比赛网站

若参加了一些比赛且实力不错,可以直接向今日头条等公司投递实习简历。在假期的时候在AI公司实习两个月,无论是对实力还是以后的出路,都是很有帮助的。

4.3 学会了可以做什么?

机器学习可以在金融公司、保险公司等充满数据且数据信息很复杂的领域做数据挖掘,即找出数据之间潜在的有价值的关系。

而深度学习则可进入相关领域的大公司或创业公司,从事图像识别、自然语言处理等领域的问题。

各大公司都开始推出自己的AI服务

4.4 学习资料大全

更多学习资料可见:人工智能学习清单

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!