调包侠如何突围?你需要看清的数据科学行业现状

和自甴很熟 提交于 2019-11-29 02:57:27

点击上方“Datawhale”,选择“星标公众号

第一时间获取价值内容

640?

【导读】作者在面试数据科学家、算法工程师的过程中,钻研出了数据科学行业的真实现状。他发现实际上高学历非常重要,而计算机、工程学、数学和统计都是非常主流的学科。认为与其专注于数据科学家所需要的技能,不如专注于实际上能做什么。

你知道数据科学家这个行业,最热的话题是什么吗?如何快速的赚到热钱

你可能刚刚听说数据科学家、算法工程师这个职业,或者已经从事该行业多年。每当提及“数据科学”这个词的时候,可能总会有一份荣耀在心里面。毕竟这是一个听起来就很高科技的职业,自我介绍的时候会有人投来羡慕的目光。

但数据科学家的竞争正在变得越来越激烈,而数据科学家心中的那份情怀似乎也在逐渐的淡化。取而代之的是焦虑在不断的滋长,而我们却无能为力。

一方面,越来越多的人想入行数据科学家,希望获取名声和利益;另一方面,企业在数据科学家这个岗位上开始有些摇摆,很多公司甚至错误的将数据标注等工作当做是数据科学家。

上述情况,并没有随着人工智能的发展而有所改善。最近。一位名叫Hanif Samad的新加坡的统计学家、软件工程师、数据科学家在找工作的时候有些碰壁,让他开始对数据科学整个行业的现状进行反思。

他发现,在数据科学家最集中的平台Towards Data Science上,有关数据科学最热的文章是《数据科学家如何跟股东相处》,其他的像《如何成为一名数据工程师》、《批量梯度下降与随机梯度下降》、《多类文本分类》、《加速R-CNN》这类特别细分的技巧类文章非常热门。

因为Samad只有一段短暂的数据科学经历,在实际面试的过程中他才意识到,平时看到那些教导你如何成为数据科学家的成功学文章,以及那些技巧类文章,毫无用武之地。空有一身屠龙技,却面临无龙可屠的局面,典型的Daniel Kahneman口中“可用性启发式的受害者”。

所以Samad开始钻研一个问题:那些真正在从事数据科学的人,到底在做什么?到底数据科学这个行业,真正的现状是什么?

作为一名统计学家和数据科学家,Samad通过爬取LinkedIn上的数据,对目前的数据科学行业进行了一次摸底。在分析了近1000个数据科学家档案后,结果还真让他发现了一些很少有人提及的内幕。

发现1:研究生学位是标配

73%目前就业的数据科学家拥有研究生学位。其中硕士学位较多占44%;剩下博士学位29%,学士学位占到了21%。除了全日制大学毕业外,也有部分数据科学家拥有的是MOOC学位或培训班的函授学位,共占总数的6%。

640?wx_fmt=png

计算机科学与工程、以及业务分析是主流

计算机科学,数学和统计学以及工程学科三位一体的共同概念构成了数据科学事业的基石,这在一定程度上得到了数据的证实。

目前看来,就学科而论,计算机科学胜过所有其他学科,拥有绝对的主导地位,占所有研究学科的14%。

但如果把工程学统一看做是一个类别的话,因为其包括了化学,电气和电子学,以及所谓的知识工程等不同学科,这些学科加起来,累计占学科总数的22%。

平时我们都以为,数据科学需要很强的数学和统计学的功底。但实际上,把数学和统计学所有学科包括应用数学,数学物理学,统计学和应用概率都算上,也只占研究学科的12%左右。

但最让人惊讶的其实是业务分析和其他分析学科,总体占了15%,比数学和统计学都高!

其他排名靠前的领域包括物理学(3.5%)和信息技术(2.2%)。

640?wx_fmt=png

招聘数据科学家倾向于有一定经验

虽然很多应届毕业生确实也在竞争数据科学家的岗位,然而样本中数据科学家填写的工作经验大多是4-6年。

640?wx_fmt=png

大多数数据科学家的岗位都是新设置的

76%的数据科学家入行不足两年,而其中42%工作经验不足一年。这表明虽然大多数数据科学的职位空缺都是相对较新的,但是填补空缺的人已经在就业市场上待了一段时间。

640?wx_fmt=png


一半的数据科学家角色来自非技术公司

虽然资金充足,成熟的技术公司(如谷歌或亚马逊)倾向于成为数据科学家聘用的理想场所,但值得注意的是,该样本中近一半(49%)的数据科学家来自非技术公司:金融和保险(11%),咨询(9%),政府(5%),制造业(5%)和学术界(2.4%)的公司和机构。

在技术类别中,具有良好代表性的行业包括运输(8%),企业(8%,包括IBM,SAP和Microsoft),电子商务(5%) 和财务(5%)。

有一大类技术公司作者将其标记为AI&ML(6.5%),包括DataRobot等公司,以及Amaris.AI等新产品。

640?wx_fmt=png

结论

以上,有没有打破你之前对数据科学家这个行业的印象呢?我们可以看到,数据科学家对学位的要求较高,学科方面则是计算机科学,工程,数学或分析专业更吃香。最好是已经有1-2年工作经验的雇员。

值得注意的是,虽然我们看到有6%的人来自MOOC和培训机构等非传统认证的机构,但显然拥有研究生学位才是最保险的。

数据科学正在快速发展,许多最重要的算法和技术将不被传统的学术课程所涵盖。所以除了学位,你还需要一些职业技能之外的能力。

最后,不要被焦虑蒙蔽了双眼。你可能并不需要学习那么多的数据科学技巧,但你应该好好想想,你做这件事情的目的是什么?想要得到的是什么?


640?wx_fmt=other

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!