相信在这个时代的当下,大家或多或少都有看到过类似“数据科学是21世纪最性感工作”的故事,以及数据科学家在这个时代显得是一份十分理想且具有超强吸金能力的工作。因为这个领域需要大量高技能人才,他们需要寻求解决复杂问题的办法(这对于“极客”来说是一件很有吸引力的好事)。总之,大家的描述都让这份工作在技术人的眼中显得十分梦幻、可爱。
但事实是,正如英国《金融时报》在这篇文章中所说,数据科学家通常“每周花1-2小时寻找新工作”。此外,文章还指出,“机器学习专家在说他们正在寻找一份新工作的开发人员中排名第一,占14.3%。数据科学家紧随其后,占13.2%,“这些数据是在他们对64000名开发者的调查中通过堆栈溢出的方法收集的。
作为数据科学从业人员,我也一直有着这样的状态和想法。
那么为什么有这么多数据科学家在寻找新的工作呢?
在回答这个问题之前,我应该澄清一点,我仍然是一名数据科学家。总的来说,我很喜欢这份工作,我不想让其他人不想成为数据科学家,因为这份工作真的是有趣的、刺激的和有意义的。本文的目的是扮演一个魔鬼的倡导者并袒露这项工作的一些消极方面。
从我的角度来看,许多数据科学家对他们的工作不满意主要有以下4个原因:
1.期望与现实不符
Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it… — Dan Ariely
这句话非常贴切。我所知道的许多初级数据科学家(包括我自己)都想进入数据科学领域,因为它是一种通过酷炫的机器学习算法来解决复杂问题的方法,这些算法对业务将会产生巨大的影响。这是一个让我们觉得我们所做的工作比以前做过的任何事都重要的机会。但是,现实往往与我们想象的相去甚远。
在我看来,期望与现实不符是许多数据科学家选择离开这个领域的最终原因。
每个公司都有所不同,所以我不能代表所有的公司,但许多公司雇用数据科学家但却没有适当的基础设施来支持从AI中获取价值。这有助于AI中的冷启动问题。再加上这些公司在雇用应届生之前没有聘请资深/经验丰富的数据从业者这一事实,这也是导致双方都失望和不满的原因之一。数据科学家可能是希望来编写智能机器学习算法来提高洞察力的,但实际工作中却无法做到这一点,因为他们的第一项工作是整理数据基础架构和/或创建分析报告。相比之下,公司只想要一张他们每天可以在董事会会议上出现的图表。
Robert Chang在他的博客文章中给出了一个对于年轻数据科学家非常有见地的建议:
重要的是要评估我们的愿望与我们所处环境的关键路径是否一致。寻找那些关键路径与你最为一致的项目、团队和公司。
这突出了雇主和数据科学家之间的双向关系。如果公司的位置不匹配,或者与数据科学家的目标不一致,那么数据科学家跳槽真的只是时间问题。
数据科学家们幻想破灭的另一个原因就是:我相信我做的事情能够对这个世界产生影响,而不仅仅是在公司内部。实际上,如果公司的核心业务不是机器学习(我以前的雇主是媒体出版公司),那么你所做的数据科学很可能只能提供少量的增量收益。那种你做的事情是一个项目中非常重要、不可获取的一部分,或者你可能很幸运地遇到了一个非常棒的项目的机会的情况并不常见。
2、公司需求占主导地位
如果你认真地认为知道很多机器学习算法将使你成为最有价值的数据科学家,那么回到我的第一点:期望与现实不符。
事实上,如果希望公司老板或业界专业人士对你有一个好印象,这可能意味着你必须经常做一些特别的工作。比如从数据库中获取数据,以便在正确的时间提供给合适的人员,做一些简单的项目。在我以前的地方,我不得不这么做。尽管这话说出来令人沮丧,但这是工作的必要部分。
3、你什么都知道
为了让老板们满意,数据科学家们不得不什么都做。因为对于老板和同事而言,他们真的对于“数据科学家”究竟是做什么的,完全没有概念。他们认为你就是做数据分析,并且把这些分析结果以报告形式呈现给老板的人。
不仅仅是非技术人员对你的技能做了太多的假设。其他技术领域的同事也将会认为你知道所有与数据相关的事情。比如他们觉得你应该是熟悉Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B测试、NLP等等任何你能想到的机器学习的技能的(以及任何你能想到的其他相关数据——顺便说一句,如果你看到一个包含所有这些内容的工作要求,请你清醒点!因为这意味着这份工作要求来自一家不知道自己的数据策略是什么的公司,他们会雇佣任何人,因为他们认为雇佣任何数据人员都能解决他们所有的数据问题)。
这样的臆断还没有结束!你的老板和同事们不仅认为你知道所有的数据算法,同时还有你还应该可以得到所有公司内外的数据,通过……emmm,我相信作为数据工作者的你,应该5分钟前在你的邮箱中看到过类似的要求。
试图去告诉每个人你能做的和正在做的事情其实是很难的。这并不是因为有人会真的看不起你,而是因为作为一个缺乏行业经验的初级数据科学家,你会担心大家看不起你。这其实挺矛盾的。
4、在一个独立的团队中工作
当我们看到成功的数据产品时,我们经常会看到专业设计的具有智能功能的用户界面,其中最重要的是,它会有一个有价值的输出,让用户感知到我们为他解决了一个问题。而如今,如果一个数据科学家只把时间花在学习如何编写和执行机器学习算法上,那么在一个能够成功地开发出一个有价值产品的团队中,他们就只能是其中最基础和底层的部分(尽管是必要的)。
尽管如此,许多公司仍然拥有数据科学团队,他们会提出自己的项目并编写代码来尝试解决问题。在某些情况下,这就足够了。例如,如果所需要的只是一个每季度生成一次的静态电子表格,那么这些行为可以提供一些价值。另一方面,如果目标是在定制的网站构建产品中优化提供智能建议,那么这将涉及许多不同的技能,这是绝大多数数据科学家不应该奢望的(只有真正的数据科学独角兽才能解决这个问题)。因此,如果这个项目是由一个独立的数据科学团队承担的,那么它很可能会失败(或者需要很长时间,因为在大型企业中组织独立的团队从事协作项目并不容易)。
因此,要成为行业中拔尖的数据科学家,仅仅在Kaggle竞赛中取得好成绩并完成一些在线课程是不够的。幸运/不幸的是,(这取决于您如何看待它),它涉及到理解企业中的制度规则和一些工作环境上的软技能。在寻找一份能满足你需求的数据科学工作时,找到一家与你的职业规划路径一致的公司应该是一个关键目标。然而,你可能仍然需要重新调整对数据科学角色的期望。
原文链接:https://towardsdatascience.com/why-so-many-data-scientists-are-leaving-their-jobs-a1f0329d7ea4
以上信息来源于网络,由“京东云开发者社区”公众号编辑整理,不代表京东云立场。