高端大气的“数据科学家”,竟然成了离职率最高的职位之一大数据应用

来源:互联网 / 作者:SKY / 2018-04-11 15:03 / 点击:
每一份工作都很有趣。但是做到优秀却很难,因为这不仅关于技术本身,也关乎职场的复杂性。本文作者Jonny Brooks-Bartlett在“Here’s why so many data scientis

每一份工作都很有趣。但是做到优秀却很难,因为这不仅关于技术本身,也关乎职场的复杂性。本文作者Jonny Brooks-Bartlett在“Here’s why so many data scientists are leaving their jobs”一文中讲述了数据科学家遭遇挫败的4大原因。

是的,我就是一名数据科学家。但是,你读的这个标题也没错。总需要有人来说出这些话。我们已经读到过许多关于数据科学的故事,比如“这是21世纪最迷人的工作”以及“作为数据科学家你能赚到一大笔钱”之类,这让这份工作看起来简直完美。由于这个领域里有众多高技能人才,他们会努力解决那些复杂的问题(是得,这对于“极客”来说是一件积极的事情),所以没有任何道理不热爱这份工作。

但是事实上,正如英国《金融时报》的这篇文章中所指出的那样,数据科学家每周通常会“花费1-2个小时寻找新工作”。此外,这篇文章还指出,“在开发者中说自己正在找一份新工作的比例在机器学习专家中名列前茅,为14.3%。数据科学家紧随其后,为13.2%”。以上数据是基于Stack Overflow对于64000位开发人员的调查所得出。

我同样也身处在这个岗位上,而且最近刚换了一份工作。

为什么有如此之多的数据科学家在寻找新工作?

在回答这个问题之前,我需要说明一点,我仍然是一名数据科学家。总体而言,我热爱这个职业,而且也不想阻止别人成为数据科学家,因为它充满着趣味、刺激和回报。但是这篇文章的目的是作为消极指导者而做出,为的是揭露这份职业的消极一面。

在我看来,数据科学家对自己工作的不满意之处体现在下面四个方面。

1. 期望值与现实不符

高端大气的“数据科学家”,竟然成了离职率最高的职位之一

大数据如同青少年的性行为:每个人都在谈论它,没有人真正知道如何去做,每个人都以为别人都这么做,所以每个人都声称自己正在做……—丹·艾瑞里

这个比喻很恰当。许多我所认识的初级数据科学家(包括我在内)之所以进入数据科学领域是因为它能够用新的机器学习算法解决复杂问题,从而对商业产生巨大影响。这会让我们觉得自己所从事的工作比我们之前做的任何事情都要重要。然而,事实往往并非如此。

在我看来,期望值与现实不符是许多数据科学家离开的根本原因。原因众多但是我没有办法提供一个详尽列表,而这篇文章所谈及之处是我实际上遇到的某些情况。

每个公司的情况各有不同之处,因此我的意见不能代表所有公司的情况。但是有许多公司雇佣数据科学家,但是却没有能从人工智能技术中获取价值的基础设施。这就导致了人工智能的遇冷遭遇。与此同时,这些公司在雇佣初级数据从业者之前没有聘请资深或是有经验的数据人员,这又为彼此的失望与不愉快埋下伏笔。数据科学家可能通过编写机器学习算法来增加分析洞察,但是他们并不能这么做,因为他们的第一份工作往往是整理数据基础结构或是创建分析报告。公司只是需要一张他们每天可以在董事会会议上进行展示的图表。之后,公司并不能从促使其快速行动中看到足够的价值。而以上的一切导致数据科学家对于自己的角色感到不满。

罗伯特·张在他给初级数据科学家的建议的博客文章中给出了一个很有见地的引用:

对于我们的抱负与此刻身处关键路途的环境的一致性进行评估非常重要。找到那些最适合你的关键路途的项目、团队与公司。

这就突出了雇主与数据科学家之间的双向关系。如果公司并不处于正确位置上,或者是与数据科学家的目标不一致,那么对于数据科学家来说找一份新工作只是时间问题。

胡书宾有一个关于分析团队如何按愿望创建的系列,我觉得说的很有见地。

另一个原因让数据科学家感到失望的原因与我对学术界的幻灭有相似之处:我认为自己有能力对人们产生影响,这种影响不仅仅局限在公司内部。事实上,如果这家公司的核心业务并不在机器学习(我的上一任雇主是一家媒体出版公司),那么你所从事的数据行业只能带来小幅增长获益。这会产生一个非常重要的事情,或者是你会十分幸运的撞上一个金矿项目,但是这并不常见。

2. 政治统治最高原则

关于政治议题已经有一篇精彩文章:数据科学中最困难的一件事:政治,我希望你能读一读。这篇文章的前几句话基本上概括了我想说的。

当我早上6点起床去学习支持向量机时,我想:“这真的是太难了。但是,嘿,至少我会为未来的老板带来价值。”如果我拥有DeLorean时光车,我就会回到过去,然后冲自己大喊“笨蛋”。

如果你真的认为了解许多机器学习算法知识会让你成为最有价值的数据科学家,那么看看上文中我提到的第一点:期望值与现实不符。

事实是,那些商业中最有影响力的人需要对你有一个良好的印象。这可能意味着你必须经常做一些特别的工作,比如从数据库中提取数据,并在合适的时间给到合适的人,做一些简单的项目,以便让正确的人对你有一个好印象。我的上一份工作必须做许多类似的事情。但是让人沮丧的是,这是工作中必不可少的一部分。

3. 你对数据“全然”了解

而谈到做正确的事取悦正确的人这件事,那些拥有巨大影响力的人往往不理解“数据科学家”的含义。这意味着你将是分析专家,同时也是做报告的人,更不要忘记你也将成为一个数据库专家。

不仅仅是那些非技术高管对你所拥有的技能有太多假设。其他技术同事也会假定你了解所有关于数据的事情。你是了解Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP,任何关于机器学习,以及你能想到的其他相关数据的事情。顺便说一句,如果你看到一份工作明细上写了所有上面提到的东西,请保持理智。这表明,这家公司对于自己的数据策略是什么一无所知,以及他们雇佣相关人员是因为他们以为自己雇佣了一个可以解决所有数据问题的数据工作者。

但是事情并不仅仅止于此。因为你了解所有的一切,显然你可以处理所有访问的数据,那么你就应该能够解决所有的问题。

试着告诉人们你真正知道的以及真正掌握的东西,但是做到这件事相当有困难。这并不是因为人们会认为你的能力不行,而且作为一名没有多少行业经验的初级数据科学家来说,你会担心人们对你的想法会变少。这真的是一个两难困境。

4. 在一个孤立团队中工作

阅读延展

1
3