听说你立志要做数据分析,不如先听听老司机的建议?大数据应用

来源:互联网 / 作者:SKY / 2018-07-02 18:08 / 点击:
世界很大,诱惑很多。对于未来,甚至在工作多年后,他们仍然没有清晰的方向,或者缺乏独立、深度的思考。如果你决心要在数据科学领域有所作为,或者立志做数据分

每年总有很多人,怀揣着对世界的一知半解、满腔似火的热情、还有对美好生活的向往,走出象牙塔,投身社会。

世界很大,诱惑很多。对于未来,甚至在工作多年后,他们仍然没有清晰的方向,或者缺乏独立、深度的思考。

方向很重要,而人生很短暂。往哪里走,怎么走,再怎么也得花点时间思考一下,不是吗?

如果你决心要在数据科学领域有所作为,或者立志做数据分析,这篇文章提了点小建议,希望对你有所帮助。

听说你立志要做数据分析,不如先听听老司机的建议?

一、去大厂还是去小厂?

我们做每件事之前,都要先明确做这件事的目的和意义是什么。

先来问问自己,做数据分析的目的和价值是什么?我的理解是,致力于用数据帮助企业解决业务问题,辅助业务决策。

关于这个问题,你可以花3-5年时间来思考和领悟,不急,但需要想清楚。

你还面临一个抉择,到底是去大厂还是去小厂?

之前接到很多猎头电话,不少都会问:“你是做分析还是做挖掘的呀?”刚开始,也常会和猎头在电话里“理论”一番。后来在大厂待过才明白,大厂分工比较细,分析是偏向经营分析,即取数分析写报告,而挖掘则是建模调参部署等。小厂就不一样了,谈需求、确定思路、指标设计、平台搭建、接入数据、处理数据、建立宽表、模型训练、结果分析、撰写报告、模型部署、报表计算、数据可视化等一整个流程,一个人几乎都可能会参与。

如果有机会,请一定要去大厂历练几年!大厂大多都很开放,常常敢为天下先,敢于引入一些新的东西,包括技术、思维、制度,技术比较先进,优秀的人也很多。

大厂的管理制度也很完善,福利待遇当然会更好些。大厂的数据规模绝对够大,而且应用场景也多,可施展的空间应该会比较大。所以,抱着学习的态度在大厂里混几年,是可以成长很快的。(有好,当然也有不好)大厂流程繁杂,整体效率偏低,提一个取数申请可能需要1-2周。大厂的内部竞争也大,存在于不同项目团队,也存在于同一部门不同成员之间。大项目资源投入大,小项目资源申请很困难,重视程度也不一样。最主要的,大厂分工很明细,不同职位的轮换似乎不大容易,从入职到几年后离开一直做经营分析都是有可能的,容易导致能力的单一,不利于个人综合素质的培养。

相比之下,小厂就灵活多了,人和事都不会很复杂,而且效率也高。小厂可能会优先考虑做这件事情的投入和产出,即看应用效果。(大厂反而愿意给资源去试,短期内不怎么关注投入产出。)所以,在小厂工作,既要学会帮公司赚钱,也要学会帮公司省钱。小厂分工不会很细,大多需要一个人做多种工作。所以,小厂里面的程序员常常身怀多技。但小厂数据规模小,技术实力较弱,团队成员整体素质不高,而且项目流程不大规范,常常怎么简单怎么来,怎么高效怎么来。有些小公司的码农,除了对外发过一两封邮件,平时的沟通几乎是在QQ里,结果待了几年之后连写一封邮件都不会。有些小厂自己没有数据,重要是作为乙方给大企业做项目,这种模式常常受甲方牵制,可发挥的空间很小,而且一个项目周期往往比想象中要长(我本人之前就厌倦做乙方),因此不大建议去这样的公司。

不管大厂还是小厂,在选择时,建议都要看看所要加入的团队。

综合来说,建议先去大厂混几年,再去小厂找个Title高点的职位发挥自己所长。

再来说几句,什么场景下分析,什么场景下挖掘呢?

分析其实是一个很笼统的概念。把当前营业额跟去年同期做对比发现增长了不少,这个也可以认为是分析。分析是从数据中发现问题或规律,并提出合理的建议。分析常常伴随着要写报告,进而要给业务方汇报分析结果。最好是给决策层汇报,因为决策层有拍板的权力,而且对数据结果的感知和可能的应用有自己独到的认知。

如果需要把分析的结果固化下来,定期输出结果,提供给业务方,这个时候就需要开发数据产品了。

挖掘是用算法解决某个具体的复杂问题,用常规分析方法解决不了的,如客户流失预警、商品最优推荐组合、最有投递路线规划等。

所以,我一般认为,分析是从数据中发现问题或规律,而挖掘是其中的一块。

二、1-3年,“所见即所得”,打磨基础技术

在职业生涯的初期,请牢记,“所见即所得,所感即所知,多见即多得,多感即多知”。

不管在大厂还是在小厂,一定要参与到实际项目当中,好好打磨自己的技术。不管是大项目还是小项目,一定要借助来之不易的机会,以极致的工匠精神修炼自身。

你最好能从基础数据处理做起。只有这样,你才能早点知道,数据并不像在学校里做实验用到的数据那样“好”,它可能看起来“又脏又乱”。只有这样,你才能早点知道,给你取数的那个程序员是如何花了2-3天甚至一周时间才把数算好。

如果你精通SQL,那就太好了,这样就可以直接能够在数据平台查看原始的数据了。

最好要看一看最原始的数据长什么样。你不一定能一下子理解这些数据,但你可以慢慢地感受它们,因为它们所投射出来的是最真实的业务场景。

举个例子吧,原始的会员注册信息数据里面,性别一般填“男”、“男性”、“女”、“女性”、“未知”、“其它”等值,但处理好之后的二手数据里面,性别就变成了“男”、“女”、“未知”等三个值了。仅看这三个值,可能会漏掉一些业务场景,填“男”可能是从移动端输入时选择的,填“男性”则可能是手工填写注册表格时勾选上的。而漏掉的这个场景,说不定就是所要找的那个分析点。

你最好还能熟练掌握一两门编程语言,比如当下流行的Python,作为入行的基础技能。(顺便说一下,码农界普遍认为只会SQL的不算真正的程序员~~)

当今A5,编程已经从娃娃开始抓起。早在5年前,英国规定5岁以上儿童必须学习编程课,法国将编程列入初等教育选修课程,美国已有40个州制定政策支持计算机科学,有35个州将计算机科学课程纳入高中毕业学分体系。美国前总统奥巴马就曾在全美发起“编程一小时”的运动,旨在让全美小学生开始学习编程。2017年,浙江、北京、山东等省确定要把Python编程基础纳入信息技术课程和高考的内容体系。编程将是一项很基础的技能,也将是承接其他知识的基石。在未来,会编程很可能跟使用智能手机一样普遍。

阅读延展

1
3