大数据这行业,目前鱼龙混杂,啥人都有,本质上是因为它是一个在旧行业基础上硬长出来的新行业。说它旧是因为:数据分析、人工智能这些概念,几十年前就有了,只是碍于运算能力一直跟不上,所以行业发展缓慢。像是数据分析,从Oracle这公司80年代创造出商用SQL后就出现了,数据库和仪表板甚至机器学习(以前叫作:数据挖掘 Data Mining),也都不是很新的概念了,现在职场中不少专家都有相当长久的类似经验。
那最近几年来的大数据热潮又是怎么回事呢?它其实是构建在强大的数据处理能力,比如并行计算、GPU以及云计算这些牛逼的底层架构上发展出来的新技术。它的理念很简单,就是
大力出奇迹!
靠庞大的数据量和运算能力,实现了以前的人想都不敢想的智能奇迹。再加之某些软基础:比如Python这种极其符合人类语言的编程社区日渐庞大,和可视化BI软件的出现(比如:Tableau、Power BI),这才奠定了这波每个人都在畅谈的热浪。
某在BAT的专家朋友点评:虽然很多人说现在这个岗位人才过剩,需求降低,但实际的情况是:称职和优秀的人才一直稀缺!
了解这个历史,进入这个行业学习就清楚多了~
- 首先我们要认清,这个数据行业有非常多的岗位,有数据分析、数据运营、数据工程等等。甚至你还能找到极其传统的搭建 Oracle/SAP 数据库的工作,也可能被HR称做大数据工程师。
- 我们目前只讨论数据分析相关的岗位。很多工程师本质上更像是盖房子的壮汉,只负责把房子盖好,不负责出租和住这个房子。我们现在说的大数据分析工作,指的是住房子的人。
而所有大数据分析相关的工作,说到底,万变不离其宗,你唯一要学也是这个岗位里最重要的技能就是:结合业务/行业知识 解读数据,快速获取有价值的信息。
我把它叫做 Puzzle Solver:解读和解决谜题的人。这个行业里的最优秀的人都有这样的特点。本质上就是个侦探嘛。把不同地方的蛛丝马迹连接在一起,找到凶器,拼接成一幅完整的惊吓到所有人的凶杀案,再掏出手表麻醉老板(误)......
假设你彻底掌握了这个能力,那不管是用手指在沙滩上乱画,还是在云上做并行计算搞深度学习,都没差。当然,很多的时间我们都是在学习使用这些前沿的工具,增加我们的分析效率。
认清楚这个大方针,目前的大数据分析分成了两个核心方向:
- Business Analytics 商业分析:对业务和产品负责,直接通过数据可视化等手段,沟通和改变业务结果
- Data Science 数据科学:捣鼓和处理大量数据,构建数字化的业务系统,自动化,算法模型应用等等。
你要学什么,取决于你想进入哪个方向。在我看来,任何网络上的课程,国内的教育平台设计的内容都没有世界顶级高校设计的硕士项目丰满和完整。于是我们直接参考(bai piao)它们的课程设计,照着学就完事了。
先说商业分析,我们可以先参考下QS世界大学硕士排名:
那我们就参考下世界排名第二的专业吧~ 帝国理工的商业分析硕士,为啥参考第二名呢?因为,这是我就读的专业啊!有个人的亲身感受,比较熟悉!(绝对不是我要为母校打Call什么的,以前在读的时候还经常吐槽呢)
绝对真实准确的课程设计:
必修课
- 数据结构和算法 (Python入门)
- 数据和统计基础(R入门+统计学和微积分、线性代数恶补)
- 数据库基础(SQL入门)
- 统计学和计量经济学(计量经济学恶补)
- 最优化和决策模型(运筹学优化模型入门)
- 机器学习(决策树、KNN等机器学习算法入门)
- 网络科学(图论入门和用Python捣鼓网络Gephi,Gurobi啥的入门)
- 商业分析(商业瞎吹入门)
- 可视化(可视化工具(Tableau, Python)和视觉设计理论入门)
选修课
- 后勤和供应链(更多的计量经济学啥的)
- 医保和医学分析(接触珍贵的病患数据)
- 零售和市场营销分析(接触珍贵的少的可怜的真实零售数据)
- 电子营销(Google Analytics入门(误))
- 进阶版的机器学习(用线性代数和微积分淹没你!)
- 金融大数据(用更多的机器学习模型淹没你!)
- 人力资源分析(爬虫瞎爬学校的教授信息,硬分析一把+简单自然语言处理入门)
- 数据管理和道德(使用云计算Microsoft Azure入门,Mongo DB入门和Spark入门)
第一和第二阶段
第三和第四阶段
大家只要照着这个课程结构,在网上找彻底免费的课程,就能非常系统地轻松入门,不用花50万一年的学费啦~
数据科学专业的在这留个小坑,过两天再讲
*如果有小伙伴对课程具体细节感兴趣,请点赞支持吧!过百赞后我会详细讲讲的~
以上仅是我个人看法,不可能百分百正确,望有识之士多讨论,求真知。 |