这个问题,我们从小到大看三个链条。
第一是数据加工链条。
从逻辑上看,数据挖掘是包含数据开发的。在真正的挖掘过程中,数据开发占的比重非常大,经常是一边处理数据一边寻找规律。
更关键的是,挖掘是会指导数据开发的。你要用什么挖掘模型,就需要选择对应的数据加工方法。所以,如果做挖掘的人自己不处理数据,那等到要用的数据已经加工好了,那还差一个“挖掘”的人么?而且做数据挖掘的人,很可能会拿着更高的薪资做数据开发的工作。这对用人单位来说太不合算了。
第二是企业决策链条。
挖掘是干啥的?找规律,发现问题。那挖完了就要拍板开干呀!但目前有多少企业能“发自内心”地做数据驱动呢?真的不多,业务经验在决策中还是占主导地位的。看看Growth Hacking就好了。在原本的定义中,打破常规的Hacking过程很重要,但在各种宣传和培训中却很少被提及。大谈特谈的都是所谓的成熟方法论和经典案例,以及抓人眼球的Growth成果。
再看看公司里常用的所谓业务报表,那些指标体系是凭经验提出的,还是凭数据挖掘提出的?很可能90%以上是凭业务经验提出的。有没有“美化”就不好说了。
这种情况对数据挖掘的人就比较不利了。我们举个极端的例子:假设你挖掘的结果是自己所在的部门或业务应该被裁撤,把钱投给更有希望的业务,你会怎么做?你是选择换个模型,还是改数据呢?抱歉,根据上个链条的分析,不管选哪个,这都是“数据开发”的工作了。
第三是人才培养链条。
数据挖掘在人们心中是典型的知识密集型,而数据开发经常被当做劳动密集型。所以不管是学生时代的课堂,还是校外培训班,都是培养“数据挖掘人才”的,而很少有专门培养“数据开发人才”的。大家在工作中也都喜欢顶个更好的title。没什么好避讳的,我也不例外。
但是,根据链条一,数据开发非常重要啊!于是一个源于认知偏差、受到人才培养市场推动的供需不平衡就产生了。而根据链条二,对于企业里的决策者来说,挖掘岗在一些领域确实有特殊贡献,比如AB实验、广告投放、个性化推荐等,但也并不是总能发挥价值。比如在一些例行的、常规的业务场景中,如果做挖掘的同学本身不是特别懂,那很可能反而干不过经验主义。
于是,决策者凭着自己的经验,很可能会觉得“我已经具备决策的全部工具,只缺人往里填数据”。这个时候,会开发数据的人,显然比会用数据的人更重要呀!如果这个决策者还是个思维活跃的人,经常蹦出一些想法而又没有足够的人手帮他提取数据,那还得了?!“快去多找一些人呀!会写SQL的!” 抱歉,这还是数据开发的工作。 |