为什么国家将加快人工智能研究生培养?又为什么很多研究生评论人工智能是个大坑呢?

[复制链接]
lingli125 发表于 2023-7-29 23:39:32|来自:北京 | 显示全部楼层 |阅读模式
为什么国家将加快人工智能研究生培养?又为什么很多研究生评论人工智能是个大坑呢?
全部回复5 显示全部楼层
lygcss 发表于 2023-7-29 23:39:44|来自:北京 | 显示全部楼层
先发一个2020年3月16日看到朋友圈一位朋友的发的他们公司的算法岗招聘截图,是BAT中的一家,具体哪家,为保护隐私就不说了。211毕业的都不要了,可见搞CV算法的人是有多少了。



BAT某家算法岗位招聘

AI是一门技术,本身是有一定技术含量的(CV方向技术含量稍微低一些),但是也没有想象中的那么高大上。智能制造、社会智能化发展也是趋势。但是现在的应届生算法岗位竞争可以说是非常激烈了,主要是做这个的人太多了。
因为现在是全民转AI,大概率以后机器学习,尤其是深度学习,成为很多程序员的既有技能,就像动态规划、操作系统这些技能和知识似的。但是毕竟算法岗位就这么多,所以可能以后做后端开发、前端开发、数据库开发的工程师,在学校都搞过机器学习算法,成功的让机器学习称为必备技能了。
我写了很多对这个行业的思考,以及对应届生的建议,这里就不重复造轮子了,贴一些我的其他相关回答或者文章吧。
关于AI就业和方向选择:
元峰:都2020年了,在校学生还值得继续转行搞AI吗人工智能就业前景越来越严峻了,你还在坚持吗?关于AI科研方向:
如今深度学习支撑下的人工智能退潮趋势已现,CV博士研究还有哪些方面可做?关于对旷视检测组负责人离职的一些感想:
如何看待旷视 detection 组组长俞刚跳槽腾讯 PCG 光影研究室?关于我国人工智能公司的发展前景看法:
元峰:2020年代,中国AI创业公司将走向何方关于应届生offer选择,是选择大公司还是AI创业公司:
元峰:应届算法岗,选择巨头还是AI明星创业公司再次表达一下我的观点,AI是技术,虽然目前还是比较“光鲜”,但是长期看,AI公司,还是要回归到做产品,或者是成为解决方案供应商,关于人工智能创业公司的耀眼光环,应该会逐渐回归到它本来的科技公司的地位。
最后,我最近正在AI领域创业,如果有在校学生,对深度学习算法,或者前端、后端比较熟练的,欢迎私信我,欢迎有实习意向,或者想一起合伙创业的的朋友骚扰我。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
pennyhe 发表于 2023-7-29 23:40:31|来自:北京 | 显示全部楼层
这个问题需要分两个方面回答:
一、为什么国家将加快人工智能研究生培养?

因为人工智能未来的前景确实广阔。但人工智能其实是一个比较大的概念,这个大口袋可以包进来太多的行业。
现在各行各业,只要能让机器自动地做点事情,就都算人工智能。自动驾驶算人工智能、自然语言处理算人工智能、商品推荐算人工智能、机器人行业算人工智能,做芯片的也算人共智能。就连本次疫情中,开展流行病学和溯源调查也可以说用到了人工智能技术。
就拿我的经历还说,我本科是自动化专业,读研期间研究视频的多目标追踪(读到后边学院也直接改成了人工智能学院),毕业有幸进入某大型金融企业做大数据分析,在我本科的时候,当时还没怎么听过人工智能这个词,当工作之后一回头,发现明明是三个不怎么相关的专业领域,最后都被包裹在人工智能这个行业里,自己从始至终都成了人工智能行业从业者,你说神奇不神奇?
人工智能其实分为三层:
一是运算智能,即快速计算和记忆存储能力。这种智能说白了你手里的这个叫做手机的玩意就已经具备了。不行,你和他比比背圆周率或者算数?

二是感知智能,即视觉、听觉、触觉等感知能力。计算机视觉、自动翻译、自然语言处理均算。这是这波人工智能浪潮下提升最大的一个领域。机器在感知智能方面已越来越接近甚至超越人类。

三是认知智能。通俗讲是“能理解会思考”。人类有语言,才有概念,才有推理,所以概念、意识、观念等都是人类认知智能的表现。机器目前还不具备这种,就算会下围棋的alphago,也是根据棋局规则和大量高手棋局对战数据来模拟概率的,对于AlphaGo来说,他本身并不理解你们人类天天逼着我看这些黑白格子到底在干什么。(甚至他能产生这个疑惑也就牛*了)

当前人工智能领域,虽说没有达到第三层的终极形态,但是第二层的境界已经实现了好多领域的落地开花。
我举几个常见的例子:
1、高铁的人脸识别
现在乘坐火车高铁,坐在窗口检票的小姐姐不见了,取而代之的,都是直接刷身份证,然后人脸比对。很多潜逃多年的逃犯千算万算,竟然都在这些人脸识别机器上现了形。不仅是高铁,现在公共场所的摄像头也都有人工智能算法监控,张学友演唱会被抓的逃犯就是这个例子。
2、b站的弹幕
经常刷B站的小伙伴可能会发现,B站有个【智能防挡弹幕】功能,很多弹幕在飘到画面主要人物那儿的时候,会自动“跑到”人物后边。这个其实也是用到了人工智能。还有现在的视频直接美颜等。有时候,科技就是这么潜移默化地进入人们的生活的。
3、智能外呼机器人/智能客服助手
你可能会发现,现在你接到的好多电话都是机器人打来的,还有当你尝试打客服电话的时候,各大互联网公司、银行、通信商首先接待你的客服一定是机器人小助手。
4、APP里的拍照自动识别身份证和银行卡号。
现在上传身份证照片,银行卡信息等APP,都已经引入了这个功能。
5、拍照翻译/OCR识别
这个技术现在已经很成熟了。
6、支付宝(银行)的信用卡反欺诈平台。
现在很多诈骗交易等都是由机器智能监测的,有兴趣可以去看看《智造将来》这个综艺中,支付宝和诈骗团伙惊心动魄的“攻防战”。
7、电商平台的智能推荐系统。(甚至大数据杀熟)
8、抖音/今日头条
字节系产品就是靠AI智能推荐起家的,这个我不用多说吧。
9、当前疫情下的“健康码”
本质上也是通过大数据技术,根据你的行程等信息推断你的患病风险。
(以后想到什么也会持续更新……)
二、为什么很多研究生评论人工智能是个大坑呢?

1、未来人工智能入行门槛不低。
这个可以参考金融行业。在金融行业中,求职者中大多需要985、211起步。清北复交浙一大堆。而且需要大量的实习经历。这是为什么呢?原因很简单。一方面这个行业赚钱呀!涌进来的人就多。另一方面,这个行业是用钱来赚钱的呀!空有巴菲特的能力,没有巴菲特的资本也没啥用啊!所以涌进来的这些人,公司就需要通过设置学历等各种条件筛选。
类比到人工智能行业。这行业前景也非常广阔呀!大量的人嗅到了这波风口涌了过来。但这个行业现在有的是封装好的成熟算法。门槛在哪里?在数据和算力上啊!这本质上又都可以转化成钱。资本实力雄厚的公司。可以有钱购买更多gpu服务器,有能力获得更多的数据。甚至说他本身运营过程中就会产生很多有价值的数据。一个刚成立两三个月的小公司。有毛个数据让你分析,建模?所以未来人工智能的主要资源必然会集中在少数几个巨头公司。而这些巨头需求岗位有限。那也必须用学历和学校来筛选啦。
在这里也大胆预测一下,作为一个重资产行业:中国的人工智能应用前沿大概掌控在腾讯、阿里、美团、百度以及各大国企手中,现在的所谓的商汤科技、旷视科技等AI独角兽,除非找得到好的盈利点,否则大概率会消失或者被以上几家并购。马化腾一个人开发一款QICQ然后缔造互联网神话的将不复存在。欢迎三五年之后各位来考古,看看这个说法是否正确。
另外多提一句,在互联网时代利用业余时间单枪匹马开发一款软件,实现财务自由的案例,在人工智能时代大概率将不复存在。
2、现阶段人工智能的培养体系还处于初级阶段,“自学成才”者居多
试问现在正在读现在正在读相关专业的研究生,或者已经毕业的研究生们,有几个不是看了吴恩达的机器学习和深度学习的课程就算是入了门。从gayhub上copy别人的代码跑一跑,调调参,就算是有了实践经验。甚至很多实验室的老师之前都没有接触过人工智能领域,而且大多数老师都没有时间去看吴恩达的人工智能课程,也就是说理论水平甚至还不如你呢,还指导个毛线?
计算机行业可以通过培训机构的培训来速成。好多培训机构的老师也是现学现卖,有的甚至就是看了本西瓜书就可以出来教课、毫无实践经验,建议各位想报班的同学,先丢过去一个表情包。


3、现在有一定泡沫成分,“算法工程师”饱和
从2016年的那场世纪围棋大战开始。各媒体就热捧人工智能,再加上很多编程教育机构也看到了新的割韭菜途径,最后人工智能这个名字人家也争气啊,看着这个名字就像是看到了未来,就会让大家热血沸腾。于是人工智能这个词就被捧上了天。
甚至有的公司也加入了炒作概念的大军,但凡能沾点边的都算人工智能。比如智能洗衣机、智能台灯,都说用到了人工智能技术,你智能个屁啊,不就是个几十年前的单片机嘛。
于是整个媒体和广告都出现了人工智能这个字眼。360行,行行转AI。大量毕业生涌入这个行业,是个工科生就说自己是搞AI的,这必然需求饱和啊。
这些人中,有些甚至连基本的编程能力都没有,代码全靠抄,能力和岗位需求严重不匹配。
再说了,各位大哥们,都忘了做人工智能是干啥的了?是来代替人工的,是为企业主压缩成本的。目前每个领域好用的人工智能算法也就是那么几个。哪个企业会需要这么多处理数据、调参员呢?做开发的可以一直开发新功能,修复bug,算法工程师达到数据和算法极限之后,很难进一步提升模型精度,无法给企业进一步创造价值,兔死狗烹,他们可能一转头,发现自己也是可以被自己亲手缔造的AI模型替代的。


当然,我在标题算法工程师上加了引号,也就是说,真正的算法工程师还是供不应求的。就算达不到如吴恩达、何凯明、李飞飞等大牛水平,能真真实实地改进和优化当前算法,而不是只会调包调参的人才,未来也一定会是各公司争抢的对象。

最后,给还有机会选择高考毕业生们提点建议:

1、人工智能专业刚刚诞生,就像是一支潜力股,不确定性大,但是预期收益也高,如果你确实喜欢在这个领域,可以赌一把。当然,选定了这个专业不意味着你就可以在未来的路上一马平川,任何行业,能吃到最大红利的,是行业内10%之前的人才。
2、如果分数不够211以上,以后也不想读研读博深造,而恰好你读这个专业只是为了跟风,就别往这个坑跳了,到时候呼啦啦一百多个学校的人工智能专业毕业生涌入就业市场,你能竞争的过他们吗?老老实实选个计算机专业,毕业学点code技能,也比这个专业好太多。就算实在想读,也要多了解了解开设这个专业的目标院校人工智能的外壳上套着什么方向,因为不同院校的培养方向必定千差万别。同样是人工智能专业,可能学的东西完全不一样。
3、我国对人工智能本科生的培养,必定是宽口径的培养模式,国家是照着往全能的方向培养的。但是理想很丰满,现实很骨感。事实可能是:你被培养成了全不才。哪个都懂点,但到了就业,什么都干不了。这种感觉,当前很多专业的毕业生都懂【误入所谓宽口径专业的请在评论区举个手,报出你的专业】。如果你能进入人工智能专业,一定要记住:夯实基础的同时,也要尽快选定自己的方向,努力点亮自己在该方向的技能树。你绝对不可能精通所有人工智能的领域,但是只要专精了一个小的方向技能,就可以够你吃一辈子。

<hr/>觉得有用,三连再走哦~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
flzt120 发表于 2023-7-29 23:40:47|来自:北京 | 显示全部楼层
老生常谈。
1.本硕211以上。
2.导师是百篇优博以上级别的(这点有些人有疑惑,其实不是说非要百篇优博。四青,长江,杰青,fellow,院士等等更大的帽子,或者各省的江河湖海学者,只不过这些title理论上都比百篇难度高,这两年刚搞的博新计划其实也ok,不过拿博新的大多本来就在大课题组里当小老板,同理其实还有ccf优博,微软学者奖学金,谷歌奖学金,百度奖学金的获得者,都可以当做一个指标来看。),且近三年有五篇以上顶会或者trans发表。
3.有一作/学生一作/共同一作的c类以上会议/期刊,ps:access不算,可能会是减分项。
4.c类以上会议的比赛前六,kaggle比赛前六,国内某些水赛前3。(有3或者5的时候,其实4可以被覆盖,因为比赛存在抱大腿情况)
5.bat,tmd,商汤旷视等等叫得出名字的公司实习经历。
6.刷过leetcode,最差也得把剑指offer所有题都能做。
ps:最好方向热门,检测,分割,跟踪,检索,细粒度分类,vslam等等,你搞个隐写检测,暗水印之类的小方向真的很蛋疼。
以上要求满足3点,至少能捞个白菜offer,满足5点以上,可以去试试大厂sp和ssp了。连3点都满足不了,不建议入行。
李强 发表于 2023-7-29 23:41:01|来自:北京 | 显示全部楼层
2019 年 3 月,教育部批准了35所高校新增人工智能本科专业,这是人工智能第一次大规模成为独立学科走到人们面前。2019年第一批开设人工智能专业高校名单如下:



很明显可以看出第一批的35所高校里边,双一流高校占了绝大部分,而且基本上都是传统优势工科专业的高校。
那么我们再看本次2020年3月这批开始人工智能专业的100多所高校名单如下:


一堆师范大学/学院纷纷加入了此名单,我等吃瓜群众表示人工智能可以和教育结合,简称人工教育,似乎也能说得通哈。
一堆民族大学/学院也纷纷加入了此名单,我等吃瓜群众表示少数民族事业不能落后,我国的民族政策是开放平等的,怎么能不让民族大学/学院发展人工智能事业呢?
若干旅游学院,城市学院,纺织大学,中医药大学也纷纷加入了此名单,我等吃瓜群众表示既然师范大学/学院和民族大学/学院都能发展人工智能,俺们当然也可以啊。
好了,我承认我编不下去了。我不得不承认一点:在高校的眼中 人工智能是个筐,什么都可以往里边装。
其实在2019年第一批人工智能专业成立后,我个人还是持一个比较乐观的态度。虽然说我相信2019年第一批的里边的高校大多数也就是把自己学校以前的计算机,自动化,机器人等相关专业七拼八凑一下,然后冠上一个人工智能的名头。但是最起码第一批的高校里的计算机,自动化,机器人这些和人工智能息息相关的专业的实力还是比较强的。虽然是换汤不换药的再组合一下,起码原本的师资力量是有保证的,而且很多高校老师也是从事人工智能相关研究的。
那么2020年这个名单,诚然里边依然有少部分优质的传统工科类和综合类大学,具备着开设好人工智能专业的资质。但是很遗憾仅仅是少部分而已,勉强十分之一吧,剩下的大部分压根就不具备开设人工智能专业的资质。why? 人工智能是典型的交叉学科,涉及数学、计算机科学等不同领域的知识,在目前的高校中做人工智能相关研究的人员基本大部分是分散在 计算机,自动化,机器人等学院,如果一所高校在上面几个传统专业都很弱鸡的话,那么这所学校未必能有足够的师资支撑起人工智能这样交叉专业的系统培养。
回顾历史我们发现类似的事情出现过无数次了,2009年计算机专业就业率排名倒数后几名,没错你没看错就是那个现在在知乎人见人爱的计算机。why? 因为当时基本上全国大多数高校都开设了计算机专业,而计算机在10几年前也算得上是新生事物,所有高校都盯上了这块肥肉,不管自己学校有没有师资能力开设计算机专业都去拉大旗扯虎皮的硬上。其结果显而易见造成计算机专业整体就业率很低。除了供需关系外,个人感觉决定因素在于 这些学校根本就无法培养出一个合格的计算机专业毕业生,而传统计算机强校的毕业生并没有受影响。像电子商务,物联网等专业也都有过类似的历史。
这么多高校涌入人工智能专业的目的也很明显,一是新学科成立必然意味着政府资金的投入和政策的扶持,二是 大家都知道人工智能火啊,更加容易招(hu)生(you),话说现在再拿电子商务和物联网来忽悠可能很多童鞋都不上当了。
总结一下,归根结底我不反对发展人工智能,也不反对人工智能研究生的培养,我依然看好传统优质工科院校的人工智能专业未来的前景肯定不错。我反对的是压根没有能力培养人工智能的人才偏偏要借这个风口来忽悠的人。
海浪涌起之时,看不清谁在浑水摸鱼,大浪淘沙之后,方知谁在裸泳。
最后希望同学们在选择专业上能够脚踏实地,结合自身情况去考虑,切不可头脑发热,毫不犹豫地冲着人工智能四个字就去了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
gxl0412 发表于 2023-7-29 23:41:27|来自:北京 | 显示全部楼层
又是一年高考季啊,人工智能专业更火了,有时间我再分享下新的一年一些感悟和思考。
2020年底了,一下子又过了差不多一年,人工智能在2021年将会有哪些新机会呢,我想谈谈我的想法。
1、联邦学习的多方安全计算,以及联邦学习+区块链
中国 2017 年起实施的《中华人民共和国网络安全法》和《中华人民共和国民法总则》中也指出 “网络运营者不得泄露、篡改、毁坏其收集的个人信息,并且与第三方进行数据交易时需确保拟定的合同明确约定拟交易数据的范围和数据保护义务。”当前的数据保护政策,多方企业的数据联合已经完全不可能,联邦学习的提出就非常有意义了。联邦学习(Federated Learning)是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算节点之间开展高效率的机器学习的一种新兴人工智能基础技术,可以保障数据安全和交换、训练效率前提下进行有效的机器学习。如果能通过引入先进的联邦学习技术,充分发挥联邦学习的跨行业模型共享能力,并将AI模型上链,结合联盟链去中心化、开放、防篡改、匿名、可追溯的关键特性,打造构思奇巧又智慧共赢的共享智能引擎系统,在运营商、本地生活、视频内容、交通出行等多行业数据的支撑下,实现精确的营销识别,并推荐最佳产品权益,让区块链+联邦学习成为智慧零售的引擎、智脑,肯定价值很大,尤其适用区块链(联盟链)解决联邦学习需要联邦中心节点,审计有风险且麻烦的问题,如:
(1)数据对齐,在模型开始训练之前,各参与方需要共享加密后的用户id数据,同步给其他参与方进行id对齐,数据对齐无需上链。
(2)模型训练,联邦参与方进行数据特征提取和本地模型训练,模型参数通过区块链上链服务进行数据上链,经过区块链平台的智能合约判断,并通过区块链共识算法后,生成新的区块。其他参与方的区块消费服务检测发现新区块的生成,获取到区块数据后进行自己模型的参数迭代优化,更新参数,直到所有联邦参与方均达到模型预设收敛条件。
(3)模型推理,任何合作伙伴发起模型推理请求,区块服务进行数据上链,智能合约及共识算法进行数据验证并生成区块,其他参与方监测新区块生成,判断推理请求是否与自身相关,进行共同推理解密,请求方获得最终模型推理结果,返回业务系统。
联邦学习一定是2021年最关键的人工智能技术方向,是知识图谱后新的热点。
2、认知图谱、事件图谱等新知识图谱增加认知理解能力
知识图谱可以认为是知识库的语义网络结构,做推荐,做查询都可以。在2020年初之后,以阿里巴巴为代表出现了若干新应用,比如alicoco,电商认知网络,将知识图谱进行层次化构建,包括原子层,概念层,分类体系等,以原子解释概念,用概念代表场景,帮助语义输入内容实现意图扩展和关联推荐。2021年的知识图谱重点关注语义认知的过程,以自然语言理解的概念提取、核心语义提取、NLG等和知识图谱的网络化知识相结合,实现语义推理,不一定能提升推荐准确率,但肯定能增强意图扩展和可解释性。这一块的代表产品是阿里小蜜,小蜜这个团队和达摩院合作产出很多成果,在AICUG社区有专门的分享专题,确实理念先进,明年我们也会重点构建认知图谱,增强语义搜索的解释性。
百度的事件知识图谱也不错,通过不同事件节点的信息提取,自动生成时序性的概要和解释文本,以事件驱动推荐,自动生成文本或者视频,很适合做语义简单但是频率很高的场景做信息推荐。
3、语音情感分析及文本挖掘
智能语音是个老方向,受困于数据隐私等问题一直没有技术突破,可以进一步研究面向运营商热线语音的深度情感分析系统,通过构建业务实体识别及客户问题概念识别模型,支持对用户情感变化原因输出判断依据,非常适合全网语音情感分析、满意度监控场景,应用推广前景好。课题重点聚焦语义理解及客户认知。语音情感分析系统的核心能力包括:篇章段落分析功能、多模态的语音情感分类功能、深度情感分析功能。篇章段落分析功能,针对10086语音转写的非结构化文本进行语义解析,提取重点句、核心词、情感,智能生成长文本摘要,并将整体沟通过程划分为多个段落,每个段落生成精细化标签,减轻运营人员听取录音的压力,提升运营效率。智能语音情感及文本情感分析,在各个服务提升领域都可以用,这块也是阿里做的好,阿里达摩院宋双永做了基于文本的情感识别,技术先进。
2021年的人工智能,肯定是场景驱动技术的人工智能,现有需求,然后多种或者传统或者新的技术融合,实现需求。但技术方案,联邦学习、可解释知识图谱,肯定是需要进一步研究的,区块链+AI也会继续发展,其实之前都是AI解决区块链的问题,现在是区块链赋能AI了。
--------------------------------------分割线---------------------------------------------
没想到这个话题反响这么强烈,结合研究生刚刚复试完毕正在选专业,也欢迎各位新的硕士博士来讨论自己的发展方向,在哪个人工智能行业赋能,在哪个细分领域发展。
(1)人工智能产业/学界都需要的是能独立规划人工智能赋能垂直行业解决方案的人才
当前,在AI,5G,大数据等新一代信息技术快速发展也同时极度渴望回归盈利本质的当下,寻找垂直行业里AI的赋能机会是最最重要的。工业领域的应用是一大爆点,医疗、教育、交通、城市管理都是,巨大的机遇蕴含在“新基建”里,通过大规划边缘-云协同的数据中心建设,人工智能平台建设,提升国家的整体信息治理能力,是当下最切实可行的。在产业赋能的过程中,到底什么特质是最重要的,不是算法和模型,而是对产业的理解,对赋能行业的精准理解和判断,能在产业需求基础上做出最佳规划解决方案的人,是这个行业中最值钱的人,这种人可以叫做人工智能解决方案专家,或者应用架构师,是对一种行业做出端到端赋能方案的总体牵头人。举个例子,如果要用知识图谱做一套智能工单处理系统,相信懂知识图谱构建、推荐算法、实体&关系提取、语义挖掘等方法的人很多,开源模型也多,可能乍一看没有什么特别的。但是在不同领域的工单处理场景是完全不同的,一个流程中不同角色的节点需要也不同,有的希望降低投诉量,有的希望提升效率,有的要提升自动化来降本增效,场景中可能涉及到阅读理解引擎的长文提取,可能涉及知识图谱构建智能回复模板,可能涉及实体精确提取和海量知识的快速检索,当然也需要BERT+LSTM+CRF等混合模型甚至相关性分析的问法解析和语义理解,但是最最关键的是能将场景按照流程和角色梳理清楚,代入到流程中思考,了解每一个角色的需求并匹配解决方案,并将所有技术方案整合为中台架构,形成以统一AI架构驱动全场景赋能的系统,这才有落地意义。我们回过头来看,懂业务懂产品,懂流程穿越和代入式思考,懂架构规划,懂多算法模型融合,懂底层AI技术的人才,就是在这个时代活的最好的人才,这个人,是确保项目得以存在,得以发展,得以成果的关键人才。
(2)人工智能时代,有独立思考意识且比别人看得远的人,会过得越来越好
人工智能时代,无论学界还是产业界,都被一种狂热的思潮裹挟着,没有时间停下来思考,一直在追热点追概念追项目,跑啊跑啊,在历史大潮中随波逐流。可是我们在经过算法模型快速开源近乎"炼丹”模式的洗礼后,是不是应该看一看,我们未来在哪里。无论是处于何种身份,都应该有独立思考的意识,这个在学界是非常常见的,毕竟作为博士,必须在所处专业做到顶尖,有一无二,前沿性前瞻性的要求无须讳言。在不断向前走的时候,我们也要思考,目前做的项目成果、方案,AI的价值如何体现,技术壁垒如何,是否可以快速适应多种场景。比如,多关注数据的价值,多关注高质量数据的获取,处理和整合,在数据层面多做优化,而不是一定要在算法模型上进行调参、调变量、改架构,现在往往价值就藏在大数据里面。并不是所有人都做AI,AI就是政治正确的,最适合自己的,要独立的思考:目前我所做的方向是否和AI交叉能更容易的落地和推广;AI和我们的数据融合后新出现了哪些价值,这些价值是否不一定以算法形式来突出,可以以数据解决方案方式突出;AI技术引入后如何规划中台,以中台方式更好地为各种场景和垂直行业赋能,降低数据获取和特征工程的重复,提升模型的复用度及泛化能力;我所引入的AI技术真的可以确保收益大于成本吗,是否能真正地落地推广或者有生命力。所有的思考都是对自身的审视,这种审视只能自己来做,并在关键时刻敢于做出和别人不同的选择,无论是学界的博士、博士后对自己课题的判断,还是工业界切实希望引入新技术来提升产品效益,都需要反思和独立思考,在大潮中环顾四周,作出决断。
(3)后AI时代,我们去往何处
这也是我深深困扰的课题,在目前这个后AI时代,我们将走向何方。量子计算/量子通信吗,概念性还是太强,基本没有变现落地的成功案例,技术门槛过高导致准入困难,距离普通大众理解太远的技术也是很难发展的。区块链吗,通过去中心化的信用体系建立,动摇美元等传统金融体系的货币信用基准制度,扩大国家金融话语权,这个方向是很好但是和从业者距离较远。图神经网络、VSLAM、AutoML、神经网络可解释性?还是类脑计算、脑科学?我也不知道,这些我都不怎么懂,后AI时代,我们立刻开始思考了,资本、人才、资源项目要走向何方?
-----------分割线-----------
值此破650赞的机会,将几轮回复整理下,梳理内在逻辑,希望成为一篇综述性短文。
作者介绍:电子科学与技术博士(智能信息处理方向),浙大信息与通信工程博士后(计算机视觉方向),主要研究方向包括计算机视觉、智能驾驶(SLAM、路径规划)以及自然语言理解(知识图谱)。高级工程师,技术专家,曾主持人脸识别、活体检测、人体姿态估计、SLAM巡逻车、电气设备缺陷检测等方向的多个人工智能产品及项目。
一、人工智能发展背景
人工智能是一个很大很大的范畴,基本等于将早期的机器学习+逻辑数学+计算机图形学+声学+语义理解+智能信息处理+机器人学做了一个大杂烩,范畴远大于物联网,它的存在不仅是太宽了,也太深了。
目前人工智能方向中行业应用最广泛的是计算机视觉(CV),包括人脸识别,物体识别,目标检测,目标跟踪,图像理解,视频智能信息处理,甚至VSALM都是这个范畴,包括基础的CNN、RL、RNN等,也有专用框架YOLO,Faster-RCNN等,需要非常强的图像处理基础,学过图像的都知道,图像的基础有多复杂吧,计算机视觉的识别,检测,分类以及海量图像的标注和训练也是很难的。应用主要有智慧城市中的行人、车辆监控,安全监控,智慧医疗的医疗影像智能识别,安防的人脸、物体识别和鉴权,很多业务推荐场景的无感式身份识别等,目前商汤,旷视,依图及腾讯优图,大华,海康,都做的非常深入,也是目前AI落地最彻底,应用最广泛,也潜力挖掘最深入的方向。
另外自然语言理解也是非常重要的方向,智能应答机器人,智能客服,语音识别及生成,投诉智能处理都需要NLP的能力,在谷歌的BERT模型彻底爆发后,今年开始NLP重新成为研究热点,在很多人机交互,人机协同的领域应用起来,但是自然语言理解天然有应用短板,就是场景不如CV多。CV有智能驾驶、业务推荐、安防等实在的场景,NLP只有文本处理和智能应答等典型场景,范围窄而复杂度高。
知识图谱是一个独立的方向,也就是知识库的图数据呈现,是一种语义网络。将千变万化的实体用关系串联起来,可以在知识库海量文本中挖掘语义,做阅读理解,关键词提取,进而推动智能应答机器人无监督的自学习,提升交流能力。在业务推荐算法中,基于链路预测和知识推理的预测方案,也更有解释性,推荐逻辑可以图形化,因此也是很重要的方向,未来2年AI将属于知识图谱。
其他还有很多,如SLAM用在智能驾驶和巡检机器人,AutoML在数据挖掘和样本标注方面潜力巨大,RL,GAN等都有特殊的应用方向。
人工智能行业级发展分三个时期(个人见解),1970年-2012年,人工智能作为一个古老的科学线条,存在已久,核心思路就是基于仿生学的数学推理,传统的概率、统计、分析乃至智能信息处理、神经网络、决策等,都是人工智能的组成,这个阶段更具体说是传统机器学习时期,这个阶段人工智能约等于控制+统计分析学+数据挖掘+计算机科学,在中国大学里一直就存在这么一个分支,各类智能的学术期刊也都几十年历史。第二个阶段,2012年-2019年,AI三巨头在深度学习方面的新架构改变了一切,尤其是几个重要比赛,当数据量足够大时(imagenet,coco等图像数据集形成),随着GPU算力提升,深度神经网络以反向传播方式引爆了分类、识别等图像领域,CNN加持下各种目标检测框架如yolo,ssd,RCNN家族不断的改进和出现,RL在2016年的阿尔法狗与李世石的对战中也横空出世,真正实现一定意义上的环境感知和自主决策,在2018年计算机视觉实现顶峰,人脸识别准确率大家都上99.5%,物体识别,人体姿态估计,三维视觉重建等均实现应用。进入2019年,视觉主导的人工智能应用的疲态显露了,2016年GAN之后没有现象级框架出现,RCNN改造到尽头也无法继续提升识别精度,商汤旷视依图等视觉独角兽也遭遇数据获取困难和变现困难。但是一个方向在悄悄崛起,那就是知识图谱助力的自然语言处理,这是一个比CV更古老的方向,2018年谷歌BERT模型的出现颠覆了LSTM+CRF的模式,真正实现注意力机制驱动的长文理解且标注量降低,实体和关系识别精度大幅提升,知识图谱在海量电商、物流、外卖领域实现关系推理和商品推荐,成为目前AI最耀眼的方向。第三个阶段,2020年之后,人工智能已经事实上无法在基础理论有重要创新,资本等不及变现回报在逐渐转移,融资困难,接盘难找,高泡沫的产业无法养活这么多算法人员、教授、博士,在缩减岗位甚至砍掉产品线,AI进入事实上的拐点,那种PPT融资的盛况不见。下一个阶段,AI必须主动和5G、AICDE等融合,尤其是产业主导下的赋能水平,决定行业的生存,要回归盈利的本源,这一点李开复在2019年就提出过,非常敏锐。
目前,很遗憾,有人工才有智能。
二、人工智能产业发展
由于工作的原因,也做了一些AI方向的独特产品,有人脸识别、活体检测,有人体姿态估计,有SLAM巡逻车,有智能应答系统,取得了一定成绩,很杂,比较泛泛,毕竟我是工业界的人,主要是找资源和找项目。比如做过人脸识别的AR智能眼镜,通过AR眼镜的摄像机实现走动式无感人脸识别,将客户画像和推荐信息投射到眼前的反射式显示屏,算是头戴式外设+AI的结合。也做过基于知识图谱和多轮对话的智能应答机器人,在本领域内从海量文本中挖掘故障原因、故障描述和解决方案,引入了阅读理解引擎、BERT等模型实现无监督的实体抽取和关系识别,帮助机器人从海量文本中自学习核心语义。也做过智能巡检机器人(云化机器人),通过购买一些新科技公司得到SLAM智能巡逻车(EAI smart),在上层部署热成像摄像头,人脸识别摄像头,以及5G无线cpe,在上位机外接人工智能超算平台来实现视觉AI的处理,多器件合作实现自动巡检+智能检测,在工业场景里进行激光slam自动定位、制图、导航,并和云平台结合实现物体缺陷检测。
通过做项目,感觉人工智能还是大有所为,但是要找准自己的定位,那就是“赋能”。AI是对传统产业和垂直行业赋能的,纯粹的算法、模型、框架,并不是产品,必须是AI赋能的解决方案,才有生命力,AI要保持对赋能的行业的敬畏,要有服务心态。
(1)做产品要面向场景,产品是解决方案,而不是算法模型。
在AI大火的2016-2017年,这是算法不断迭代、各种模型的识别精度快速提升的时期,那个时期更重视指标、数据、竞赛、论文,泡沫就是那个时期迅速吹大,一些顶尖学者、博士进入行业后就能获得大量融资,待遇也炒作很高,当然也有非常多的杰出人才作出巨大贡献,如贾扬清、何凯明等,但是普通的从业者更多是浮躁地追求算法创新和指标提升,没有好好沉淀下来研究被赋能的产业特性,毕竟算法落地后才产生价值,赋能的产品如何获得更大的价值被很少注意到,行业在飞速前进过程中缺乏思考。但是进入2018年以来,纯粹的AI公司在落地和商用过程中困难逐渐增大,比如安防领域,无论是政府还是大型企业,很少会采用纯算法公司提供的模型,去和另外的合作商进行对接,实现监控、识别、分类、跟踪,往往都要求是一个整体的解决方案,也就是硬件、网络、云平台、边缘计算设备及各个模块匹配的AI模型,作为整体方案进行输出,连模型所依托的数据都要自己进行采集和标注,在这种情况下,本行业传统巨头如海康、大华优势就很大,不但有性能优异的摄像机硬件这款核心资源,在其基础上集成GPU芯片并在开源模型基础上训练自己的个性化模型,又对需求方的行业要求非常了解,用AI进一步巩固了自己的领导地位。这很好理解,算法和模型只有在场景下落地才有意义,场景是一切业务的基础,单纯做能力而不能独自实现场景应用,那势必不被青睐,不仅安防,包括智慧城市,智慧交通,智慧工业等场景下,都是传统行业内巨头利用AI巩固了自己的地位,AI是实现产业赋能基础上的融合。
(2)在一个好的人工智能产品中,到底核心壁垒是什么。
最近我也在用知识图谱做垂直行业的业务推荐,其实机器学习很多推荐算法已经成熟运用很久了,如协同过滤等,知识图谱并不能增加推荐准确率,只能对推荐结果进行解释,并基于长链路挖掘隐含的语义,产品本身落地性不强,过于理论。如果这套知识图谱推荐系统落地,需要大数据系统提供实时地每一名用户的浏览记录,订购记录,对海量日志进行实时处理和分析,形成AI可导入模型的加工数据,这个过程是非常麻烦的,而人工智能仅实现了RDF三元组生成并存到Neo4j里,实现链路预测和知识推理,形成推荐结果数据表,然后还需要业务系统将结果倒走,利用接口对外赋能。这套系统中Neo4j数据库、链路预测算法和知识推理算法等都是开源或者比较简单的,这算核心壁垒吗,当然不是,然而最大的工作是底层的大数据实时处理部分,这个产品的价值主要是数据质量和数据获取难度。如果要将这套AI系统迁移到另一个场景,我能要求对端必须提供合理的数据才能启动AI引擎吗,显然很难,对数据和对接方过于苛刻的要求只能造成产品无法落地,那么AI的价值还大吗,只是数据的价值大而已,所以目前我也经常在想,有这么多高价值的数据,最简单的机器学习算法就能得到优秀结果,所谓的人工智能算法创新还有多少壁垒呢,自己心知肚明。
(3)在别人疯狂时我冷静,在别人冷静时我疯狂
人工智能行业,目前准入门槛是很低的,开源模型普及度之高,已经处于所有计算机领域的最高程度,基本处于黑盒之下调参就能完成入门级项目的情况,反而多数人对整个学科、基础理论和其与外系统的交叉应用,理解不够深入。在别人都来这个行业狂欢时,反而要保持冷静,回到传统学科找机会,在固有的方向提升自己实实在在的能力,比如数据库、大数据、甚至前端后端开发,或者在电气机械控制等领域找到自己独特的专业能力,再回过头看AI,会发现很多AI赋能的新点子、新思路,在别人害怕时坚信自己的判断,对整个行业乃至产业的判断,在大量涌入时坚持退出,在传统专业找机会,一定要有自己的理解和判断,并一直坚持下去。目前国家开了这么多人工智能专业,恐怕就是别人疯狂时我冷静的时期,传统行业一些机会出现了,没人去仔细的思考,那么反而应该独立地审视,做判断。
未来发展几个重点:
1。5G加持下,人工智能能否在高带宽低时延高并发方面重塑传统行业,尤其是工业,物流,交通,管理等,不是颠覆,而是赋能,将传统产业已经盈利的部分进行工业物联网化改造,提升效率。
2。人工智能目前以算力+数据进行迭代的方式基本到了尽头,人脑并不是神经网络这样反向传播更新参数的,目前还没有感知智能的框架出现,GAN这种博弈论驱动的不算,RL其实也不算,如果感知智能框架出现,那会是一个大爆点。
3。各种垂直领域应用拓展,在智能驾驶等等领域的视觉感知进化,如VSLAM在网联无人机,智能驾驶等领域的应用,复杂环境的三维视觉重建,海量样本中精确识别的智慧城市应用,如果技术融入各个垂直领域,实现结合,还是可期的。
4。疫情之下,人工智能加持的智慧医疗,智能制造等领域,还存在很多机会。
三、机遇和挑战
AI的发展机遇要分方向来说。
首先是计算机视觉,目前CV领域的研究可以说是人工智能里挖掘最充分、落地场景最直观的,那么还有哪些可以挖掘呢。目标检测,物体跟踪,图像理解和极小目标检测。
目标检测及物体识别是用的非常广泛的方向,目前的方式无论是one-stage还是two-stage,本质上都是基于全图搜索+位置标定+概率估计的方法,不可避免会浪费很多算力和遍历全图的时间,肯定影响速度。为什么不把知识图谱的思想和目标检测中anchor box结合一下,在进行区域预测时并不应该遍历全图去寻找可能的区域(传统的选择性搜索就是暴力搜索,现在的区域预测等方法只是进行了采样),而是基于知识图谱的知识推理能力,根据标定的物体推理其他物体的可能位置,再去做分类和回归,例如,智慧城市、智慧安防的很多图像中物体一定存在内在逻辑和关系,那么这种方法可以节约大量时间而提升效率。比如,在交通灯标定下的智慧城市一张4000dpi的图片,每个物体很小只有20像素,人一定在斑马线、人行道、建筑物门口出现,而不可能在天空、快速车道出现,那么我仅去用知识的关系去推理出预测区域,就能获取关注物体出现位置的最大概率,而无需对每个物体都遍历全图去预测,知识图谱对千变万化的百科都能构建关系,对常用场景下物体内在联系构建关系网络进行语义推理肯定可行。我记得中山大学、和华为诺亚方舟实验室的一篇论文在2019年底已经提出这个方法。
然后是智能驾驶领域。激光SLAM已经做得非常成熟,但是视觉SLAM还远远不够,华为200万年薪的秦通就是这个方向,做网联无人机的三维视觉导航(并不是传统GPS的方式),让无人机或者空间滑轨机器人等设备能实时的自主构建三维环境,并自主导航,相比二维栅格的机器人巡检,将极大拓展无人设备的应用场景,毕竟我们无法保障完全实时的制图和定位,也不可能无限的增加雷达的线程去扩展平面,VSLAM(ORB-vslam为主)的方向还有很多机会,未来用于空间飞行器、立体运载工具的完全自主决策,肯定会有很强的应用场景。
目前,AI行业内落地的一大难点就是标注,AI和行业结合,必须行业的业务专家去贡献力量,如知识图谱的构建基础模式(schema),梳理业务范畴内的数据形态和规则,高精度的标注,不断的运营和校验模型,基本就是有多少人工就有多少智能,如果是行业内驱动,业务方可能隐忍不做反抗,如果是AI希望赋能行业,那行业几乎没多少人能接受付出巨大努力去配合这件事。目前很多标注公司只能提供基础标注,不懂业务是肯定标不了的,很多标注本身就是归纳总结的过程,如何提升AutoML的能力,让少量标注也能实现大范围的模型自动构建,尽量降低对应用方的时间、经验成本,那么落地才会顺畅,AI才能变现,这个问题在NLP的智能应答机器人、个性化推荐等领域尤其明显,如果完成数据整合、数据挖掘和标注后,整体工作70%甚至都是配合方做的,AI反而只有调参、训练、部署、对接,这种模式是难以长久的,不懂业务的NLP的反馈结果是毫无意义的。
四、人工智能教育的感悟
人工智能专业,现在进来太晚了,晚了大约4-5年,目前注定是一个内卷趋势的行业,但是,未来如果找准和垂直领域的定位,学生们还是有希望的。
非常不建议双一流、211以下的大学开设人工智能,不建议博士、及重点211硕士以下学历的学生在这个拐点追AI热点。
目前,全国来说,从产业看AI颓势已经初露端倪,最最关键的是无法变现的问题。头部AI独角兽公司目前都过的很艰难,如商汤 旷视等也存在大量数据被掌握在BAT手中无法获取,自身先进的算法模型在实际应用中提升不明显,商业模式不能变现,过去那种非常高薪的模式已经很难继续,很可能导致较大幅度裁员。很多AI独角兽都开始谋求上市,就是极度缺乏变现能力,要找接盘的表现。很多差点的AI公司如地平线,小马智行等次一级独角兽,也都在自身垂直领域很艰难,智能驾驶难真正落地和实现收入,AI芯片也竞争不过国际巨头。目前还是有自身核心能力和核心业务的传统公司做AI更稳健,如海康大华在安防领域有垄断级的市场占有率,海量特有数据,再做一定AI提升会效果非常好,而且是以解决方案而非算法模型去竞争项目,容易获得订单。BAT分别持有全面的客户位置、地图、商务、社交数据,做AI只是在核心业务上的锦上添花,增强客户粘性,维持核心业务领域的技术壁垒,外部公司不可能进入。大家都知道19年后融资非常难,人工智能公司从来没有盈利过,亏损金额是非常巨大的,只不过是在走融资-垄断-上市,寻找接盘的过程,现在能因为一些论文、博士、人才就融资的时代不存在了,很多新公司其实没盈利能力但是人工成本泡沫太大,在面临融资困难时,非常容易迅速陨落。在产业界,2019年是分水岭,已经进入事实上的资本转移和产业下降通道,高薪人员又贵又无法落地,产品线被裁撤可能性大增,新的岗位设置越来越谨慎。与其关注AI,不如做传统学科和AI的交叉,进退自如。
从学术看,从2016年2017年的GAN,以及视觉的SSD,Faster-RCNN后,还有突破性的框架出现吗?基本没有,全都是将现有框架的网络结构做一点改动,做一些不同网络的组合,将数据集增强,或者将知识图谱,NLP等和视觉做一下交叉,基本没有突破性学术进步。论文越来越多,但是看得到的实际成果越来越少。学术上也面临巨大压力,目前这个阶段,人工智能发论文就已经非常困难了,何况几年之后,整个学术界都急需找到新的理论突破。当然,BERT是特例,通过注意力机制确实将自然语言理解和生成的效果大幅提升,但是NLP天然就和产业融合差一些,本身变现能力弱,所以对整个行业的拉动作用不大。
目前这些开人工智能的大学,它开的了吗,有那个平台、师资、经验、出路吗?人工智能所需要的扎实的计算机,信息,控制,机器人等学科的老师足够吗,有能力开这个交叉学科的最低标准,其实我心目中认为至少是东北大学、湖南大学这种传统工科优质学校,最少也是末流985(不算海大 民族大学等)及部分西南交大,北交大,北科,华电这种强势行业级211,省属211如果是工科很好的可以凑一凑,把本身几个B类学科凑起来勉强可以,其他一律不行。这个名单能开AI的学校最多15%,每个省的名单保留最多一个就够了。计算机学科评估都没有B的学校开什么人工智能,人工智能可不是把图像处理,数据挖掘等换一套外衣再拿出来,连顶级院校都没摸索出特别合理的培养方案呢,这么多似是而非的毕业生,很多师范、农业、民族的学院也开AI,不可笑吗,这些学校为了追热点追政绩,有没有了解过什么是人工智能学科,什么是行业发展,学生利益怎么保证?这个学科肯定学费很高,这不等于是产品销售的溢价宣传吗?
所以,国家应该在至少211以上重点大学开始人工智能专业,普通学校绝对没有平台和师资去做系统培养,培养的人才层次远远达不到企业要求,找不到工作。AI是一种赢者通吃的专业,只有高精尖能获得特别好,提出新的框架和算法,或者在垂直行业有全新的应用方案,普通调参调包的还不如扎实做做数据库,前端等。这次我很不看好,将一个行将破裂的泡沫一下子吹爆,这么多大学生涌入AI,只能在毕业时承受行业拐点的苦楚。目前行业企业已经将很多大学著名AI学者挖走,企业在同时进行研究和转化,大学内相当缺乏人才,导致对学生培养资源进一步稀释。
AI现在有非常明显的下行趋势,变现很困难,从2016年开始就没有突破性框架出现,开源模型多导致大家都不怎么钻研核心算法,高端人才占据一切资源,似懂非懂(包括我)的人特别多,大家透支了这个行业几年的红利,在资本离开的时候,这些本身就从来并不能赚钱的研究,要如何养活海量大学生?

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则