电脑问答:计算机视觉是当下最有前途的人工智能方向吗？-今日问答

flzt120 发表于 2023-10-9 11:57:17

计算机视觉是当下最有前途的人工智能方向吗？

vcapple 发表于 2023-10-9 11:57:54

很多人生前二十年往死里卷考研保研的小镇做题家，这辈子遇到的第一个能说会道的、画大饼的人，就是实验室老板。
老板买了几个服务器，拉了几个莫名其妙的外包项目，就等着拉我们这些非计算机科班的廉价劳动力准备开工呢。不告诉你这玩意巨有前途，牲口们愿意趋之若鹜去早起贪黑打工吗？
在学校几年，从宿舍环境到考试排名无一处不在极端内卷的大学牲，精力旺盛但认知极其狭隘，给个工位都能满足牲口们摆拍的虚荣心，干杂活的忠诚心，卷到凌晨的事业心，是不是啊？

方向是画大饼的，目标是扯犊子的，代码是不敢公开的，结果是随缘的、不可复现的，数据是美化的、修饰的、甚至造假的。
结果就是:找不到实习的、大龄自学转Java的、转前端的、转金融的、出去干几年被毕业回炉继续读博的，非常有前途。
别人工作三年时间，做项目学技术学业务，遇bug改bug，请教大佬，积累经验，打怪升级，正向反馈。
你三年除了干杂活就是炼丹，被炼丹结果搞得怀疑人生。天天对着几个破图找不同，遇见问题就修改规则美化掩饰糊弄过去。
然后有人居然要把这玩意当项目经验写简历里找Java岗，hhhh——红海很大程度就是这帮炮灰染红的。
现在还往Java岗里冲锋陷阵的不少都是两大护法: 一个是CV炼丹师，一个是天坑转行做题家。
高校本质就是大大小小的老板共治。大学四年被老板们课上课下的宣传耳濡目染，为的就是把你拉进来，把你宝贵的三年时光吃干抹净。相比骗实验结果和骗甲方，骗学生简直不要太简单。什么？出去实习了，那骗不了了，赶紧滚蛋吧。继续骗下一批。反正你毕业证软肋在这，还能跑路不成？
所以你要是炼丹小作坊的老板，上有各种基金各种项目，下有用之不竭的新鲜又便宜的劳动力牲口，那是非常有前途。至于他们以后拿什么糊口，关你什么事？你不干？有的是人干。
除了服务器以外的专业设备是没有的，数据是别人的，项目是外包的，需求是甲方的，合作是低效的，沟通是混乱的，学术资源是不足的，老板自己是挂名的。
但是苦劳是你的，大晚上随时待命是你的，别人的东西你复现不出来是你的，申报书ppt是你的，卷基金的经费一点也不是你的。
<hr/>老板分类:让实习的; 坚决不让出去实习的; 想实习拿延毕换的; 出去实习前脚走了后面就召开组会骂人的。CV这玩意，配合上后几种极品老板，那恭喜你，这几年有的受了。
对于普通人来说，CV里边最美好的差不多就是CV自研快速发水刊+上面第一种让实习的。不耽误你做别的事。想转开发的话简历也容易把CV的东西洗掉。有的老板要求高，那就没办法，你也必须奉陪。
最臭的是CV外包，用合作的噱头给甲方炼丹，本身又很难有落地应用的那种。同时侍奉老板和甲方两个爹，项目互相拉扯，数据来源，项目需求，甲方协作和利益分配全都是大坑。水深不深，那就见仁见智了。

http://pic1.zhimg.com/v2-2dc892956e8b2e0d0c802eb01f83afdb_r.jpg?source=1940ef5c

CV外包——传统炼丹小作坊的演变形态

别人遇见外包扭头就走，你年纪轻轻就做上了实验室老板拉的外包项目。多吃点老板的大饼，你过几年想出去也出不去了，老老实实读博吧。
很多人刚入坑的时候还是想着怎么实习怎么出去正常就业，被这个环境浸染一段时间之后慢慢就出不去了。有同学提到了这种不适应感——遇见bug就本能想着怎么编故事找数据圆过去让老板&#34;满意&#34;，而不是真正去解决bug。有些人出来之后不适应工作，连基本的前后端开发都做不好，归根到底还是干几年这玩意之后，脑子被这一套东西和某些小圈子背后的思想搞乱了。真相根本不像他们前几年选CV的时候，被吹的那么美妙，他也根本没有资格搞所谓的&#34;看不起Java&#34;的鄙视链。
随着这一行的极度内卷，如果对实际使用的开发语言、框架、项目通通不了解，出来的体验可能还真不如在实验室继续呆几年——加油成为计算机视觉科学家。
浙大又怎么样？985又怎么样？一句话，这玩意跟房地产类似——管你是谁，该暴雷还是暴雷，该烂尾还得烂尾。

【硕士生去搞计算机视觉，是纯纯的脑瘫行为！-哔哩哔哩】 https://b23.tv/Om9eDWt

371design 发表于 2023-10-9 11:58:09

邻居孩子用两篇cvpr一作换了区重点高中，说明还是非常有用的。

54down 发表于 2023-10-9 11:58:57

最没有前途的方向。开源代码一堆，论文满天飞，培训下小学生，他们都可以跑代码。
工作的大部分时间可以说都围绕数据，说白了就是在倒腾数据集，调参，尝试各种模块。高校里面能落地的实属凤毛麟角，大多都是为了发论文。
找工作现在视觉算法工程师供远大于需，要么转开发/研发，考公考编。

ジ呼喚ジ 发表于 2023-10-9 11:59:55

早在2019年我就反对过投身计算机视觉，今天我还是坚持同样的观点：不要再做梦了！
我之前发表过关于计算机视觉的观点，当时评论区不少人反驳，几年过去了，现在原回答已经几千赞，回答里所提到的问题也都一一应验。
今天再重复一下我的看法：
如果仅仅是抱着赶上AI的热潮，为了获取就业机会或者可观的薪资收入，我认为不要投身计算机视觉。
CV方向现状：人才短缺，工程师过剩
目前在商业中有所应用，而且能够创收的只有搜索推荐和计算机视觉，因此，这两个方向的人力缺口很大，尤其是计算机视觉。前两年校招时可以看到，互联网、IT、生物医药、汽车安防等等行业，几乎都会有计算机视觉的岗位。所以，很多其他方向的同学开始纷纷转向，随着大潮流投入计算机视觉这个方向，为什么这么多人投入计算机视觉方向？我认为有以下几个原因：

[*]入门容易
[*]模型成熟
[*]人才缺口大
[*]热度高，名气大
其他的暂且不说，就着重的说一下入门容易和模型成熟这两点。
目前入门CV的常用套路就是：

[*]看吴恩达《机器学习》《深度学习》课程，学一点机器学习的知识。
[*]读几篇CV模型的文章，了解一下经典的Alexnet、R-CNN系列、YOLO等。
[*]在github上找几个tensorflow、pytorch实现上述模型的开源代码。
[*]下载VOC、ImageNet、COCO、kaggle等数据集。
[*]按照开源代码中的Readme准备一下数据集，跑一下结果。
学了两个月、跑了几次结果后就认为已经入行CV了，其实就忽略了两个问题：

[*]计算机视觉属于图像处理的范畴，而很多人却把它当成机器学习来看待
试问一下，有多少CV的从业者从头至尾深入的学习了图像处理方面的知识？现在有了深度学习，不需要人为提取特征了，所以很多人不再关注图像底层的信息，而是直接越过这个根基去搭建模型，我觉得这是一个误区。不同领域的图像，例如OCT、MR、遥感、自然图像等等，有着巨大的特征差异，对这些特征差异性都不了解，怎么在搭建模型之后对精度进行提升和改进呢？怎么在原来模型的基础上做一些改变呢？
因此，我认为好好学习一下图像预处理、后处理的知识对CV有着至关重要的作用，例如图像去噪、分割、增强、增广等等，但是很多人都欠缺这一块的知识。

[*]计算机视觉的提升不在于搭建模型，而在于不断调优、改进过程中积累的经验
看过吴恩达课程的人，有的应该记得他在课里面说过&#34;深度学习是一个基于经验的领域&#34;，我们该怎么针对不同领域的图像设置不同的参数？其中包括卷积核大小、网络架构、初始权重等等，不可能拿到一个模型，既适合医学图像，又适合人脸识别，这其中就需要n次从70%的精度调到95%以上中积累出经验，而很多CV从业者觉得搭建出模型就告一段落，反反复复用不同的方式去搭建模型，显示tensorflow搭建完用pytorch搭，pytorch完事后用mxnet再来一遍，Python搭完用c/c++搭，但是至始至终没再精度和经验方面做出前进。
<hr/>此外，CV方向目前阶段依然存在着制约这项技术创造更多商业价值的弊端，虽然每年顶会、期刊上面关于CV的文章依然很多，但是绝大多数都是拼拼凑凑，很多模块和思想并不新颖，在关键问题方面并没有太大起色。
以CV为例说一下几项弊端：
无法做因果推理

图灵奖得主、贝叶斯网络之父Judea Pearl在arXiv上传了论文Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution，论述当前机器学习理论局限，并给出来自因果推理的7大启发。Judea Pearl指出，当前的机器学习系统几乎完全以统计学或无模型的方式运行，这对它的性能造成严重的理论限制，不能作为强AI的基础。他认为突破口在于“因果革命”，借鉴结构性因果推理模型，能对自动化推理做出独特贡献。
Theoretical Impediments to Machine Learning With Seven Sparks from the Causal Revolution
http://picx.zhimg.com/v2-b5dc7f2a701875b8b526175cb4af34f4_r.jpg?source=1940ef5c
模型可解释性差

为什么深度学习效果好？学习率、权重衰减、卷积核尺寸这些超参数设置在多大合适？目前是没有合理的数学模型解释的。就是说，你沿着某个方向去调参，效果好坏是未知的。所以，现在深度学习还是一个经验积累占主导的方向。所以，吴恩达的课程《深度学习工程师》主要以“策略”为主，遇到什么样的情况该用什么“策略”解决，偏差、方差用什么“策略”均衡等等。
数据限制

人工智能的在某些领域的成功主要得益于数据的收集和算力提升。
计算机视觉50%，甚至60%、70%的时间都用在数据方面，

[*]数据准备
[*]数据增广
[*]数据去噪
[*]数据标注
[*]......
尤其是数据准备过程，非常费劲，尤其是涉及到隐私的数据，记得之前做过一个医学图像识别的项目，前期一直想方设法和不同医院合作获取数据，等待了几个月才获得几十副图像，这对于传统目标识别也不够用啊！最后没办法，就在网上拼拼凑凑找了一些公开和付费的数据集，刚把环境配置好、模型跑通，这时Google在JAMA上发了一篇文章，和我们的方向一模一样，一下子给堵死了。看了那篇文章，Google在数据准备方面花费了8年时间，在不同国家同步进行采集，这对于一个小公司来说是望尘莫及的。

http://picx.zhimg.com/v2-3d6773c524c612bcbd41fff806776f17_r.jpg?source=1940ef5c
https://jamanetwork.com/journals/jama/fullarticle/2588763实用性差

目前人工智能很多技术都处于定制化阶段，远远达不到通用化程度。国内某些创业公司频频在CVPR、COCO等顶会、挑战赛露脸，看着实验对比数据精度方面的确非常不错。但是，真正应用时却不同了，效果非常局限。
首先，二维与三维的区别。拿计算机视觉来说，现实世界是三维空间，无论是人脸还是医学MR图像，而目前图像识别还仅限于二维空间，这在精度、安全性、空间信息等方面会做大量的妥协，所以，这就限制了它在一些要求严苛的应用场景的推广，比如医学诊断。
其次，动作与状态的区别。到实际应用中，仅仅识别出来这个人是谁、这个物体是什么是远远不够的。比如，做一个路面遗留物体的识别，这对于反恐这些场景有一些应用。目前目标识别算法能够识别出处于某种状态的一个物体，但是“遗留”是一个包含上下文信息的连续动作，这就需要其他的辅助算法，比如光流、视频分析等。
核心假设有问题

现有机器学习算法的核心假设是实例彼此独立，但是现实状态空间内，每个实例都与周围其他的实例存在一定的关联，含有一些复杂的连接信息，但是目前机器学习受限于它的核心假设，忽略了数据之间的依赖关系。
所以，我认为受限于因果推理、模型解释性、数据集、实用性、核心假设等方面的限制，CV看似繁荣也仅限于表面繁荣。机器学习这几年的确取得了显著的成果，但是这些成果主要应该归功于计算资源的快速发展（如GPU）和大量数据的收集。
<hr/>理想很丰满

理想状态下人工智能的确很有价值，能取代很多人力劳动。但是“理想很丰满，现实却很骨感”，目前并没有想象的那么美好，比如在工业制造领域，AI的作用甚至可以忽略不计。人工智能之所以如此火热，无外乎是因为和利益挂钩了，学术上容易发文章、创业公司可以利用信息差骗取投资、大公司可以拿来做噱头捆绑销售。
因此，当进入企业之后会发现，纯CV算法工程师岗位并不多，而且早已达到饱和的状态，很多所谓的 AI工程师岗，日常工作中业务内容占的比重要远对于AI内容，有一些公司的AI工程师岗甚至让人怀疑“这和AI有什么关系？”
高端布局技术达不到，低端布局创造价值有限，作为商业公司，利润才是最终目标，谁也不会花大量资金去养一批仅仅会&#34;调参&#34;&#34;搭建模型&#34;的算法工程师，就算是公司创始人有追求，那也得看投资者愿不愿意投资这种追求。
当然，开头提到了，虽然工程师过剩，但是人才是短缺的。如果真的对CV方向充满着浓厚兴趣，抛开经济和利益的因素，我是支持的。但是，如果仅是顺应趋势、赶上热潮，我认为不适合入门CV。因为，最大的泡沫期和红利期已经过去了。
欢迎添加vx：code_7steps和我进行技术交流！<hr/>更多优秀作品

为什么Python比C++慢很多？
pandas 在使用时语法感觉很乱，有什么学习的技巧吗？
普通小白学会Python到底具体能做什么呢？
Vscode有什么好用的插件？干货

干货 | 2019年共享免费资源整理(上)：学习资源篇干货 | 2019年共享免费资源整理(下)：实用工具篇

111111zz 发表于 2023-10-9 12:00:27

钱途吗？最没钱途吧。三五年前的确有钱景，现在大量硕士博士批量出炉，安防赛道拥挤不堪，其他商业场景有限，制造业聚集在QA，自动驾驶等少数几个场景，四大神兽举步维艰，看看某汤的股价和裁员；医疗影像因为个人隐私和政策等非技术因素难以大规模商业化。而CV从业者甚众，新涌入大量新人，CV本身也没有太高门槛，数学理论相对少，研究的很彻底，为了提一个点，都要拼了，基本是个炼丹的工程问题，内卷的一塌糊涂，发文章需要拼手速，所谓的创新实际应用价值很难说，理论上都是大牛所把持，创新难度大，在算力即正义的时代，大厂上千块gpu，训一个模型电费几万美金，一般人也玩不起，现在都是基于Transformer的架构，你有几块卡？最后可能无奈的搞小样本和元学习，本质是穷啊！工作机会方面，2021年大厂录用比100：1，问前程还是建议考虑看看其他方向吧，要是喜欢追热点不怕卷，就去搞CV吧，名校顶会论文者除外，以上该领域5年经验者的观点
也有一些细分的方向可以考虑，比如三维重建。
+++++++++++以下2022年12月更新+++++++
最近diffusion很火，隐隐的下一个Transformer的感觉，不过一般也都需要很多卡，money is all you need!
从贝叶斯公式理解Diffusion模型十年回顾——CV的未来：ConvNeXt or Transformer?

页: [1]

今日问答's Archiver

计算机视觉是当下最有前途的人工智能方向吗？