电脑问答:我在计算机读研，选择人工智能方向了，有自然语言处理nlp，还有计算机视觉cv，请问选择哪个更好？-今日问答

zhengdejin 发表于 2023-10-4 06:51:28

我在计算机读研，选择人工智能方向了，有自然语言处理nlp，还有计算机视觉cv，请问选择哪个更好？

我目标就是，好发论文就行，求有经验的各位哥哥姐姐们，给点经验，谢谢啦。

wxw850227 发表于 2023-10-4 06:51:40

计算机视觉吧，这两年自动驾驶正处于高速发展时期~
强烈推荐！自动驾驶与AI学习社区：欢迎加入国内首个自动驾驶开发者社区！这里有最全面有效的自动驾驶与AI学习路线（感知/定位/融合）和自动驾驶与AI公司内推机会！
自动驾驶之心知识星球是国内首个以自动驾驶技术栈为主线的交流学习社区，这是一个前沿技术发布和学习的地方！主要切入自动驾驶感知（分类、目标检测、语义分割、实例分割、全景分割、关键点检测、车道线检测、3D感知、目标跟踪、多模态、多传感器融合等）、自动驾驶定位建图（高精地图、SLAM）、自动驾驶规划控制、领域技术方案（纯视觉方案、视觉+毫米波雷达方案、视觉+Radar+Lidar等多传感器融合方案）、AI模型部署落地（基于TersorRT、NNIE、NCNN等）、行业动态、岗位发布（校招+社招）等方向。
星球目前有哪些成员？

星球成员主要来自商汤科技、旷视科技、百度、阿里、网易、Momenta、Intel、Nvidia、大疆、上汽、集度、地平线等业界知名公司，以及上海交大、复旦大学、浙江大学、中科大、南京大学、同济大学、上海科技大学、哈工大、普渡大学、苏黎世理工等国内外知名高校；
知识星球有哪些模块？

CV图文教程：网络结构可视化、算法原理图解；
视频教程：百度优达学城、Apollo自动驾驶、Udacity自动驾驶、MIT自动驾驶等系列视频课程；
日常paper分享：3D检测、多模态、2D检测、分割、车道线、多任务、多目标跟踪、融合、传感器标定、鱼眼感知与模型、VIT、轻量化等；
职位分享：自动驾驶行业职位分享内推；
日常问答交流：和嘉宾星主交流领域学术工业最新进展；

http://pica.zhimg.com/v2-b08e51b7b6785e98b993c6d0629ec0ec_r.jpg?source=1940ef5c
主要面向对象

星球创建的初衷是为了给自动驾驶行业提供一个技术交流平台，包括需要入门的在校本科/硕士/博士生，以及想要转行或者进阶的算法工程人员；除此之外，我们还和许多公司建立了校招/社招内推，包括地平线、百度、蔚来汽车、momenta、赢彻科技、集度、滴滴、Nvidia、高通、纵目科技、魔视智能、斑马汽车、博世、纽劢科技、追势科技、寒武纪等！
如果您是自动驾驶和AI公司的创始人、高管、产品经理、运营人员或者数据/高精地图相关公司，也非常欢迎加入，资源的对接与引进也是我们一直在推动的！
我们坚信自动驾驶能够改变人类未来出行，想要加入该行业推动社会进步的小伙伴们，星球内部准备了基础到进阶模块，算法讲解+代码实现，轻松搞定学习！
重磅！自动驾驶之心知识星球也面向全领域邀请20名行业专家和带头人，您可以是自动驾驶领域中的任何子模块方向，无论是丰富实战经验的算法工程人员还是手持多篇顶会的在校硕博，自动驾驶之心非常欢迎您的加入，我们将免费提供一切资源，欢迎大家加入自动驾驶之心！（底部可以联系小助理）
星球主要关注方向

0.自动驾驶顶会与公司

星球内部为大家汇总了CVPR、ECCV、IROS、RSS、TPAMI、IV、ICIP等自动驾驶领域顶会和顶刊，以及图森、智加、主线科技、集度、滴滴、纵目、元戎启行、momenta、蔚来小鹏理想等近80家公司介绍（可以内推哦！）
1.计算机视觉相关数据集

数据集是AI任务的基石，然而大多数数据集都是国外机构开源，数据量较大，下载速度缓慢，这两个缺点导致很多研究人员在数据获取上为难，为此星球内部已经为大家准备了近30种计算机视觉和自动驾驶相关数据集，包括KITTI、Waymo Open Dataset、Lyft L5、COCO、Semantic3D、A2D2数据集、车道线数据集、车牌数据集、行人检测数据集、红绿灯检测数据集等，一键下载；

http://picx.zhimg.com/v2-328aeef35b42b4f0e72f68d93cc84efd_r.jpg?source=1940ef5c
2.2D/3D标定工具

星球内部为大家汇总了2D检测、3D点云检测、语义分割、实例分割、3D点云分割、视频检测、交互标定、多传感器标定等工具，可以快速适配到自己项目中。

http://picx.zhimg.com/v2-8560825f3b0cf9e1f4c261b814bf0dc1_r.jpg?source=1940ef5c
3.基础学习资料

整理了从深度学习数学基础到图像处理、经典计算机视觉算法、Opencv、Pytorch以及C++、Python、GPU和Cuda近50本pdf学习资料！

http://pica.zhimg.com/50/v2-c0d4b7b02f9452d6e4fe4968c980e2af_720w.jpg?source=1940ef5c
4.Backbone与Transformer

主要关注常用的轻量化、高性能backbone，以及视觉transformer结构与优化；

http://pic1.zhimg.com/v2-5f8355f2fde20948b4c2f2c955096236_r.jpg?source=1940ef5c
5.2D目标检测

关注anchor-based、anchor-free、one-stage、two-stage、超全YOLO系列、小目标检测、多任务模型、长尾分布、误检消除、难例挖掘、定位精度优化等内容；该模块汇总检测领域的经典综述和论文，从结构、数据增强策略、采样策略、不均衡问题、半监督、知识蒸馏上展开研究；

http://picx.zhimg.com/v2-2c1e963f20beb4ff67a990e80c303099_r.jpg?source=1940ef5c

http://pic1.zhimg.com/v2-8365bfe876ff1d4f2a1afaafda0bd7d8_r.jpg?source=1940ef5c

http://pic1.zhimg.com/v2-1dbaf02f457602cb6245a5d8d34688b9_r.jpg?source=1940ef5c

http://picx.zhimg.com/v2-338964e3c49114ecc54ad42519ca47bf_r.jpg?source=1940ef5c
6.分割任务

汇总了常见的语义分割、实例分割、全景分割SOTA算法，并对分割任务中的边缘轮廓分割模糊不细腻问题展开讨论；

http://picx.zhimg.com/v2-d4c247404aebbb75ab14b2c8e32c11e6_r.jpg?source=1940ef5c
7.车道线检测

对基于检测、分割、分类、关键点、曲线预测、多传感器检测、3D车道线SOTA方法进行了汇总，对车道线遮挡、磨损、不连续问题展开了讨论！

http://picx.zhimg.com/v2-cd1f98712e6aea720ecc71baaff39a26_r.jpg?source=1940ef5c
8.模型裁剪、量化与部署

TensorRT、NCNN、Opencv、MNN方案部署检测、分割、关键点、分类模型实战；

http://picx.zhimg.com/v2-f247ed795cb10fe8f2b63bfdadf46368_r.jpg?source=1940ef5c
9.目标跟踪

针对单目标和多目标跟踪，基于Siamese Network、Tracking-by-detection、传统滤波+关联算法、end2end等方法进行全面展开阐述，后续更会加入变速情况下的跟踪系统；

http://pic1.zhimg.com/v2-22b5869af42cec9cab89a157d9c3c4f2_r.jpg?source=1940ef5c
10.3D目标检测

从点云和多模态数据3D检测任务展开，基于BEV、点、体素、多camera数据的3D检测方案；

http://pic1.zhimg.com/v2-88f870b1dc5bdbe5083541b531cbd4f2_r.jpg?source=1940ef5c

http://picx.zhimg.com/v2-2f8978dd5d17087c4693555b40730991_r.jpg?source=1940ef5c

http://picx.zhimg.com/v2-3d639d5b302ac513739e840f539021ef_r.jpg?source=1940ef5c

http://pic1.zhimg.com/v2-37a22b3f8fb4f5bd8a2d83d46a985f1a_r.jpg?source=1940ef5c
11.传感器标定

主要关注自动驾驶领域常见的Camera、Lidar、Radar、IMU之间的离线、在线标定，多相机、多激光雷达之间的标定，自动标定等；

http://picx.zhimg.com/v2-8e3e213129eabff4f4bd3bfe2d3b8a3b_r.jpg?source=1940ef5c

http://picx.zhimg.com/v2-7ddc3f452f7dc32b1afa44288986eb6b_r.jpg?source=1940ef5c

http://pic1.zhimg.com/v2-e6aa5f39700bdfc4a5886a16470a0589_r.jpg?source=1940ef5c
12.多传感器融合

星球内部汇总了数据级融合、目标级融合、特征级融合、弱融合、不对称融合等多种方案！

http://pic1.zhimg.com/v2-852b2e585c3658559ecbfd744762a8c2_r.jpg?source=1940ef5c

http://pic1.zhimg.com/v2-c3b4a02c044ae97cb26a1173e99bb088_r.jpg?source=1940ef5c
13.SLAM与高精地图

汇总了单目SLAM、RGB-D SLAM、激光SLAM、高精地图定位方法、自定位方法！以及领域内最常用的高精地图制作方法！
14.模型压缩与轻量化

汇总了模型压缩、裁剪、量化、权值共享、模型加速、知识蒸馏、量化工具等数十篇干货介绍！
15.其它

在感知定位融合之外，还汇总了大量机器人、自动驾驶规划方法，强化学习在运动规划上的应用、V2X技术等！
欢迎加入

强烈推荐！自动驾驶与AI学习社区：欢迎加入国内首个自动驾驶开发者社区！这里有最全面有效的自动驾驶与AI学习路线（感知/定位/融合）和自动驾驶与AI公司内推机会！

汽水猫 发表于 2023-10-4 06:52:21

CV和NLP是目前计算机方向最大的两个领域，CV第一NLP第二，这两个方向发top文最多，当然水文也比较容易。
CV方向主要包括图像识别、目标检测、图像分割、图像检索、关节点识别、图像生成、视觉导航等。三维重建等SLAM技术也属于CV，比较古老了，但SLAM是无人驾驶中基于构图导航的基础。这里每一个方向又细分很多小方向，每个小方向都有很多未解决问题，所以发论文还是比较方便的。另外CV最近也取得了长足进步，解决了很多实际的问题，应用性很强。
NLP方向主要包括文本分类、信息提取、信息检索、自动问答、知识图谱、推荐系统等。同CV，也是每一个方向又细分很多小方向，也属于应用性很强的方向。NLP的应用更贴近生活，但你跟小冰、各种客服等机器人聊天就可以了解，距离通用型应用还有距离。发文章同CV，也属于比较容易的。
这两个方向的文章都高度一致，非常严格：要求公开数据集上跑，很多数据集都给分好组了；你如果使用别的数据集做了预训练，必须声明，否则属于作弊。
将来的几年，应该是打通CV和NLP的gap的几年。这里需要提一下zero-shot，他起初的思想是这样：CV领域要识别一般目标，需要有数据进行训练，如识别马就必须有马的图像。考虑这样一个场景，我们有马的图像，可以学习到这种形态的就是马；有老虎的图像，可以学习到这种外表是斑纹；我们有熊猫的图像，可以学习到这种颜色是黑白。我们没有斑马的图像，但告诉系统斑马是有黑白条纹的马，就可以找出它，这就是zero-shot，就是找从来没见过的一个东西（实际测试集如果有见过的也有没见过的，反而更难）。
如果打通了CV和NLP这个GAP，那么就可以利用CV的外观和NLP的语义，向人工智能迈进一大步。（这一步是可预见成立的，不是神棍那种哲学上的成立，目前这个方向已经火起来了。）
应用最强的，CV和NLP几乎每个方向都可以。

ak789@163.com 发表于 2023-10-4 06:53:21

NLP/CV是表象、应用，与好不好发论文无关，也不代表你将来研究的方向、问题。
参考 paperswithcode 上的分类，CV有1334个任务。每个任务的方案、进展、理论问题都不相同。即使你说“我选CV”也不代表你选择了方向，也不代表好发文章。

建议先广泛阅读文献，了解各领域研究脉络和前沿问题，找感兴趣、导师认可的方向。

mingren119 发表于 2023-10-4 06:53:38

好发论文首选自然语言处理，毕竟还有一大堆问题留着给你解决。
小方向比如说对话管理 Dialogue Management、文本生成 NLG、知识图谱KG、知识表示、多模态、无标签知识抽取、知识推理、强化学习和nlp的结合等等，往细节处耕耘又会出现一大堆的问题，问题多到数不过来。
CV 现在大产业的解决方案相对成熟，但在细分领域也还有些机会。

lovess217 发表于 2023-10-4 06:53:48

这两个差不多，简单说下情况，首先都卷的不得了，得发很多文章
CV：上手简单，缺乏可解释性，多炼丹，更玄学，发展已经很全面，难做出新东西，要挖掘新东西比较难，但是容易毕业，好水文章，nerf类似工作是一个还可以的方向
NLP：上手稍难相比较CV，稍具可解释性，目前非常火，属于最火的前沿，还在猛烈发展，没有进入冷却，但是随着transformer出现，也比较难做出新东西，多模态是一个还可以的方向，更容易水文章。
更好的是现在多模态和google pathways的发展，都是结合cv和nlp两个领域的东西，目前最好的，所以更合理的是研究双方融合的方向。

页: [1]

今日问答's Archiver

我在计算机读研，选择人工智能方向了，有自然语言处理nlp，还有计算机视觉cv，请问选择哪个更好？