[IT技术] 搞计算机视觉必须要用C++吗,Python 不行么?

[复制链接]
senholy 发表于 2023-10-4 20:05:56|来自:北京 | 显示全部楼层 |阅读模式
本人技术小白一个,最近想入门计算机视觉,请教下各位大佬,跪求答案,请收下我的膝盖!
全部回复5 显示全部楼层
肝硬化 发表于 2023-10-4 20:06:35|来自:北京 | 显示全部楼层
模型训练这块以python为主吧,C++主要是后处理、模型部署的时候会用到。可以关注下自动驾驶赛道,计算机视觉非常重要的应用场景之一就在自动驾驶!近两年的BEV感知工业界和学术界强推,可以说是下一代自动驾驶量产的主力了。据汽车人了解,今年像比亚迪等等公司都在搭建辅助驾驶团队,很好的入场机会。这里推荐一个自动驾驶驾驶的20+技术方向学习路线的(BEV感知/3D检测/多传感器融合/SLAM与规划等)专业社区!
据不完全统计,2021年国内自动驾驶行业总共发生投资事件124起,累计披露的融资金额超760亿元人民币。但2022年在投资数量几乎不变(125起)的情况下,融资金额仅有上一年的约四分之一,为205亿元人民币。自动驾驶赛道正呈现去泡沫化,回归理性发展。就在本周阿里达摩院被曝进行组织架构调整,自动驾驶实验室或将进行大规模人员优化。正处于行业降温期的自动驾驶从业人员,该何去何从?和几位朋友促膝长谈之后,我们决定搭建了一个专业的自动驾驶感知、定位融合、仿真部署的讨论和问答平台『自动驾驶之心知识星球』。目前我们已经完成了近30+的自动驾驶技术方向学习路线!而且每周都会邀请大佬进行直播分享,内容涵盖自动驾驶领域的多个方向,星球交流群内可以无限畅聊技术和遇到的困惑,还能获得热门课程独享优惠券。如果你想转到自动驾驶、想了解最新的技术方向、招聘信息和求职攻略,我诚心推荐大家加入自动驾驶之心知识星球!这是一个能够all in one的地方(由于内容足够全,需要一点阅读时间,这里涵盖所有你想要的)
加入链接: 国内首个自动驾驶与AI学习社区:欢迎加入国内首个自动驾驶开发者社区!这里有最全面有效的自动驾驶与AI学习路线(感知/定位/融合)和自动驾驶与AI公司内推机会!
星球内容一览



自动驾驶之心知识星球

自动驾驶之心知识星球是首个以自动驾驶技术栈为主线的交流学习社区,这是一个前沿技术发布和学习的地方!我们汇总了自动驾驶感知(分类、目标检测、语义分割、实例分割、全景分割、关键点检测、车道线检测、3D感知、目标跟踪、多模态、多传感器融合等)、自动驾驶定位建图(高精地图、SLAM)、自动驾驶规划控制、领域技术方案、AI模型部署落地等几乎所有子方向的学习路线!除此之外,还和数十家自动驾驶公司建立了内推渠道,简历直达!这里可以自由提问交流,许多算法工程师和硕博日常活跃,解决问题!初衷是希望能够汇集行业大佬的智慧,在学习和就业上帮到大家!星球的每周活跃度都在前50内,非常注重大家积极性的调度和讨论,欢迎加入一起成长!


星球目前有哪些成员?

星球成员主要来自商汤科技、旷视科技、百度、阿里、网易、Momenta、Intel、Nvidia、赢彻科技、图森未来、智加科技、AutoX、大疆、上汽、集度、地平线、蔚来、小鹏、蘑菇车联、斑马、华为等业界知名公司,以及苏黎世理工、卡耐基梅隆大学、普渡大学、东京大学、香港中文大学、香港科技大学、香港大学、清华大学、上海交大、复旦大学、浙江大学、中科大、南京大学、东南大学、同济大学、上海科技大学、哈工大等国内外知名高校;
知识星球有哪些模块?

CV图文教程:网络结构可视化、算法原理图解;
视频教程:星球内部技术分享视频完成了多次技术直播分享,包括语义分割、毫米波雷达视觉融合、多传感器标定、传感器部署、高精地图制作关键技术、规划控制、轨迹预测、自动驾驶行业与求职分析、自动驾驶仿真等多个方向(星球内部观看)!以及优秀开源课程,涉及相机标定、伯克利深度学习与计算机视觉、百度优达学城、Apollo自动驾驶、Udacity自动驾驶、MIT自动驾驶、Carla自动驾驶仿真等系列视频课程;


日常paper分享:BEV感知、3D目标检测、多模态融合、2D检测、分割、车道线、多任务学习、多目标跟踪、传感器空间和时间同步、鱼眼感知与模型、轨迹预测、高精地图、SLAM、规划控制、V2X、Occupancy network、NerF、测速测距、强化学习、VIT、轻量化等;
职位与面经分享:自动驾驶行业职位内推、面经分享、入门学习路线分享;
日常问答交流:和嘉宾星主交流领域学术工业最新进展,包括领域方案、工程实战问题、学术界前沿动态;


主要面向对象

星球创建的初衷是为了给自动驾驶行业提供一个技术交流平台,包括需要入门的在校本科/硕士/博士生,以及想要转行或者进阶的算法工程人员;除此之外,我们还和许多公司建立了校招/社招内推,包括地平线、百度、蔚来汽车、momenta、赢彻科技、集度、滴滴、Nvidia、高通、纵目科技、魔视智能、斑马汽车、博世、纽劢科技、追势科技、寒武纪等!
如果您是自动驾驶和AI公司的创始人、高管、产品经理、运营人员或者数据/高精地图相关公司,也非常欢迎加入,资源的对接与引进也是我们一直在推动的!我们坚信自动驾驶能够改变人类未来出行,想要加入该行业推动社会进步的小伙伴们,星球内部准备了基础到进阶模块,算法讲解+代码实现,轻松搞定学习!




每周精选




日常讨论




日常视频分享


视频教程分享
星球主要关注方向

0.自动驾驶顶会与公司

星球内部为大家汇总了CVPR、ECCV、IROS、RSS、TPAMI、IV、ICIP等自动驾驶领域顶会和顶刊,以及图森、智加、主线科技、集度、滴滴、纵目、元戎启行、momenta、蔚来小鹏理想等近80家公司介绍(可以内推!)
1.计算机视觉相关数据集

数据集是AI任务的基石,然而大多数数据集都是国外机构开源,数据量较大,下载速度缓慢,这两个缺点导致很多研究人员在数据获取上为难,为此星球内部已经为大家准备了近30种计算机视觉和自动驾驶相关数据集,包括KITTI、Waymo Open Dataset、Lyft L5、COCO、Semantic3D、A2D2数据集、车道线数据集、车牌数据集、行人检测数据集、红绿灯检测数据集等,一键下载;


2.2D/3D标定工具与仿真

星球内部为大家汇总了2D检测、3D点云检测、语义分割、实例分割、3D点云分割、视频检测、交互标定、多传感器标定等工具,还有各类仿真框架,可以快速适配到自己项目中。


3.基础学习资料

整理了从自动驾驶感知、跟踪、滤波专业算法技术,到深度学习数学基础和图像处理、经典计算机视觉算法、Opencv、Pytorch以及C++、Python、GPU和Cuda近50本pdf学习资料!






4.  Backbone与Transformer

主要关注常用的轻量化、高性能backbone,以及视觉transformer结构与优化;


5.  2D目标检测

关注anchor-based、anchor-free、one-stage、two-stage、超全YOLO系列、小目标检测、多任务模型、长尾分布、误检消除、难例挖掘、定位精度优化等内容;该模块汇总检测领域的经典综述和论文,从结构、数据增强策略、采样策略、不均衡问题、半监督、知识蒸馏上展开研究;








6.  分割任务

汇总了常见的2D语义分割、实例分割、全景分割以及3D点云分割SOTA算法,并对分割任务中的边缘轮廓分割模糊不细腻问题展开讨论;




7.车道线检测

对基于检测、分割、分类、关键点、曲线预测、多传感器检测、3D车道线SOTA方法进行了汇总,对车道线遮挡、磨损、不连续问题展开了讨论!


8.鱼眼感知

针对鱼眼和全景相机在自动泊车、近域感知上的应用展开,主要包括相机标定、鱼眼全景相机系统、自动泊车系统、环视数据集、鱼眼深度估计、鱼眼目标检测、鱼眼SLAM、语义分割等方向!






9.目标跟踪

针对单目标和多目标跟踪,基于Siamese Network、Tracking-by-detection、传统滤波+关联算法、end2end等方法进行全面展开阐述,后续更会加入变速情况下的跟踪系统;




10.3D目标检测

从点云和多模态数据3D检测任务展开,基于BEV、点、体素、多camera数据的3D检测方案;










11.传感器标定

主要关注自动驾驶领域常见的Camera、Lidar、Radar、IMU之间的离线、在线标定,多相机、多激光雷达之间的标定,自动标定,传感器时间同步等;










12.多传感器融合

星球内部汇总了数据级融合、目标级融合、特征级融合、弱融合、不对称融合等多种方案!








13.SLAM与高精地图

汇总了单目SLAM、RGB-D SLAM、激光SLAM、毫米波SLAM、高精地图定位方法、自定位方法!以及领域内最常用的高精地图制作方法!










14.模型压缩与轻量化

汇总了模型压缩、裁剪、量化、权值共享、模型加速、知识蒸馏、量化工具等数十篇干货介绍!
15.模型部署

TensorRT、NCNN、Opencv、MNN方案部署检测、分割、关键点、分类模型实战;


16.轨迹预测

重点关注行人、车辆、基于机器学习、深度学习、强化学习方式的预测!  


17.规划控制

涵盖所有的规划控制方法,重点关注行车、泊车、机器人等应用领域!  




18.其它

在感知定位融合之外,还汇总了Occupany network、测速测距、大量机器人、自动驾驶规划方法,强化学习在运动规划上的应用、V2X技术,以及图像加速CUDA方法等~


日常讨论交流









欢迎加入

欢迎大家扫码加入自动驾驶之心知识星球,我们诚邀前期成员的加入,一起创造一个全技术栈的自动驾驶开发者社区!星球成员的加入平均每天0.5元,欢迎扫码加入一起学习一起卷!
加入链接: 国内首个自动驾驶与AI学习社区:欢迎加入国内首个自动驾驶开发者社区!这里有最全面有效的自动驾驶与AI学习路线(感知/定位/融合)和自动驾驶与AI公司内推机会!
sky94132003 发表于 2023-10-4 20:07:17|来自:北京 | 显示全部楼层
作为一个写库的人来说。
C++ 是写库必备。因为对于一个库而言,性能是最重要的。
目前不论计算机视觉还是其他AI领域,在特定硬件上的加速库基本都是用C/C++/ASM来完成的,包括cuda、cudnn/blas库等。
python作为更高级的语言,其特点和优势在于易用以及三方库的移植性。
但不排除python也可以写出很棒性能很好的算法。
但是目前来看,python更多的是用在框架侧完成整网的训练推理调参。实际上大部分的底层实现还是调用的C++来实现的。
<hr/>如果你想入门,建议从python开始,毕竟你不需要上来就写高性能库。先从框架上入手计算机视觉,有个大致的理解,慢慢深入细节。
等到某一天,发现自己的网络性能不符合自己的预期的时候,再考虑C++来手撸某些算法。
BTW, 一旦你开始考虑某些性能问题,
那么恭喜你,你已经打败了90%的程序员了。

<hr/>AI 行业摸爬滚打好几年,准备开始写一些AI的行业经验贴以及技术文章,欢迎关注
@董董灿是个攻城狮
以及我的公众号,也可加我WX,一起交流学习:
董董灿是个攻城狮
a3102779 发表于 2023-10-4 20:07:50|来自:北京 | 显示全部楼层
无脑Python吧。现在主流框架也都是python一层皮,底下全是C/C++。
什么时候用C++:
你真的遇到了 语言的overhead,比如你在某广告组做高并发的推理,要求速度达到 ms level的时候,这时候Python就捉襟见肘了。它的问题在于api call的overhead大概是 1ms,但是推理本身小于1ms
你要部署在edge device上,比如raspberry pi。跑个python很慢。只有几十k的模型真香 (TVM 软广)
我是色狼 发表于 2023-10-4 20:08:46|来自:北京 | 显示全部楼层
谢邀
人在蒙古,刚下航母
我在蒙古海军交流的时候都是用python做图像和视觉的,效果很好,实验做的很棒,很有成就感。上次和毛子冲突,我们被导弹打中30分钟后,视觉系统就算出导弹轨迹给出预警了,我真棒。
后来想优化一下我们的系统,但是网费忘交了,上不了github,就一直拖着,等攒够钱交上网费,我一定能做的更好!
x51 发表于 2023-10-4 20:09:30|来自:北京 | 显示全部楼层
啥语言都行,只要有视觉库。
实在不行,从零撸也行。
c++只是习惯,运行效率会比其他语言高一些,毕竟视觉处理需要高计算量。

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则