我是吉林大学计算机研一硕士,方向是计算机视觉,至少从我的角度来看,通过cv来找算法岗是非常困难的,需要发很好的论文,学历要求也很高,像吉大硕士这个等级不太够用,得华科以上这种才比较好。但是机械领域cv方向找工作我不太了解,可能机械领域有一些需要计算机视觉的特殊岗位,这个可以咨询一下你的师兄师姐。机械领域找工作需要什么能力,看论文还是项目经历还是实习什么的,你要提前准备好。
然后是读博,如果你想读博的话,可以搞cv方向,因为发论文的难度不是太大,如果你读博,具体今后是要留高校还是进工业界你要好好考虑,目前读博进高校是非常卷的,难度很大。
如果你不想读博,就图个毕业,那其实cv领域发个普通的论文(中科院三四区,ei),满足毕业条件的话,不是很难,可以走这条路。
之后是chatgpt这个东西,我觉得你大可不必担心,我就是搞cv的,但是我之后要么找开发进互联网私企,要么进银行之类的国企,找工作的本事和cv没有任何关系,所以我根本不在乎chatgpt会对cv领域有什么影响,我论文随便发了就完事了。你要是想通过cv转码,无非就是两条路:第一,转开发。非计算机科班转开发难度真不小,现在对非科班的歧视越来越严重了,不好走。第二,转算法。正如我之前说的,这个我估计也很难,除非你是清北华五大佬,那当我没说。
最后是怎么学cv,你可以了解一些简单的传统的图像处理技术,主要是opencv的操作,图像滤波、边缘检测什么的。然后你就得了解深度学习了,学深度学习可以看b站视频,有个叫唐宇迪的,他讲的难度低一点,比较通俗,还有个李沐,也不错,更专业一点,还有个复旦邱锡鹏,讲的也很好,但是对数学要求比较高。你如果觉得很多理论的数学推导听不懂的话就不要纠结数学原理,你只需要知道这个东西是干什么的,大概的思想是什么,是处理什么问题而设计的,就可以了。然后你可以学一学pytorch,不过你得先会python,学了python基础语法之后,再稍微了解一下numpy,然后就学pytorch就可以了。学会怎么搭建一个神经网络,下载点数据集,如果能把一个简单的图像分类任务跑起来,就算成功了。学pytorch可以找《动手学深度学习pytorch版》。
最后,我可以大概给你简单的介绍一下深度学习是怎么处理视觉问题的。一般图像都是RGB组织的,比如一个图像分辨率是512×512的,那么这个图像就是512×512×3个数组成的三层矩阵。如果你要做一个图像分类任务,就是要知道这512×512×3个数是个什么东西,假设就是个三分类任务,那么现在神经网络通常的做法就是把图像输入给网络,然后得到一个长度为3的向量,哪个值最大,就说明这个图像的分类是哪一个。然后神经网络就是一个复杂的数据映射系统,把512×512×3个数映射到3个数上,得到最终的结果。怎么获得这个神经网络呢?就需要有很多数据去训练这个网络,把一个图像输入给网络,网络就会输出一个值,把这个值和这个图片的分类答案作比较,就可以知道现在这个网络和结果的差距是多少,然后根据这个差距去更新网络的参数,就可以让神经网络表现得越来越好了。 |