lfpjh 发表于 2023-10-4 20:05:48

2022最新计算机视觉学习路线(入门篇)

如果你有兴趣或计划做与图像或视频相关的事情,你绝对应该考虑使用计算机视觉。计算机视觉 (CV) 是人工智能 (AI) 的一个分支,它使计算机能够从图像、视频和其他视觉输入中提取有意义的信息,并采取必要的行动。例如自动驾驶汽车、自动交通管理、监控、基于图像的质量检查等等。
什么是 OpenCV?

OpenCV 是一个主要针对计算机视觉的库。它拥有你在使用计算机视觉 (CV) 时所需的所有工具。“Open”代表开源,“CV”代表计算机视觉。
我会学到什么?

本文包含使用 OpenCV 库开始使用计算机视觉所需的全部内容。你会在计算机视觉方面感到更加自信和高效。所有代码和数据都在文末。
读取和显示图像

首先让我们了解如何读取图像并显示它,这是CV的基础知识。读取图像:

http://pic1.zhimg.com/v2-1cad547d740bd1acd1b7cc78d15fdb8c_r.jpg
'img' 包含 numpy 数组形式的图像。让我们打印它的类型和形状,

http://pic3.zhimg.com/v2-1c082579217de0f6a620157b14078896_r.jpg
numpy 数组的形状为 (667, 1200, 3),其中,
667 – 图像高度,1200 – 图像宽度,3 – 通道数,
在这种情况下,有 RGB 通道,所以我们有 3 个通道。原始图像是 RGB 的形式,但 OpenCV 默认将图像读取为 BGR,因此我们必须在显示之前将其转换回RGB。
显示图像:

http://pic1.zhimg.com/v2-94fe3fcfb154ffa2d873f2b1198c66cc_r.jpg
在图像上绘图

我们可以绘制线条、形状和文本图像。

http://pic1.zhimg.com/v2-5fdafd9e7d1d4e4476c909ca5c66ffe8_r.jpg

http://pic3.zhimg.com/v2-340d93a768f1933b94d4b7f0d9125b4e_r.jpg
混合图像

我们还可以使用 OpenCV 混合两个或多个图像。图像只不过是数字,你可以对数字进行加、减、乘、除运算,从而得到图像。需要注意的一件事是图像的大小应该相同

http://pic1.zhimg.com/v2-a1d25735b4576e33daa912400d026ce0_r.jpg

http://pic4.zhimg.com/v2-bae27769c5ffa215b55359d331a9418b_r.jpg

http://pic1.zhimg.com/v2-c7db8352e39b33f1c2095221c712d33c_r.jpg
乘法图像几乎为白色,分割图像为黑色,这是因为白色表示255,黑色表示0。当我们将图像的两个像素值相乘时,我们得到的数字更大,因此其颜色变为白色或接近白色,与分割图像相反。
图像变换

图像变换包括平移、旋转、缩放、裁剪和翻转图像。

http://pic1.zhimg.com/v2-0e3cba663613a9a44f267b0d915fa264_r.jpg

http://pic2.zhimg.com/v2-49bd5b892c6f3962054d695dcc2f53b5_r.jpg

http://pic4.zhimg.com/v2-829bee2ea8080e73b855895b465b7b8b_r.jpg
图像预处理

阈值处理:在阈值处理中,小于阈值的像素值变为 0(黑色),大于阈值的像素值变为 255(白色)。我将阈值设为 150,但你也可以选择任何其他数字。

http://pic3.zhimg.com/v2-b26b69cd2c2e160824ab853990ffa9e2_r.jpg

http://pic4.zhimg.com/v2-2464b7908141d3c13fe5e21da1e58d07_r.jpg

http://pic3.zhimg.com/v2-ec9356f922583664361757e17b83f652_r.jpg
应用阈值后,150 的值变为等于 255过滤:图像过滤是通过改变像素的值来改变图像的外观。每种类型的过滤器都会根据相应的数学公式更改像素值。我不会在这里详细介绍数学,但我将通过在 3D 中可视化它们来展示每个过滤器的工作原理。如果你对过滤器背后的数学感兴趣,可以查看:https://docs.opencv.org/4.5.3/d4/d86/group__imgproc__filter.html

http://pic3.zhimg.com/v2-f9d5407434793c2f4105c797e51f7bba_r.jpg

http://pic4.zhimg.com/v2-bc06cf51264e95b9f220ba52b390282b_r.jpg
高斯滤波器:通过去除细节和噪声来模糊图像。有关更多详细信息,你可以阅读:https://homepages.inf.ed.ac.uk/rbf/HIPR2/gsmooth.htm
中值滤波器:非线性过程可用于减少脉冲噪声或椒盐噪声
双边滤波器:边缘保留和降噪平滑。简单来说,过滤器有助于减少或去除亮度或颜色随机变化的噪声,这称为平滑。
特征检测

特征检测是一种通过计算图像信息的抽象,在每个图像点上做出局部决策的方法。例如,对于一张脸的图像,特征是眼睛、鼻子、嘴唇、耳朵等,我们尝试识别这些特征。让我们首先尝试识别图像的边缘。
边缘检测


http://pic4.zhimg.com/v2-5f9257e4e4049d880c778cf998cc32b7_r.jpg
这里我们使用 Canny 边缘检测器,它是一种边缘检测算子,它使用多阶段算法来检测图像中的各种边缘。它由 John F. Canny 于 1986 年开发。我不会详细介绍 Canny 的工作原理,但这里的关键点是它用于提取边缘。要了解有关其工作的更多信息,你可以查看:https://towardsdatascience.com/canny-edge-detection-step-by-step-in-python-computer-vision-b49c3a2d8123
在使用 Canny 边缘检测方法检测边缘之前,我们平滑图像以去除噪声。正如你从图像中看到的,平滑后我们得到清晰的边缘。
轮廓

http://pic1.zhimg.com/v2-389bfc488c00c983d3af09acf2d239a0_r.jpg
侵蚀,使用用于探测和降低包含在图像中的形状的结构元素的侵蚀操作。
膨胀:将像素添加到图像中对象的边界,与侵蚀相反

http://pic1.zhimg.com/v2-67f5aaa3f0b933fc40c92e63153e4920_r.jpg

http://pic2.zhimg.com/v2-7e94c4b3237dbf7d6f813930aef918f5_r.jpg
总结

我们看到了如何读取和显示图像、在图像上绘制形状、文本、混合两个图像、旋转、缩放、平移等变换图像,使用高斯模糊、中值模糊、双边模糊过滤图像,以及检测使用 Canny 边缘检测和在图像中查找轮廓的特征。
需要数据和代码的评论【我想要】,这边会立马发送给大家,不发直播倒立。(另外还有人工智能资料包领取)
[人工智能资料包大纲]

[*]【第①部分】超详细的人工智能学习路线
[*]【第②部分】人工智能必看书籍(AI宝藏电子书这里都有)
[*]【第③部分】60份人工智能行业报告(想了解人工智能行业前景就看这!)
[*]【第④部分】人工智能快速入门视频教程合集
[*]【第⑤部分】计算机视觉应用项目及其源码
[*]【第⑥部分】自然语言处理应用项目及其源码
[*]【第⑦部分】人工智能论文大合集
[*]【第⑧部分】人工智能学习资源网站整理(找论文、找代码、找AI大佬前辈必备)
[*]【第⑨部分】国内外优质学习资源大整合(再也不用自己到处搜刮资料了)

huayuqing 发表于 2023-10-4 20:06:44

我想要

xiaoji1543 发表于 2023-10-4 20:07:07

发了

taihom 发表于 2023-10-4 20:07:46

我想要

pbk8495 发表于 2023-10-4 20:08:43

发了

lqxxql 发表于 2023-10-4 20:09:38

我想要

★小柯★ 发表于 2023-10-4 20:10:32

发了

alleles 发表于 2023-10-4 20:11:25

我想要

zcheng5979640 发表于 2023-10-4 20:11:33

发了

huayuqing 发表于 2023-10-4 20:12:21

我想要
页: [1] 2 3
查看完整版本: 2022最新计算机视觉学习路线(入门篇)