(一)计算机视觉
内涵丰富,涉及多方面内容。它与人类视觉密切相关,人类通过视觉获取外界信息的80%,而计算机视觉则旨在模拟这一过程,使机器能够“看懂”世界。
简单来说,计算机视觉解决的主要问题是:给出一张二维图像或视频,计算机视觉系统必须识别出图像或视频中的对象及其特征,如形状、纹理、颜色、大小、空间排列、姿态、运动等,从而尽可能完整地描述、存储、识别与理解该图像。
计算机视觉与图像处理、机器视觉既有联系又有区别。图像处理侧重于优化图像效果,机器视觉则专注于工业领域的自动检测和分析,而计算机视觉更广泛地应用于多个领域,如人脸识别、自动驾驶等。
(二)计算机视觉的发展历程
20世纪50年代,计算机视觉在模式识别领域起步,主要分析二维平面图像。60年代,三维场景理解开始出现。70至90年代,理论和技术进一步完善,马尔提出的视觉计算理论成为里程碑。21世纪以来,计算机视觉技术爆发式增长,与计算机图形学、计算摄像技术、机器学习等新技术深度融合,显著提升了目标识别性能,在智能监控、自动驾驶等领域广泛应用。然而,计算机视觉仍处于初级阶段,与人类视觉能力相比还有很大差距。
(三)计算机视觉的工作原理
包括图像获取、处理和理解三个步骤,涉及图像数据处理层、图像特征描述层和图像知识获取层。
1. 图像数据处理层
包括了图像信息采集和图像预处理,主要是对图像像素或者频域的数字信号进行相应处理,例如图像获取、传输、压缩、降噪、转换、存储、增强和复原等操作。
2. 图像特征描述层
主要是将这些带有特征的图像进行检测识别,图像特征包括了形状、颜色、空间位置、频域纹理、运动等,需要进行特征点定位和图像分割。若干底层特征组成更上一层的特征,这样经过多个层级的组合后,在顶层做出分类。
3. 图像知识获取层
重点关注如何将所得到的图像特征“翻译”为描述其内容的语义信息,即构建图像特征与语义信息之间的关系,主要包括图像匹配和机器学习。常用的图像知识学习的算法有模板匹配、神经网络、卷积神经网络等。
其典型任务包括目标分类、物体识别与检测、语义分割和运动跟踪等,这些任务在智能监控、自动驾驶等领域有广泛应用。

