视觉通路
• 我们介绍的第一个概念是视觉通路。
• 视觉信号进入眼球后,到达的第一层神经元就是视网膜,在这里,视觉信号被转换为电信号,这里大约有百万量级的信号。
• 这些信号经过处理后,通过视交叉进入视觉皮层,进行视觉信号处理。这个通道叫做视觉通路。
• 视觉通路上,信号基本不发生变化,主要是信号传导。与我们介绍过的神经网络输入层非常类似。
视觉皮层
• 神经电信号进入视觉皮层后,分多次、多层处理。每层处理不同的特征,如:
– V1 处理简单视觉 – V2 处理图形边缘轮廓
– V3 传递信息 – V4 处理颜色
• 这种网络形式有鲜明的特点。

视觉皮层处理信号的特点
• 整个视觉神经网络分为多层,实现多种特征的提取和抽象。层级越高,所得到的信号越抽象、越密集。
• 但在每一层中,处理信息的方式有本质区别。视觉皮层的每一层中,并不是以单一神经元为单位,而是存在大量的 “神经元团”,每个“团”都能独立处理视觉信号,提取当前层的某种特征。
• 最后,经过视觉皮层分析,可以将百万量级的信息压缩为数百神经元表示的抽象信息。
视觉皮层与图像卷积
• 视觉皮层的处理方式非常类似图像的“卷积”运算。
– 原始的视觉信号可以看做一个二维数据。
– 少数视觉神经元以“卷积”运算的形式处理原始信号。即卷积核。
– 经过卷积后,原始信号的某种特定的视觉特征被表示为较少的信息。
– 实现信息压缩和抽象。

卷积的物理意义
– 这里我们提出了“卷积”运算的概念。
– 那么究竟什么是卷积呢?
– 我们简要介绍一下卷积的物理意义。
• 我们仍然以这张图为例
– 对于某个处理信号的系统而言,卷积相当于输入信号 f 与处理方法 h 在所有情况下的逐一处理,并将结果加权输出。
– 如果处理方法 h 很“小”,而信号 f 很“大”,那么卷积相当于用某种“刷子”把原始信号“刷”了一遍。得到的输出信息与“刷子”上每个单元的“权重”息息相关。





卷积神经网络的基本思想
• 现在,我们了解了视觉信号处理和图像卷积
– 视觉信号的处理模式:多层、每层有特定功能
– 图像的卷积:小刷子刷大图,得到特定效果
• 两者对比,可以发现:
– 图像的卷积,很类似视觉皮层对图像进行某种特定功能的处理。
– 比如,通用的“soble 卷积核”,对一切图像都能提取边缘。很类似视觉皮层的某个层。
• 如果将大量图像卷积放在一起,堆叠若干层,是否可以模拟大脑的视觉处理过程?这就是卷积神经网络的思路。



















