学习
难道我们不是自己创造的地球上拥有至高无上地位的继承人?每日都为他们的组织增添美和优雅,每日都赋予他们更优秀的技能和越来越多的自制力与自动能力。还有什么比智慧更好呢?
塞缪尔·巴特勒,英国作家
大脑的主要活动是进行自我改造。
马文·明斯基,《心智社会》
到目前为止,我们已检查了如何识别(感觉的、知觉的)模式以及如何回忆模式序列(对于事物、人以及事件的记忆)。然而,大脑新皮质中并不是生来就充满这些模式。在大脑创建之时,大脑新皮质还是尚未开垦的处女地。它有学习的能力,因此也能在模式识别器之间建立联系,但这些联系都是从经验中获得的。
这个学习过程甚至在我们出生之前就开始了,与大脑生长的实际生理过程同时发生。一个月时,胎儿已有了大脑,但本质上是爬行动物的大脑,因为胎儿在子宫中经历了生物进化的高速改造。母亲怀孕6~9个月时,胎儿的大脑才成为具备人类大脑新皮质的人类大脑。这时,胎儿正在接收感受,大脑新皮质正在学习。他能听到声音,特别是母亲的心跳,这可能是音乐有节奏这一特点普遍存在于人类文化中的一个原因。迄今发现的每种人类文明都将音乐作为其文化的一部分,这与其他艺术形式不同,例如绘画艺术。另外,音乐的节拍也与我们的心率接近。当然,音乐节拍会改变——否则音乐就不能让我们对它保持兴趣,但是心率也会改变。过于规则的心跳是心脏患病的一个征兆。在孕后26周,胎儿的眼睛半张,到孕后28周时,胎儿的眼睛大部分时间都是完全睁开的。在子宫内也许没什么可看的,但随着大脑新皮质开始进行工作,子宫内的胎儿已经开始知悉明暗的区别。
不过,尽管胎儿能够在子宫中获得一些经验,但仍然是有限的。大脑新皮质也可以向旧脑学习(第5章的一个主题),但婴儿出生时通常还有很多东西要学习——从基本的原始声音和形态到隐喻和讽刺的一切事物。
学习对人类智力而言十分重要。如果我们要完整地塑造和模拟人类大脑新皮质(就像蓝脑计划[BlueBrain Project]尝试的那样)以及它要运行的其他大脑区域(例如海马体和丘脑),那么能做的实在不多——就像一个刚出生的婴儿不能做什么一样(除了变得可爱,当然,这是很重要的生存适应行为)。
学习和识别同时发生。只要我们开始学习,并且只要我们学会一个模式,就马上开始对其进行识别。大脑新皮质不断尝试理解所接收到的信息。如果一个特定层级不能完全处理并识别模式,这一模式就会被传送到相邻更高层级处理。如果所有层级都不能成功识别某个模式,那该模式就会被视为新模式。将一个模式归类为新模式并不意味着它必须方方面面都是新的。如果我们正欣赏某个艺术家的画作,并看到猫脸上有个大象的鼻子,虽然我们能识别每个明显的特点,但还是会注意到这种组合模式是某种新颖的事物,并可能会记住它。大脑新皮质的高概念层级能理解背景,例如,这幅图是某个艺术家的作品,我们正在参加那个艺术家的新画展开幕式,还会记录猫-象脸中不寻常的模式组合,但也会收集背景的细节作为另外的记忆模式。
新记忆,如猫-象脸,会存储在一个有效的模式识别器中。在这个过程中,海马体将发挥作用——我们将在第4章中讨论已知的实际生理机制。为了构建大脑新皮质模型,未被识别的模式作为新模式被存储起来,并且恰当地与低层级模式联系起来,正是低层级模式形成了这些模式。例如,存储猫-象脸有几种不同的方式:新颖的脸部布局会被存储,还有背景记忆,包括艺术家、情景,也许还有我们刚看到时发笑的事实。
成功识别的记忆也许会引发新模式的创造,以实现更大的冗余。如果模式未被完整识别,那就可能被当成反映所识别内容的不同视角而被存储起来。
那么,决定存储哪些模式的整体方法是什么呢?在数学方面,问题可作如下阐述:我们如何才能利用有效的模式存储限制,最好地展现已有的输入模式?然而,允许存在一定量的冗余是有意义的,但用重复的模式填满整个可用的存储区域(即整个大脑新皮质)就不实际了。因为这样就不允许模式有足够的多样性。我们经历了无数次像口语词中[E]音位这样的模式。它是声音频率的简单模式,在我们的大脑新皮质中占有重要的冗余。我们可以用[E]音位重复的模式来填满整个大脑新皮质。然而,若存在一个有用冗余的限制,像这样常见的模式就会受到限制。
名为“线性规划”(linear programming)的优化问题有一个数学解决方案,为有限资源(在这里是数量有限的模式识别器)作出最佳分配,以表示系统训练过的所有情形。线性规划是为一维输入系统设计的,而用线性输入串代表每个模式识别模块的输入最理想。在软件系统中,我们可以利用这个数学方法,尽管真实大脑在很大程度上被物理联系束缚,但仍可在模式识别器之间调整,因此该方法仍然可行。
这个最佳方案的重要意义是,一般经验会被识别但并不会产生永久记忆。至于散步,我经历过各个层级的数百万个模式,从基本的视觉边缘和阴影到事物,如我经过的灯柱、邮箱、路人、动物和植物。
基本上,我所经历的都不是独一无二的,而且我早已识别过的模式都已达到最佳水平的冗余。结果,这次散步我没什么可回忆的。等我再散步几次时,我仅存的一点记忆也可能被新模式覆盖——除了我现在记得的这次散步,因为我已写下来了。
既适用于我们的大脑新皮质也适用于模拟大脑新皮质的一条重要原则是,很难同时学习多个概念层级的。实质上,我们只能同时学习一个或者至多两个概念层级,只有学习过程相对稳定,才能继续学习下一个层级。我们也许还要继续对较低层级的学习进行微调,但接下来的抽象层级才是重点。这既适用于生命的开始阶段,也适用于生命的后续阶段,像新生儿努力接受基本形态,像我们努力学习新事物,每次都是一个复杂的层级。
我们在大脑新皮质的机器模拟中也发现了相同的现象。可是,如果每次每层向它们呈现的是越来越抽象的材料,那机器是能做到像人类那样的学习(尽管机器学习的概念层级还没有人类那么多)。
一个模式的输出能反馈到一个较低层级的模式或者这个模式本身,这就赋予了人脑强大的递归能力。模式的因素可以是基于另一个模式的决策点。这对组成动作的列表特别有用——例如,如果牙膏没了就要拿另一个来,每个层级都存在这样的条件句[14]。每个试过在电脑上编程的人都知道,条件句对于描述一个行动过程来说至关重要。