近期网站停站换新具体说明
按以上说明时间，延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间

主题：【文摘】惊人的假说 --灵魂的科学探索 -- foundera

共:💬23 🌺1

老大河待整

全看树展主题 · 分页首页上页下页末页

复第十二章脑损伤

家园

第十三章神经网络

第十三章神经网络

“……我相信，对一个模型的最好的检验是它的设计者能否回答这些问题：‘现在你知道哪些原本不知道的东西？’以及‘你如何证明它是否是对的？’”

――詹姆斯?鲍尔（James M. Bower)

神经网络是由具有各种相互联系的单元组成的集合。每个单元具有极为简化的神经元的特性。神经网络常常被用来模拟神经系统中某些部分的行为，生产有用的商业化装置以及检验脑是如何工作的一般理论。

神经科学家们究竟为什么那么需要理论呢？如果他们能了解单个神经元的确切行为，他们就有可能预测出具有相互作用的神经元群体的特性。令人遗憾的是，事情并非如此轻而易举。事实上，单个神经元的行为通常远不那么简单，而且神经元几乎总是以一种复杂的方式连接在一起。此外，整个系统通常是高度非线性的。线性系统，就其最简单形式而言，当输入加倍时，它的输出也严格加倍――即输出与输入呈比例关系。①例如，在池塘的表面，当两股行进中的小湍流彼此相遇时，它们会彼此穿过而互不干扰。为了计算两股小水波联合产生的效果，人们只需把第一列波与第二列波的效果在空间和时间的每一点上相加即可。这样，每一列波都独立于另一列的行为。对于大振幅的波则通常不是这样。物理定律表明，大振幅情况下均衡性被打破。冲破一列波的过程是高度非线性的：一旦振幅超过某个阈值，波的行为完全以全新的方式出现。那不仅仅是“更多同样的东西”，而是某些新的特性。非线性行为在日常生活中很普遍，特别是在爱情和战争当中。正如歌中唱的：“吻她一次远不及吻她两次的一半那么美妙。”

如果一个系统是非线性的，从数学上理解它通常比线性系统要困难得多。它的行为可能更为复杂。因此对相互作用的神经元群体进行预测变得十分困难，特别是最终的结果往往与直觉相反。

高速数字计算机是近50年来最重要的技术发展之一。它时常被称作冯. 诺依曼计算机，以纪念这位杰出的科学家、计算机的缔造者。由于计算机能像人脑一样对符号和数字进行操作，人们自然地想像脑是某种形式相当复杂的冯?诺依曼计算机。这种比较，如果陷入极端的话，将导致不切实际的理论。

计算机是构建在固有的高速组件之上的。即便是个人计算机，其基本周期，或称时钟频率，也高于每秒1000万次操作。相反地，一个神经元的典型发放率仅仅在每秒 100个脉冲的范围内。计算机要快上百万倍。而像克雷型机那样的高速超级计算机速度甚至更高。大致说来，计算机的操作是序列式的，即一条操作接着一条操作。与此相反，脑的工作方式则通常是大规模并行的，例如，从每只眼睛到达脑的轴突大约有100 万个，它们全都同时工作。在系统中这种高度的并行情况几乎重复出现在每个阶段。这种连线方式在某种程度上弥补了神经元行为上的相对缓慢性。它也意味着即使失去少数分散的神经元也不大可能明显地改变脑的行为。用专业术语讲，脑被称作“故障弱化”（degrade gracefully) 。而计算机则是脆弱的，哪怕是对它极小的损伤，或是程序中的一个小错误，也会引起大的灾难。计算机中出现错误则是灾难性的（degrade catastrophically)。

计算机在工作中是高度稳定的。因为其单个组件是很可靠的，当给定相同的输入时通常产生完全同样的输出。反之，单个神经元则具有更多的变化。它们受可以调节其行为的信号所支配，有些特性边“计算”边改变。

一个典型的神经元可能具有来自各处的上百乃至数万个输入，其轴突又有大量投射。而计算机的一个基本元件――晶体管，则只有极少数的输入和输出。

在计算机中，信息被编码成由0和1组成的脉冲序列。计算机通过这种形式高度精确地将信息从一个特定的地方传送到另一个地方。信息可以到达特定的地址，提取或者改变那里所贮存的内容。这样就能够将信息存入记忆体的某个特殊位置，并在以后的某些时刻进一步加以利用。这种精确性在脑中是不会出现的。尽管一个神经元沿它的轴突发送的脉冲的模式（而不仅仅是其平均发放率）可能携带某些信息，但并不存在精确的由脉冲编码的信息。①这样，记忆必然将以不同的形式“存贮”。

脑看起来一点也不像通用计算机。脑的不同部分，甚至是新皮层的不同部分，都是专门用来处理不同类型的信息的（至少在某种程度上是这样的）。看来大多数记忆存贮在进行当前操作的那个地方。所有这些与传统的冯?诺依曼计算机完全不同，因为执行计算机的基本操作（如加法.乘法等等）仅在一个或少数几个地方，而它的记忆却存贮在许多很不同的地方。

最后，计算机是由工程师精心设计出来的，而脑则是动物经自然选择一代又一代进化而来的。这就产生了如第一章所述的本质上不同的设计形式。

人们习惯于从硬件和软件的角度来谈论计算机。由于人们编写软件（计算机程序）时几乎不必了解硬件（回路等）的细节，所以人们――特别是心理学家――争论说没必要了解有关脑的“硬件”的任何知识。实际上想把这种理论强加到脑的操作过程中是不恰当的，脑的硬件与软件之间并没有明显的差异。对于这种探讨的一种合理的解释是，虽然脑的活动是高度并行的，在所有这些平行操作的顶端有某些形式的（由注意控制的）序列机制，因而，在脑的操作的较高层次，在那些远离感觉输入的地方，可以肤浅地说脑与计算机有某种相似之处。

人们可以从一个理论途径的成果来对它作判断。计算机按编写的程序执行，因而擅长解决诸如大规模数字处理、严格的逻辑推理以及下棋等某些类型的问题。这些事情大多数人都没有它们完成得那么快、那么好。但是，面对常人能快速、不费气力就能完成的任务，如观察物体并理解其意义，即便是最现代的计算机也显得无能为力。

近几年在设计新一代的、以更加并行方式工作的计算机方面取得了重要进展。大多数设计使用了许多小型计算机，或是小型计算机的某些部件。它们被连接在一起，并同时运行。由一些相当复杂的设备来处理小计算机之间的信息交换并对计算进行全局控制。像天气预测等类似问题，其基本要素在多处出现。此时超级计算机特别有用。

人工智能界也采取了行动设计更具有脑的特点的程序。他们用一种模糊逻辑取代通常计算中使用的严格的逻辑。命题不再一定是真的或假的，而只需是具有更大或更小的可能性。程序试图在一组命题中发现具有最大可能性的那种组合，并以之作为结论，而不是那些它认为可能性较小的结论。

在概念的设置上，这种方法确实比早期的人工智能方法与脑更为相像，但在其他方面，特别是在记忆的存贮上，则不那么像脑。因此，要检查它与真实的脑在所有层次上行为的相似性可能会有困难。

一群原先很不知名的理论工作者发展了一种更具有脑的特性的方法。如今它被称为PDP方法（即平行分布式处理）。这个话题有很长的历史，我只能概述一二。在1943 年沃仑?麦卡洛克（Warrenc McCulloch）和沃尔特?皮兹（Walter Pitts）的工作是这方面最早的尝试之一。他们表明，在原则上由非常简单的单元连接在一起组成的“网络”可以对任何逻辑和算术函数进行计算。因为网络的单元有些像大大简化的神经元，它现在常被称作“神经网络”。

这个成就非常令人鼓舞，以致它使许多人受到误导，相信脑就是这样工作的。或许它对现代计算机的设计有所帮助，但它的最引人注目的结论就脑而言则是极端错误的。

下一个重要的进展是弗兰克?罗森布拉特（Frank Rosenblatt）发明的一种非常简单的单层装置，他称之为感知机（Perceptron)。意义在于，虽然它的连接最初是随机的，它能使用一种简单而明确的规则改变这些连接，因而可以教会它执行某些简单的任务，如识别固定位置的印刷字母。感知机的工作方式是，它对任务只有两种反应：正确或是错误。你只需告诉它它所作出的（暂时的）回答是否正确。然后它根据一种感知机学习规则来改变其连接。罗森布拉特证明，对于某一类简单的问题――“线性可分”的问题――感知机通过有限次训练就能学会正确的行为。

由于这个结果在数学上很优美，从而吸引了众人的注目。只可惜它时运不济，它的影响很快就消退了。马文?明斯基（MarVinMinsky) 和西摩?佩伯特（Segmour Papert)证明感知机的结构及学习规则无法执行“异或问题”（如，判断这是苹果还是桔子，但不是二者皆是），因而也不可能学会它。他们写了一本书，通篇详述了感知机的局限性。这在许多年内扼杀了人们对感知机的兴趣（明斯基后来承认做得过分了）。此问大部分工作将注意力转向人工智能方法。①

用简单单元构建一个多层网络，使之完成简单的单层网络所无法完成的异或问题（或类似任务），这是可能的。这种网络必定具有许多不同层次上的连接，问题在于，对哪些最初是随机的连接进行修改才能使网络完成所要求的操作。如果明斯基和佩伯特为这个问题提供了解答，而不是把感知机打入死路的话，他们的贡献会更大些。

下一个引起广泛注意的发展来自约翰?霍普菲尔德（John Hop- field)，一位加利福尼亚州理工学院的物理学家，后来成为分子生物学家和脑理论家。1982年他提出了一种网络，现在被称为霍普菲尔德网络( 见图53）。这是一个具有自反馈的简单网络。每个单元只能有两种输出：一1（表示抑制）或十1（表示兴奋）。但每个单元具有多个输入。每个连接均被指派一个特定的强度。在每个时刻单元把来自它的全部连接的效果(2)总和起来。如果这个总和大于0则置输出状态为十1（平均而言，当单元兴奋性输入大于抑制性输人时，则输出为正），否则就输出一1。有些时候这意味着一个单元的输出会因为来自其他单元的输入发生了改变而改变。

尽管如此，仍有不少理论工作者默默无闻地继续工作。这其中包括斯蒂芬. 格罗斯伯格（stephen Grossberg），吉姆?安德森（Jim Anderson），托伊沃. 科霍宁（Teuvo Kohonen）和戴维?威尔肖（Devid Willshaw）。(2)每个输入对单元的影响是将当前的输入信号（+1 或-1）与其相应的权值相乘而得到的。（如果当前信号是-1，权重是+2，则影响为-2。）

计算将被一遍遍地反复进行，直到所有单元的输出都稳定为止。①在霍普菲尔德网络中，所有单元的状态并不是同时改变的，而是按随机次序一个接一个进行，霍普菲尔德从理论上证明了，给定一组权重（连接强度）以及任何输入，网络将不会无限制地处于漫游状态，也不会进入振荡，而是迅速达到一个稳态。①

霍普菲尔德的论证令人信服，表达也清晰有力。他的网络对数学家和物理学家有巨大的吸引力，他们认为终于找到了一种他们可以涉足脑研究的方法（正如我们在加利福尼亚州所说的）。虽然这个网络在许多细节上严重违背生物学，但他们并不对此感到忧虑。

如何调节所有这些连接的强度呢？194年，加拿大心理学家唐纳德?赫布（Donald Hebb）出版了《行为的组织》一书。当时人们就像现在一样普遍相信，在学习过程中，一个关键因素是神经元的连接（突触）强度的调节。赫布意识到，仅仅因为一个突触是活动的，就增加其强度，这是不够的。他期望一种只在两个神经元的活动相关时才起作用的机制。他的书中有一个后来被广泛引用的段落：“当细胞A的一个轴突和细胞B 很近，足以对它产生影响，并且持久地、不断地参与了对细胞B 的兴奋，那么在这两个细胞或其中之一会发生某种生长过程或新陈代谢变化，以致于A作为能使B 兴奋的细胞之一，它的影响加强了。”这个机制以及某些类似规则，现在称为“赫布律”。

霍普菲尔德在他的网络中使用了一种形式的赫布规则来调节连接权重。对于问题中的一种模式，如果两个单元具有相同的输出，则它们之间的相互连接权重都设为+1。如果它们具有相反的输出，则两个权重均设为-1。大致他说，每个单元激励它的“朋友”并试图削弱它的“敌人”。

霍普菲尔德网络是如何工作的呢？如果网络输入的是正确的单元活动模式，它将停留在该状态。这并没有什么特别的，因为此时给予它的就是答案。值得注意的是，如果仅仅给出模式的一小部分作为“线索”，它在经过短暂的演化后，会稳定在正确的输出即整个模式上，在不断地调节各个单元的输出之后，网络所揭示的是单元活动的稳定联系。最终它将有效地从某些仅仅与其存贮的“记忆”接近的东西中恢复出该记忆，此外，这种记忆也被称作是按“内容寻址”的――即它没有通常计算机中具有的分离的、唯一用于作为“地址”的信号。输入模式的任何可察觉的部分都将作为地址。这开始与人的记忆略微有些相似了。

请注意记忆并不必存贮在活动状态中，它也可以完全是被动的，因为它是镶嵌在权重的模式之中的即在所有各个单元之间的连接强度之中。网络可以完全不活动（所有输出置为0），但只要有信号输入，网络突然活动起来并在很短时间内进入与其应当记住的模式相对应的稳定的活动状态。据推测，人类长期记忆的回忆具有这种一般性质（只是活动模式不能永久保持）。你能记住大量现在一时想不起来的事情。

神经网络（特别是霍普菲尔德网络）能“记住”一个模式，但是除此以外它还能再记住第二个模式吗？如果几个模式彼此不太相似，一个网络是能够全部记住这几个不同模式，即给出其中一个模式的足够大的一部分，网络经过少数几个周期后将输出该模式。因为任何一个记忆都是分布在许多连接当中的，所以整个系统中记忆是分布式的。因为任何一个连接都可能包含在多个记忆中，因而记忆是可以叠加的。此外，记忆具有鲁棒性，改变少数连接通常不会显著改变网络的行为。

为了实现这些特性就需要付出代价，这不足为奇。如果将过多的记忆加到网络之中则很容易使它陷入混乱。即使给出线索，甚至以完整的模式作为输入，网络也会产生毫无意义的输出。①

有人提出这是我们做梦时出现的现象（弗洛伊德称之为“凝聚”――condensation），但这是题外话。值得注意的是，所有这些特性是“自然发生”的。它们并不是网络设计者精心设置的，而是由单元的本性、它们连接的模式以及权重调节规则所决定的。

霍普菲尔德网络还有另一个性质，即当几个输人事实上彼此大致相似时，在适当计算网络的连接权重后，它“记住”的将是训练的模式的某种平均。这是另一个与脑有些类似的性质。对我们人类而言，当我们听某个特定的声调时，即便它在一定范围内发生变化，我们也会觉得它是一样的。输入是相似但不同的，而输出――我们所听到的――则是一样的。

这些简单网络是不能和脑的复杂性相提并论的，但这种简化确实使我们可能对它们的行为有所了解，即使是简单网络中出现的特点也可能出现在具有相同普遍特性的更复杂的网络中，此外，它们向我们提供了多种观点，表明特定的脑回路所可能具有的功能。例如，海马中有一个称为CA3的区域，它的连接事实上很像一个按内容寻址的网络。当然，这是否正确尚需实验检验。

有趣的是，这些简单的神经网络具有全息图的某些特点。在全息图中，几个影像可以彼此重叠地存贮在一起；全息图的任何一部分都能用来恢复整个图像，只不过清晰度会下降；全息图对于小的缺陷是鲁棒的。对脑和全息图两者均知之甚少的人经常会热情地支持这种类比。几乎可以肯定这种比较是没有价值的。原因有两个。详细的数学分析表明神经网络和全息图在数学上是不同的。更重要的是，虽然神经网络是由那些与真实神经元有些相似的单元构建的，没有证据表明脑中具有全息图所需的装置或处理过程。（1）

一本更新的书产生了巨大的冲击力，这就是戴维?鲁梅尔哈特（David Rumelhart）、詹姆斯?麦克莱兰（James McClelland）和PDP小组所编的一套很厚的两卷著作《平行分布式处理》（1)。该书于1986年问世，并很快至少在学术界成为最畅销书。名义上我也是PDP小组的成员，并和浅沼智行（Chiko Asanuma）合写了其中的一个章节。不过我起的作用很小。我几乎只有一个贡献，就是坚持要求他们停止使用神经元一词作为他们网络的单元。

加利福尼亚州立大学圣迭戈分校心理系离索尔克研究所仅有大约一英里。在70年代末80年代初我经常步行去参加他们的讨论小组举行的小型非正式会议。那时我时常漫步的地方如今已变成了巨大的停车场。生活的步伐越来越快，我现在已改为驱车飞驰于两地之间了。

研究小组当时是由鲁梅尔哈特和麦克莱兰领导的，但是不久麦克莱兰就离开前往东海岸了。他们俩最初都是心理学家，但他们对符号处理器感到失望并共同研制了处理单词的“相互作用激励器”的模型。在克里斯托夫?朗格特-希金斯（Christopher Longuet-Higgins）的另一位学生杰弗里?希尔顿（Geoffrey Hinton）的鼓励下，他们着手研究一个更加雄心勃勃的“联结主义”方案。他们采纳了平行分布式处理这个术语，因为它比以前的术语――联想记忆②――的覆盖面更广。

在人们发明网络的初期，一些理论家勇敢地开始了尝试。他们把一些仍显笨拙的小型电子回路（其中常包括有老式继电器）连接在一起来模拟他们的非常简单的网络。现在已发展出了复杂得多的神经网络，这得益于现代计算机的运算速度得到了极大的提高，也很便宜。现在可以在计算机（这主要是数字计算机）上模拟检验关于网络的新思想，而不必像早期的研究那样仅靠粗糙的模拟线路或是用相当困难的数学论证。

1986年出版的《平行分布式处理》一书从1981年底开始经过了很长时间的酝酿。这很幸运，因为它是一个特殊算法的最新发展（或者说是它的复兴或应用），在其早期工作基础上，很快给人留下了深刻的印象。该书的热情读者不仅包括脑理论家和心理学家，还有数学家、物理学家和工程师，甚至有人工智能领域的工作者。不过后者最初的反应是相当敌视的。最终神经科学家和分子生物学家也对它的消息有所耳闻。

该书的副标题是“认知微结构的探索”。它是某种大杂烩，但是其中一个的特殊的算法产生了惊人的效果。该算法现在称作“误差反传算法”，通常简称为“反传法”。为了理解这个算法，你需要知道一些关于学习算法的一般性知识。

在神经网络有些学习形式被称作是“无教师的”。这意味着没有外界输入的指导信息。对任何连接的改变只依赖于网络内部的局部状态。简单的赫布规则具有这种特点。与之相反，在有教师学习中，从外部向网络提供关于网络执行状况的指导信号。

无教师学习具有很诱人的性质，因为从某种意义上说网络是在自己指导自己。理论家们设计了一种更有效的学习规则，但它需要一位“教师”来告诉网络它对某些输入的反应是好、是差还是很糟。这种规则中有一个称作“δ律”。

训练一个网络需要有供训练用的输入集合，称作“训练集”。很快我们在讨论网络发音器（NETtalk）时将看到一个这样的例子。这有用的训练集必须是网络在训练后可能遇到的输入的合适的样本。通常需要将训练集的信号多次输入，因而在网络学会很好地执行之前需要进行大量的训练。其部分原因是这种网络的连接通常是随机的。而从某种意义上讲，脑的初始连接是由遗传机制控制的，通常不完全是随机的。

网络是如何进行训练的呢？当训练集的一个信号被输入到网络中，网络就会产生一个输出。这意味着每个输出神经元都处在一个特殊的活动状态。教师则用信号告诉每个输出神经元它的误差，即它的状态与正确之间的差异，δ这个名称便来源于这个真实活动与要求之间的差异（数学上δ常用来表示小而有限的差异）。网络的学习规则利用这个信息计算如何调整权重以改进网络的性能。

Adaline网络是使用有教师学习的一个较早的例子。它是1960年由伯纳德?威德罗（Bernard widrow）和霍夫（M.E.Hoff）设计的，因此δ律又称作威德罗-霍夫规则。他们设计规则使得在每一步修正中总误差总是下降的。①这意味着随着训练过程网络最终会达到一个误差的极小值。这是毫无疑问的，但还不能确定它是真正的全局极小还是仅仅是个局域极小值。用自然地理的术语说就是，我们达到的是一个火山口中的湖，还是较低的池塘。海洋，还是像死海那样的凹下去的海（低于海平面的海）？

训练算法是可以调节的，因而趋近局域极小的步长可大可小。如果步长过大，算法会使网络在极小值附近跳来跳去（开始时它会沿下坡走，但走得太远以致又上坡了）。如果步子小，算法就需要极长的时间才能达到极小值的底端。人们也可以使用更精细的调节方案。

反传算法是有教师学习算法中的一个特殊例子。为了让它工作，网络的单元需要具有一些特殊性质。它们的输出不必是二值的（即，或0，或者＋1或-1），而是分成若干级。它通常在0到+1之间取值。理论家们盲目地相信这对应于神经元的平均发放率（取最大发放率为＋1），但他们常常说不清应该在什么时候取这种平均。

如何确定这种“分级”输出的大小呢？像以前一样，每个单元对输入加权求和，但此时不再有一个真实的阈值。如果总和很小，输出几乎是0。总和稍大一些时，输出便增加。当总和很大时，输出接近于最大值。图54所示的S形函数（sigmoid函数）体现了这种输入总和与输出间的典型关系。如果将一个真实神经元的平均发放率视为它的输出，那么它的行为与此相差不大。

这条看似平滑的曲线有两个重要性质。它在数学上是“可微的”，即任意一处的斜率都是有限的；反传算法正依赖于这个特性。更重要的是，这条曲线是非线性的，而真实神经元即是如此。当（内部）输入加倍时输出并不总是加倍。这种非线性使得它能处理的问题比严格的线性系统更加广泛。

现在让我们看一个典型的反传网络。它通常具有三个不同的单元层（见图55）。最底层是输入层。下一层被称作“隐单元”层，因为这些单元并不直接与网络外部的世界连接。最顶层是输出层。最底层的每个单元都与上一层的所有单元连接。中间层也是如此。网络只有前向连接，而没有侧向连接，除了训练以外也没有反向的投射。它的结构几乎不能被简化。

训练开始的时候，所有的权重都被随机赋值，因而网络最初对所有信号的反应是无意义的。此后给定一个训练输入，产生输出并按反传训练规则调节权重。过程如下：在网络对训练产生输出以后，告诉高层的每个单元它的输出与“正确”输出之间的差。单元利用该信息来对每个从低层单元达到它的突触的权重进行小的调整。然后它将该信息反传到隐层的每个单元。每个隐层单元则收集所有高层单元传未的误差信息，并以此调节来自最底层的所有突触。

从整体上看具体的算法使得网络总是不断调节以减小误差。这个过程被多次重复。（该算法是普适的，可以用于多于三层的前向网络。）

经过了足够数量的训练之后网络就可以使用了。此时有一个输入的测试集来检验网络。测试集是经过选择的，它的一般（统计）特性与训练集相似，但其他方面则不同。（权重在这个阶段保持不变，以便考察训练后网络的行为。）如果结果不能令人满意，设计者会从头开始，修改网络的结构、输入和输出的编码方式、训练规则中的参数或是训练总数。

所有这些看上去显得很抽象。举个例子或许能让读者清楚一些。特里?塞吉诺斯基和查尔斯?罗森堡（Charles Rosenberg）在1987年提供了一个著名的演示。他们把他们的网络称为网络发音器（NETtalk）。它的任务是把书写的英文转化成英文发音。英文的拼法不规则,这使它成为一门发音特别困难的语言，因而这个任务并不那么简单易行。当然，事先并不把英语的发音规则清楚地告诉网络。在训练过程中，网络每次尝试后将得到修正信号，网络则从中学习。输入是通过一种特殊的方式一个字母接一个字母地传到网络中。 NETtalk的全部输出是与口头发音相对应的一串符号，为了让演示更生动，网络的输出与一个独立的以前就有的机器（一种数字发音合成器）耦合。它能将NETtallk的输出变为发音，这样就可以听到机器“朗读”英语了。

由于一个英语字母的发音在很大程度上依赖于它前后的字母搭配，输入层每次读入一串7个字母。①输出层中的单元与音素所要求的21个发音特征②相对应，还有5个单元处理音节分界和重音。图56给出了它的一般结构。③

他们使用了两段文字的摘录来训练网络，每段文字都附有训练机器所需的标音法。第一段文字摘自梅里亚姆-韦伯斯特袖珍词典。第二段摘录则多少有些令人奇怪，是一个小孩的连续说话。初始权重具有小的随机值，并在训练期内每处理一个词更新一次。他们编写程序使得计算机能根据提供的输入和（正确的）输出信息自动地完成这一步。在对真实的输出进行判断时，程序会采纳一个与真实发音最接近的音素作为最佳猜测，通常有好几个“发音”输出单元对此有关系。

聆听机器学着“读”英语是一件令人着迷的事情。①最初，由于初始连接是随机的，只能听到一串令人困惑的声音。 NETtalk很快就学会了区分元音和辅音。但开始时它只知道一个元音和一个辅音，因此像在咿呀学语。后来它能识别词的边界，并能发出像词那样的一串声音。在对训练集进行了大约十次操作之后，单词变得清楚，读的声音也和幼儿说话很像了。

实际结果并不完美，在某种情况下英语发音依赖于词意，而NETtalk对此一无所知。一些相似的发音通常引起混淆，如论文（thesis)和投掷（throw）的“th”音。把同一个小孩的另一段例文作为检测，机器完成得很好，表明它能把从相当小的训练集（1024个单词）中学到的推广到它从未遇到的新词上。②这称为“泛化”。

显然网络不仅仅是它所训练过的每一个单词的查询表。它的泛化能力取决于英语发音的冗余度。并不是每一个英语单词都按自己唯一的方式发音，虽然首次接触英语的外国人容易这样想。（这个问题是由于英语具有两个起源造成的，即拉丁语系和日尔曼语系，这使得英语的词汇十分丰富。）

相对于大多数从真实神经元上收集的资料而言，神经网络的一个优点在于在训练后很容易检查它的每一个隐单元的感受野。一个字母仅会激发少数几个隐单元，还是像全息图那样它的活动在许多隐单元中传播呢？答案更接近于前者。虽然在每个字母一发音对应中并没有特殊的隐单元，但是每个这种对应并不传播到所有的隐单元。

因此便有可能检查隐单元的行为如何成簇的（即具有相同的特性）。塞吉诺斯基和罗森堡发现“……最重要的区别是元音与辅音完全分离，然而在这两类之中隐单元簇具有不同的模式，对于元音而言，下一个重要的变量是字母，而辅音成簇则按照了一种混合的策略，更多地依赖于它们声音的相似性。”

这种相当杂乱的布置在神经网络中是典型现象，其重要性在于它与许多真实皮层神经元（如视觉系统中的神经元）的反应惊人地相似，而与工程师强加给系统的那种巧妙的设计截然不同。

他们的结论是：

NETtalk是一个演示，是学习的许多方面的缩影。首先，网络在开始时具有一些合理的“先天”的知识，体现为由实验者选择的输入输出的表达形式，但没有关于英语的特别知识――网络可以对任何具有相同的字母和音素集的语言进行训练。其次，网络通过学习获得了它的能力，其间经历了几个不同的训练阶段，并达到了一种显著的水平。最后，信息分布在网络之中，因而没有一个单元或连接是必不可少的，作为结果，网络具有容错能力，对增长的损害是故障弱化的。此外，网络从损伤中恢复的速度比重新学习要快得多。

尽管这些与人类的学习和记忆很相似，但NETtalk过于简单，还不能作为人类获得阅读能力的一个好的模型。网络试图用一个阶段完成人类发育中两个阶段出现的过程，即首先是儿童学会说话；只有在单词及其含义的表达已经建立好以后，他们才学习阅读。同时，我们不仅具有使用字母-发音对应的能力，似乎还能达到整个单词的发音表达，但在网络中并没有单词水平的表达。注意到网络上并没有什么地方清楚地表达英语的发音规则，这与标准的计算机程序不同。它们内在地镶嵌在习得的权重模式当中。这正是小孩学习语言的方式。它能正确他说话，但对它的脑所默认的规则一无所知。①

NETtalk有几条特性是与生物学大为抵触的。网络的单元违背了一条规律，即一个神经元只能产生兴奋性或抑制性输出，而不会二者皆有。更为严重的是，照字面上说，反传算法要求教师信息快速地沿传递向前的操作信息的同一个突触发送回去。这在脑中是完全不可能发生的。试验中用了独立的回路来完成这一步，但对我而言它们显得过于勉强，并不符合生物原型。

尽管有这些局限性，NETtalk展示了一个相对简单的神经网络所能完成的功能，给人印象非常深刻。别忘了那里只有不足500个神经元和2万个连接。如果包括（在前面的脚注中列出的）某些限制和忽略，这个数目将会大一些，但恐怕不会大10倍。而在每一侧新皮层边长大约四分之一毫米的一小块表面（比针尖还小）有大约5000个神经元。因而与脑相比，NETtalk仅是极小的一部分。②所以它能学会这样相对复杂的任务给人印象格外深刻。

另一个神经网络是由西德尼?莱基（Sidney Lehky）和特里?塞吉诺斯基设计的。他们的网络所要解决的问题是在不知道光源方向的情况下试图从某些物体的阴影中推断出其三维形状（第四章描述的所谓从阴影到形状问题）。对隐层单元的感受野进行检查时发现了令人吃惊的结果。其中一些感受野与实验中在脑视觉第一区（V1区）发现的一些神经元非常相似。它们总是成为边缘检测器或棒检测器，但在训练过程中，并未向网络呈现过边或棒，设计者也未强行规定感受野的形状。它们的出现是训练的结果。此外，当用一根棒来测试网络时，其输出层单元的反应类似于V1区具有端点抑制（end-stopping）的复杂细胞。

网络和反传算法二者都在多处与生物学违背，但这个例子提出了这样一个回想起来应该很明显的问题：仅仅从观察脑中一个神经元的感受野并不能推断出它的功能，正如第十一章描述的那样，了解它的投射野，即它将轴突传向哪些神经元，也同样重要。

我们已经关注了神经网络中“学习”的两种极端情况：由赫布规则说明的无教师学习和反传算法那样的有教师学习。此外还有若干种常见的类型。一种同样重要的类型是“竞争学习”。①其基本思想是网络操作中存在一种胜者为王机制，使得能够最好地表达了输入的含义的那个单元（或更实际他说是少数单元）抑制了其他所有单元。学习过程中，每一步中只修正与胜者密切相关的那些连接，而不是系统的全部连接。这通常用一个三层网络进行模拟，如同标准的反传网络，但又有显著差异，即它的中间层单元之间具有强的相互连接。这些连接的强度通常是固定的，并不改变。通常短程连接是兴奋性的，而长程的则是抑制性的，一个单元倾向于与其近邻友好而与远处的相对抗。这种设置意味着中间层的神经元为整个网络的活动而竞争。在一个精心设计的网络中，在任何一次试验中通常只有一个胜者。

这种网络并没有外部教师。网络自己寻找最佳反应。这种学习算法使得只有胜者及其近邻单元调节输入权重。这种方式使得当前的那种特殊反应在将来出现可能性更大。由于学习算法自动将权重推向所要求的方向，每个隐单元将学会与一种特定种类的输入相联系。①

到此为止我们考虑的网络处理的是静态的输入，并在一个时间间隔后产生一个静态的输出。很显然在脑中有一些操作能表达一个时间序列，如口哨吹出一段曲调或理解一种语言并用之交谈。人们初步设计了一些网络来着手解决这个问题，但目前尚不深入。（NETtalk确实产生了一个时间序列，但这只是数据传入和传出网络的一种方法，而不是它的一种特性。）

语言学家曾经强调，目前在语言处理方面（如句法规则）根据人工智能理论编写的程序处理更为有效。其本质原因是网络擅长于高度并行的处理，而这种语言学任务要求一定程度的序列式处理。脑中具有注意系统，它具有某种序列式的本性，对低层的并行处理进行操作，迄今为止神经网络并未达到要求的这种序列处理的复杂程度，虽然它应当出现。

真实神经元（其轴突、突触和树突）都存在不可避免的时间延迟和处理过程中的不断变化。神经网络的大多数设计者认为这些特性很讨厌，因而回避它们。这种态度也许是错的。几乎可以肯定进化就建立在这些改变和时间延迟上，并从中获益。

对这些神经网络的一种可能的批评是，由于它们使用这样一种大体上说不真实的学习算法，事实上它们并不能揭示很多关于脑的情况。对此有两种答案。一种是尝试在生物学看来更容易接受的算法，另一种方法更有效且更具有普遍性。加利福尼亚州立大学圣迭戈分校的戴维?齐帕泽（David Zipser），一个由分子生物学家转为神经理论学家，曾经指出，对于鉴别研究中的系统的本质而言，反传算法是非常好的方法。他称之为“神经系统的身份证明”。他的观点是，如果一个网络的结构至少近似于真实物体，并了解了系统足够多的限制，那么反传算法作为一种最小化误差的方法，通常能达到一个一般性质相似于真实生物系统的解。这样便在朝着了解生物系统行为的正确方向上迈出了第一步。

如果神经元及其连接的结构还算逼真，并已有足够的限制被加入到系统中，那么产生的模型可能是有用的，它与现实情况足够相似。这样便允许仔细地研究模型各组成部分的行为。与在动物上做相同的实验相比，这更加快速也更彻底。

我们必须明白科学目标并非到此为止，这很重要。例如，模型可能会显示，在该模型中某一类突触需要按反传法确定的某种方式改变。但在真实系统中反传法并不出现。因此模拟者必须为这一类突触找到合适的真实的学习规则。例如，那些特定的突触或许只需要某一种形式的赫布规则。这些现实性的学习规则可能是局部的，在模型的各个部分不尽相同。如果需要的话，可能会引入一些全局信号，然后必须重新运行该模型。

如果模型仍能工作，那么实验者必须表明这种学习方式确实在预测的地方出现，并揭示这种学习所包含的细胞和分子机制以支持这个观点。只有如此我们才能从这些“有趣”的演示上升为真正科学的有说服力的结果。

所有这些意味着需要对大量的模型及其变体进行测试。幸运的是，随着极高速而又廉价的计算机的发展，现在可以对许多模型进行模拟。这样人们就可以检测某种设置的实际行为是否与原先所希望的相同，但即便使用最先进的计算机也很难检验那些人们所希望的巨大而复杂的模型。

“坚持要求所有的模型应当经过模拟检验，这令人遗憾地带来了两个副产品。如果一个的假设模型的行为相当成功，其设计者很难相信它是不正确的。然而经验告诉我们，若干差异很大的模型也会产生相同的行为。为了证明这些模型哪个更接近于事实，看来还需要其他证据，诸如真实神经元及脑中该部分的分子的准确特性。

另一种危害是，对成功的模型过分强调会抑制对问题的更为自由的想像，从而会阻碍理论的产生。自然界是以一种特殊的方式运行的。对问题过于狭隘的讨论会使人们由于某种特殊的困难而放弃极有价值的想法。但是进化或许使用了某些额外的小花招来回避这些困难。尽管有这些保留，模拟一个理论，即便仅仅为了体会一下它事实上如何工作，也是有用的。

我们对神经网络能总结出些什么呢？它们的基础设计更像脑，而不是标准计算机的结构，然而，它们的单元并没有真实神经元那样复杂，大多数网络的结构与新皮层的回路相比也过于简单。目前，如果一个网络要在普通计算机上在合理的时间内进行模拟，它的规模只能很小。随着计算机变得越来越快，以及像网络那样高度并行的计算机的生产商业化，这会有所改善，但仍将一直是严重的障碍。

尽管神经网络有这些局限性，它现在仍然显示出了惊人的完成任务的能力。整个领域内充满了新观点。虽然其中许多网络会被人们遗忘，但通过了解它们，抓住其局限性并设计改进它们的新方法，肯定会有坚实的发展。这些网络有可能具有重要的商业应用。尽管有时它会导致理论家远离生物事实，但最终会产生有用的观点和发明。也许所有这些神经网络方面的工作的最重要的结果是它提出了关于脑可能的工作方式的新观点。

在过去，脑的许多方面看上去是完全不可理解的。得益于所有这些新的观念，人们现在至少瞥见了将来按生物现实设计脑模型的可能性，而不是用一些毫无生物依据的模型仅仅去捕捉脑行为的某些有限方面。即便现在这些新观念已经使我们对实验的讨论更为敏锐，我们现在更多地了解了关于个体神经元所必须掌握的知识。我们可以指出回路的哪些方面我们尚不足够了解（如新皮层的向回的通路），我们从新的角度看待单个神经元的行为，并意识到在实验日程上下一个重要的任务是它们整个群体的行为。神经网络还有很长的路要走，但它们终于有了好的开端。

============================

①查尔斯?安德森（charles Anderson）和戴维?范?埃森提出脑中有些装置将信息按规定路线从一处传至另一处。不过这个观点尚有争议。

①该网络以一个早期网络为基础。那个网络被称为“自旋玻璃”，是物理学家受一种理论概念的启发而提出的。

①这对应于一个适定的数学函数（称为“能量函数”，来自自旋玻璃）的（局域）极小值。霍普菲尔德还给出了一个确定权重的简单规则以使网络的每个特定的活动模式对应于能量函数的一个极小值。

①对于霍普菲尔德网络而言，输出可视为网络存贮的记忆中与输出（似为“输入”之误――译者注）紧密相关的那些记忆的加权和。

①在1968年，克里斯托夫?朗格特- 希金斯（Christopher Longuet-Higgins）从全息图出发发明了一种称为“声音全息记录器”（holophone）的装置。此后他又发明了另一种装置称为“相关图”，并最终形成了一种特殊的神经网络形式。他的学生戴维?威尔肖在完成博士论文期间对其进行了详细的研究。

(2)他们和其他一些想法接近的理论家合作，在1981年完成了《联想记忆的并行模式》，由杰弗里?希尔顿（Geoffrey Hinton）和吉姆?安德森编著。这本书的读者主要是神经网络方面的工作者，它的影响并不像后一本书那样广泛。

（1) PDP即平行分布式处理（Parallel Distributed Processing）的缩写。

①更准确他说是误差的平方的平均值在下降，因此该规则有时又叫做最小均方（LMS）规则。

① 29个“字母”各有一个相应的单元；这包括字母表中的26个字母，还有三个表示标点和边界。因而输入层需要29x7=203个单元。

②例如，因为辅音p和b发音时都是以拢起嘴唇开始的，所以都称作“唇止音”。

③中间层（隐层）最初有80个隐单元，后来改为120个，结果能完成得更好。机器总共需要调节大约2万个突触。权重可正可负。他们并没有构造一个真正的平行的网络来做这件事，而是在一台中型高速计算机上（一台VAX 11//780 FPA）模拟这个网络。

①计算机的工作通常不够快，不能实时地发音，因而需要先把输出录下来，再加速播放，这样人们才能听明白。

②塞吉诺斯基和罗森堡还表明，网络对于他们设置的连接上的随机损伤具有相当的抵抗力。在这种环境下它的行为是”故障弱化”。他们还试验以11个字母（而不是7个字母）为一组输入。这显著改善了网络的成绩。加上第二个隐单元层并不能改善它的成绩，但有助于网络更好地进行泛化。

①除了上面列出的以外，NEttalk还有许多简化。虽然作者们信奉分布式表达，在输入输出均有“祖母细胞”即，例如有一个单元代表“窗口中第三个位置上的字母a”。这样做是为了降低计算所需要的时间，是一种合理的简化形式。虽然数据顺序传入7个字母的方式在人工智能程序是完全可以接受的，却显得与生物事实相违背。输出的“胜者为王”这一步并不是由“单元”完成的，也不存在一组单元去表达预计输出与实际输出之间的差异（即教师信号）。这些运算都是由程序执行的。

②这种比较不太公平，因为神经网络的一个单元更好的考虑是等价于脑中一小群相神经元。因而更合适的数字大约是8万个神经元（相当于一平方毫米皮层下神经元的数目）。

①它是由斯蒂芬?格罗斯伯格、托伊沃?科霍宁等人发展的。

①我不打算讨论竞争网络的局限性。显然必须有足够多的隐单元来容纳网络试图从提供的输入中所学的所有东西，训练不能太快，也不能太慢，等等。这种网络要正确工作需要仔细设计。毫无疑问，不久的将来会发明出基于竞争学习基本思想的更加复杂的应用。

复第十三章神经网络

家园

第十四章视觉觉知

第三部分

第十四章视觉觉知（1）

“宇宙就像一部展现在我们眼前的伟大的著作。哲学就记载在这上面。但是如果我们不首先学习并掌握书写它们所用的语言和符号，我们就无法理解它们。”

――伽利略

现在让我们总瞰一下到目前为止我们所涉及到的领域。本书的主题是“惊人的假说”――即我们每个人的行为都不过是一个拥有大量相互作用的神经元群体活动的体现。克里斯托弗?科赫

（Christof Koch）和我认为探索意识问题的最佳途径是研究视觉觉知，这包括研究人类及其近亲，然而，人们观看事物并不是一件直截了当的事情，它是一个建设性的、复杂的处理过程。心理学研究表明，它具有高度的并行性，又按照一定的顺序加工，而“注意”机制则处于这些并行处理的顶端。心理学家们提出过若干种理论试图来解释视觉过程的一般规律，但没有一种更多地涉及脑中神经元的行为。

脑本身是由神经元及大量支持细胞构成的。从分子角度考虑每个神经元都是一个复杂的对象，常具有无规则的、异乎寻常的形状。神经元是电子信号装置。它们对输入的电学和化学信号快速地作出反应，并将它们的高速电化学脉冲沿轴突发送出去，其传送距离通常比细胞体直径还要大许多倍。脑中的这些神经元数目巨大，它们有许多不同的类型。这些神经元彼此具有复杂的连接。

与大多数现代计算机不同，脑不是一种通用机。在完全发育好以后，脑的每一部分完成某些不同的专门任务。而另一方面，在几乎所有的反应中，都有许多部分相互作用。这种一般性观念得到了人脑研究的支持，这些研究包括对脑损伤者的研究以及使用现代扫描方法从头颅外进行的对人脑的研究。

视觉系统的不同的皮层区的数目比人们所预料的要多得多。它们按一种近似等级的方式连接而成。在较低级的皮层区，神经元到眼睛的连接最短，它们主要对视野中一小块区域中的相对简单的特征敏感，尽管如此，这些神经无也受该区域所处的视觉环境影响。而较高级皮层区的神经元则对复杂得多的视觉目标（如脸或手）有反应，对该物体在视野中的位置并不敏感。（目前看来）似乎并不存在单独的皮层区域与视觉觉知全部内容相对应。

为了理解脑如何工作，我们必须发展出描述神经元集团间如何相互作用的理论模型。目前这些模型对神经元进行了过分的简化。尽管现代计算机比其上一代在运算速度上快得多，也只能对数目很少的一群这类简化神经元及其相互作用进行模拟。尽管如此，虽然这些不同类型的简化模型仍显原始：却经常表现出一些令人吃惊的行为。这些行为与脑的某些行为有相似之处。它们为我们研究脑所可能采取的工作方式提供了新的途径。

以上是背景知识。在此基础上，我们着手解决视觉觉知问题，即：如何从神经元活动的角度来解释我们所看见的事物。换句话说，视觉觉知的“神经关联”是什么？这些“觉知神经元”究竟位于何处呢？它们是集中在一小块地方还是分散在整个脑中？它们的行为是否有什么特别之处？

作为开始，让我们首先回顾一下第二章曾概述的各种观点。视觉觉知究竟包括哪种心理学处理过程呢？如果我们能够找出这些不同的处理过程在脑中的确切位置，那或许会对定位我们所寻找的觉知神经元有所帮助。

菲力普?约翰逊- 莱尔德认为，脑和现代计算机一样，具有一个操作系统。该操作系统的行为与意识相对应。他在著作《心理模型》（Mental Medels）一书中，从更加广阔的背景下提出了这一思想。他认为，有意识和无意识过程的区别在于后者是脑中高度的并行处理的结果。正如我已在视觉系统中所描述的那样，这种并行处理就是大量的神经元能够同时工作，而不是序列式地一个接一个地处理信息。这才能使有机体有可能进化成具有特殊的、运转快速的感觉、认知及运动系统。而更为序列式的操作系统对所有这些活动进行全局控制，这样才能够快速、灵活地作出决定。粗略地打个比方，这就好像一个管弦乐队的指挥（相当于操作系统）控制着乐队所有成员同时演奏一样。

约翰逊-莱尔德假定，虽然这个操作系统可以监视它所控制的神经系统的输出，它能利用的只是它们传递给它的结果，而不是它们工作的细节。我们通过内省只能感觉到我们脑中所发生的情形的很少的一部分。我们无法介人能产生信息并传给脑的操作系统的许多运作中。因为他将操作系统视为主要是序列式的，所以他认为，“在内省时，我们倾向于迫使本来是并行的概念进入序列式的狭窄束缚中。”这是使用内省法会出现错误的原因。

约翰逊-莱尔德的观点表达得很清楚，又很有说服力。但是，如果我们希望从神经的角度理解脑，还必须要识别该操作系统的位置和本质。它不一定与现代计算机的许多特性相一致。脑的操作系统可能并不是清晰地定位于某一特殊位置上。从两种意义上说，它更像是分布式的：它可能涉及脑中相互作用的若干分离的部分，而其中某一部分的活动信息又会分散到许多神经元。约翰逊- 莱尔德对脑的操作系统的描述使人多少想起丘脑，但是丘脑的神经元太少了，以致于无法表达视觉觉知的全部内容（虽然这是可以验证的）。似乎更有可能的是，在丘脑的影响下新皮层的部分神经元（而不是全部神经元）可以表达视觉觉知。

我们寻找的觉知的神经关联会处于脑功能等级的哪个阶段呢？约翰逊- 莱尔德认为，操作系统处在处理等级的最高层次，而雷?杰肯道夫认为觉知与中间层次有更多联系。究竟哪种观点更合理呢？

杰肯道夫关于视觉觉知的观点①是基于戴维?马尔（Davidmarr) 的2.5维图而不是三维模型的思想的（大致说是第六章所描述的以观察者为中心的可见表面的表象）。这是由于人们直接感受到的只是视野中物体呈现的那一侧；物体后面存在看不见的部分则仅仅是推测。另一方面，他相信对视觉输入的理解（即我们感觉到的是什么）是由三维模型和“概念结构”（conceptua1 structure，是思维的另一种堂皇的说法）决定的。以上就是他的意识的中间层次理论。

下面的例子会有助于理解这个理论。如果你看见一个背对着你的人，你只能看见他的后脑勺，而看不见他的脸。然而，你的脑会推断出他有一张脸。我们会这样进行推理，因为如果他转过身来，表明他的头的正面并没有脸，你会感到十分惊讶的。以观察者为中心的表象是与你所看见的他的头的后部相对应的。这是你所真实感觉到的。你的脑所做出的关于其正面的推断是从某种三维模型表象得到的。杰肯道夫认为你并不直接察觉这个三维模型（就此而言，同样你也没有直接察觉你自己的思想）。正如一句古诗所说：未闻吾所言，安知吾所思？

由于初读杰肯道夫的著作①时不容易理解他的语言，我把他的理论的倒数第二种说法放在脚注中。②如果我对他的理论的理解是正确的话，他的观点应用于视觉即是“形态上的差异”（包括一个视觉目标的位置、形状、颜色、运动等）是与一种短时记忆有关（或由它引起／支持／投射）的表象，这种表象是一种“胜者为王”机制（一种选择机制）的结果，而注意机制的作用则使它更加丰富。

杰肯道夫的观点的价值在于，它提醒我们不要假设脑的最高层次必定是视觉觉知中涉及的唯一层次。我们面前的场景在脑中的栩栩如生的表象可能涉及了许多中间层次，其他层次可能不够生动，或者如他所推测，我们可能根本不能察觉它们（的活动）。

这并不意味着信息仅仅是从表面表象流向三维表象；几乎可以肯定双向流动是存在的。在上面的例子中，当你想像一张脸孔的正面时，你所感觉到的正是由无法感知的三维模型产生的可感知的表面表象。随着这一主题的发展，两种表象之间的区别或许还需进一步明确，但它对我们试图解释的问题给出了一种最初的、粗略的看法。

目前尚不清楚这些层次在皮层中的准确位置。就视觉而言，它们更可能对应于脑的中部（如下颞叶及某些顶区），而不是脑的额区，但是杰肯道夫所指的究竟是视觉等级系统（见图52）中哪个部分，这仍有待于探索（第十六章将就此作更详细的讨论）。

在看了一些心理学家对这个问题的观点之后，我们现在再从那些了解神经元、它们的连接以及发放方式的神经科学家的角度来看这个难题。与意识有关（或无关）的神经元的行为的一般特征是什么？换句话说，意识的“神经关联”是什么？从某种意义上说，神经元的活动对意识是必不可少的，这看起来是合理的。意识可能与皮层中某些神经元的一种特殊类型的活动有关。毫无疑问它会具有不同的形式，这取决于皮层的哪些部分参与活动。科赫和我假设其中仅有一种（或少数几种）基本机制。我们认为，在任意时刻意识将会与瞬间的神经元集合的特定活动类型相对应。这些神经元正是具有相当潜力的候选者的集合中的一部分。因此，在神经水平上，这个问题即为：

?这些神经元在脑中位于何处？

?它们是否属于某些特殊的神经元类型呢？

?如果它们的连接具有特殊性，那是什么？

?如果它们的发放存在某些特殊方式，那是什么？

怎样去寻找那些与视觉觉知有关的神经元呢？是否存在某些线索暗示了与这种觉知相关的神经发放的模式呢？

正如我们已经看到的，心理学理论对我们有若干提示。某些形式的注意很有可能参与了觉知过程，因而我们应当研究脑选择性注意视觉目标的机制。觉知过程很有可能包括某些形式的极短时记忆，因而我们还应探索神经元贮存和使用这种记忆时的行为。最后，我们似乎可以一次注意多个目标，这对觉知的某些神经理论提出了问题，因此我们从论述这个问题开始。

当我们看见一个物体时，脑子里究竟发生了些什么呢？我们会看到的可能存在的、不同的物体几乎是无限的。不可能对每个物体都存在一个相应的响应细胞（这种细胞常被称为“祖母细胞”）。表达如此多具有不同深度、运动、颜色、朝向及空间位置的物体，其可能的组合大得惊人。不过这并不排除可能存在某些特异化的神经元集团，它们对相当特定的、生态上有重要意义的目标（如脸的外貌）有响应。

似乎有可能的是，在任意时刻，视野中每个特定的物体均由一个神经元集团的发放来表达。①由于每个物体具有不同的特征，如形状、颜色、运动等，这些特征由若干不同的视觉区域处理，因而有理由假设看每一个物体经常有许多不同视觉区域的神经元参与。这些神经元如何暂时地变成一个整体同时兴奋呢？这个问题常被称为“捆绑问题”（binding problem)。由于视觉过程常伴随听觉、嗅觉或触觉，这种捆绑必然也出现在不同感觉模块之间。②

我们都有这种体验，即对物体有整体知觉。这使我们认为，对于已看见的物体的不同特征，所有神经元都产生积极的响应，而脑则通过某种方式相互协调地把它们捆绑在一起。换句话说，如果你把注意力正集中在与你讨论某个观点的朋友上，那么，你脑中有些神经元对他的脸部运动反应，有些对脸的颜色反应，听觉皮层中的神经元则对他的讲的话有反应，还可能有贮存的关于这张脸属于哪个人的那些记忆痕迹，所有这些神经元都将捆绑在一起，以便携带相同的标记以表明它们共同生成了对那张特定的脸的认知。（有时候脑也会受骗而做出错误的捆绑，比如把听到的口技表演者的声音当作是被模仿物发出的。）

捆绑有若干种形式。一个对短线响应的神经元可以认为把组成该直线的各点捆绑在一起。这种神经元的输入和行为最初可能是由基因（及发育过程）确定的，这些基因是我们远古的祖先的经验进化的结果。另一种形式的捆绑，如对熟悉物体的识别，又如熟悉的字母表中的字母，可能从频繁的、重复性的体验中获得，也就是说，是通过反复学习得到的。这或许意味着参与某个过程的大量神经元最终彼此有紧密的连接。①这两种形式的相当永久的捆绑可以产生一些神经元群体，它们作为整体可以对许多物体（如字母、数字及其他熟悉的符号）作出反应。但脑中不可能有足够多的神经元去编码几乎无穷数目的可感知的物体。对语言也是如此。每种语言都有大量但却是数目有限的单词，而形式正确的句子的数目却几乎是无限的。

我们最为关心的是第三种形式的捆绑。它既不是由早期发育确定的，也不是由反复学习得到的。它特别适用于那些对我们而言比较新奇的物体，比如说我们在动物园里看见的一只新来的动物。在多数情况下，积极地参与该过程的神经元之间未必有较强的连接。这种捆绑必须能够快速实现。因此它主要是短暂的，并必须能够将视觉特征捆绑在一起构成几乎无限多种可能的组合，只不过也许在某一时刻它只能形成不多的几种组合。如果一种特定的刺激频繁地出现，这种第三种形式的瞬间的捆绑终将会建立起第二种形式的捆绑即反复学习获得的捆绑。

遗憾的是，我们并不了解脑如何表达第三种形式的捆绑。特别不清楚的是，在集中注意的觉知时，我们究竟每次仅仅感知一个物体，还是可以同时感知多个物体。表面上看，我们每次能感觉的绝不只一个物体，但这是否可能是错觉呢？脑真的能如此快速一个接一个地处理多个物体的信息，以致它们好像同时出现在我们脑海中吗？也许我们每次只能注意一个物体，但在注意之后，我们可以大致记住其中几个。因为我们并不确切知道，所以我们必须考虑所有这些可能性。让我们先假设脑每次只能处理一个物体。

究竟哪种类型的神经活动可能与捆绑有关呢？当然，意识的神经关联可能仅仅包含一种特殊类型的神经元，比如说，某个特殊皮层上的一种锥体细胞。一种最为简单的观点是，当这个特殊神经元集团的某些成员以一个相当高的频率发放（比如大约4oo或500 Hz），或维持一段适当长时期的发放，此时觉知便出现了。这样，捆绑仅仅对应于皮层神经元中相当小的一部分，它们在皮层中若干不同的区域同时高频发放（或都发放很长一段时间）。看起来这会有两个结果：这种快速或持续性的发放将增强这个兴奋的神经元集团对所投射到的神经元的影响，而这些被影响的神经元则对应于此时脑所觉知的物体的“意义”。同时，这种快速的（或持续的）发放将激活某种形式的极短时记忆。

然而如果脑能同时精确地觉知不只一个物体，那么这种观点就不能成立。即便脑每次只处理一个物体，它也必须区分目标和背景。为了理解这一点，不妨想像在一个视野中靠近视觉中央的地方，恰好有一个红色的圆和一个蓝色的方块。那么，对应于觉知的某些神经元将会快速发放（或持续发放一段时间），有些标识红色，有些标识蓝色，其他一些标识圆，当然还有一些标识方块。脑又怎样知道哪种颜色与哪种形状相互搭配呢？换句话说，如果觉知仅仅对应于快速（或持续）的发放，脑多半会将不同物体的属性混在一起。

有许多方法可以解决这个困难。或许只有当脑注意某个物体时才会形成对它的生动的觉知。或许注意机制使对被注意的物体反应的神经元的活动增强，同时削弱对其他物体反应的神经元的活动。倘若如此，脑只能随着注意机制从一个物体跳跃到另一个物体，一个接一个地进行处理，毕竟，当我们转动眼睛时，情形是这样的。我们先注意视野中的一部分区域，然后转而注意另一区域，如此下去。由于我们不动眼睛就能同时看见多个物体，故注意机制的速度必须比上述情况要快，并能在眼的两次转动之间工作。

第二种替代的解释是，注意机制以某种方式使不同的神经元以多少不同的方式发放，此时的关键在于相关发放。①它基于这样一种观点，即重要的不仅仅在于神经元的平均发放率，更是每个神经元发放的精确时间，为简单起见，让我们仅仅考虑两个物体。

对第一个物体的特征反应的神经元都在同一时刻以某种模式发放，相应于第二个物体的神经元也都同时发放，但发放的时间与第一个神经元集团不同。

举个理想化的例子可以把这个问题讲得更清楚。假设第上集团中的神经元发放很快。或许它们还会再次发放，比如说是在l00 毫秒以后。同样，在第二簇发放后过100 毫秒又再次发放，如此下去。假设第二群神经元也同样每隔大约100 毫秒发放一簇高速脉冲，但是只在第一群神经元处于静息状态的时候才发放。这样，脑中的其他部分不会把这两群神经元的发放混在一起，因为它们从不会同时发放①。

此处的基本观点是：同时到达一个神经元的许多脉冲将比不同时刻到达的同样数目的脉冲产生更大的效果。②其理论要求是同一群神经元的发放有较强的关联，同时不同群的神经元之间关联较弱，甚至根本没有关联。③

*****

让我们回到我们的主要问题上。这就是定位“觉知”神经元并揭示使它们的发放象征着我们所看见的东西的机制是什么。这就像试图侦破一个神秘的谋杀案。我们了解受害者（觉知的本质）的一些线索，还知道可能与犯罪有关的许多杂乱的事实。哪方面进

展看来最有希望呢？由此下一步又该怎么做呢？

最直接的线索将是在现场捉住嫌疑犯。我们能否发现那些行为一直与视觉觉知有关的神经元呢？一种可能的办法是设置一种环境（第三章描述过的观看内克（Necker) 立方体）使进入眼睛的视觉信息保持不变，但知觉却会发生变化。当知觉改变时，哪些神经元会改变其发放，或改变发放的方式，而哪些神经元却不会改变？如果一个特定神经元的发放不随知觉改变，这就提供了一个“它不在现场”的证据。另一方面，如果它的发放确实与知觉有关，我们还需确定它是“真凶”还是“从犯”。

让我们换一种策略。我们能否将案发地点限定在某个特定的城镇、一个区或建筑物中的单元呢？这将使我们的搜索变得更有效，在我们的问题中，即我们能否大致说出视觉觉知神经元在脑中可能的定位呢？显然，我们推测它在新皮层。虽然我们不能完全忽略新皮层的紧密的近邻，如丘脑和屏状核，以及在进化上比较古老的视觉系统（older visua1 system）和上丘，更不能忽略纹状体和小脑。视觉觉知不太可能存在于诸如听皮层等区域，因此我们可以将注意力主要集中在图48所示的许多视觉皮层区域。或许我们能发现证据表明某些区域比其他区域被更紧密地牵涉到视觉觉知。

这尚不足以找到凶手，但可能将我们引向正确的方向。罪犯可能是某种特殊类型的人。比如说，一名强壮的男子，一名心理失常的青少年，或者一群匪徒？在此处，可能涉及到哪些类型的神经元呢？是兴奋性神经元？还是抑制性神经元？是星形细胞，还是锥体细胞？如果它们是在皮层上，那么在皮层中哪一层或哪些层才能找到它们呢？

另一种策略将是寻找他们之间是否有某些形式的通讯联系，从而使之露出马脚。如果这是一帮匪徒所为，他们是否在汽车里使用了移动电话？用神经学的术语说，觉知是否依赖于仅仅出现在脑中特定位置上的某些特别形式的神经回路呢？

或许有人会寻找犯罪的动机。凶手犯罪能得到某种利益吗？他是否能得到经济上的好处呢？倘若如此，赃款被运到哪里去了呢？如果我们能在那里找到的话，我们或许就能跟踪追查到凶手。用神经的术语讲，视觉信息被发送到脑中的哪些部位？这些部位又是如何与皮层视觉区域连接的呢？

此外，有人会问是否有某些特殊的行为将我们引至嫌疑犯。这或许是神经元群之间的相关发放，或许是这种或那种形式的节律或模式发放。如果我们怀疑是一群匪徒，谁最可能是头目呢？谁决定匪徒们的行动？我们相信，觉知过程中经常涉及到脑对哪种解释最为合理进行判断。这可能是一种包含某些神经元集团的一种“胜者为王”机制，如果我们能发现这种机制，那么胜者的神经本质也许能将我们指向觉知神经元。作案时是否用过什么特殊的武器呢？正如前面所述，我们很有把握地猜测极短时记忆是觉知的本质特征。同时某些形式的注意机制或许协助产生生动的觉知，因此，我们所知道的关于这些在神经水平的工作的任何知识都将把我们引向正确的方向。

简单他说，通过大量的实验手段能从观念上将我们引导到所寻找的神经元及它们的行为。现阶段，因为我们要解决的问题十分困难，我们不能忽略任何哪怕看起来只有很少希望的线索，现在让我们更仔细地检查这些不同的途径的本质。

=================================

①视觉觉知（visua1 aWareness）。在本书中，consciousness和awareness的意思都是意识，只是前者作为范围更广的、比较书面化的词，而后者则更多用于感觉系统（特别是视觉系统），是比较口语化的词（见第一章脚注），在本书的第一和第二部分，它们均译作“意识”，并不引起歧义。但在第三部分当中，作者以visual awareness作为 consciousness研究的突破口，需区分这两个词。故在第三部分（第十四至十八章）中特将awareness按心理学中译为觉知。――译者注

①将杰肯道夫的观点归纳起来而不曲解他的意思，这并不容易。如果读者希望进一步理解，可以查阅他的书。我并不打算叙述他对音韵学、句法、语义等方面的论点以及他在音乐认知方面的见解。相反地，我将试图精炼他的基本观点，特别是它们在视觉上的应用。

①希望精确理解杰肯道夫的话的读者可以查阅他的著作。（他的理论的最终版本，即理论八．还谈到了情感。）

②他的原话是：“每种觉知形式所表达的形态上的差异是由对应该形式的中间层次的结构引起／支持／投射的。该结构是短时记忆表象的匹配集的一部分，而这种表象则是由选择机制指派的，并为注意处理所丰富。特别地，语言觉知是由音韵结构引起／支持／投射的，音乐觉知则对应于音乐表面，视觉感知来自2．5维图。”

①如果一个集团中的神经无空间上离得很近（意味着它们可能有某种相互连接），接受有些相似的输入，并投射到多少有些相似的区域，那便不会引起任何特别的困难。在这种情况下它们就像是单个神经网络中的神经元。令人遗憾的是，通常这种简单的神经网络每次只能处理一个目标。

②现在还不能完全肯定捆绑问题如我所说的那样真的存在，还是脑通过某种未知的技巧绕了过去。

①回忆一下，大多数皮层神经元具有成千上万的连接，其中很多在开始时很弱，这意味着只有当脑已经大致按正确方法构造好，才可能容易地、正确地进行学习。

①这一观点是克里斯托夫?冯。德?马尔斯博格（christoph von der malsburg)在1981 年的一篇相当难懂的文章中提出的。此前，彼得?米尔纳（Peter Milner)及其他人也曾叙述过。

①当然，一个群内轴突的脉冲并不必彼此精确同步。当电位变化沿接受脉冲的神经元的树突传向细胞体时，从时间上看它们的效果会有所扩散。此外，当脉冲沿许多不同轴突传播的时间延迟也有不同。这样，一群神经元的发放时间只需在大约几毫秒范围内是同时的。

②一种稍微详尽的理论引人了轴突传递过程中这种必然发生的时间延迟，使得离细胞体较远的突触比较近的略早地接受到输入，这样，由于树突延迟时间上的小的差异，两个信号的最大效应将同时达到细胞体。更为详细的理论还考虑局部的抑制性神经无产生的抑制性效果的调节。所有这种定性的考虑应可通过小心的模拟定量化，如在计算机上模拟单个神经元在这种环境下的行为方式，并引人时间延迟等因素。

③这种发放下太可能像图57表示的那样有规则。

本帖一共被 1 帖引用 (帖内工具实现)

他们是一样的颜色

复第十四章视觉觉知

家园

第十五章一些实验

第十五章一些实验

“仅仅通过纯粹的逻辑思考，我们不能获得关于经验世界的任何知识。”

――阿尔伯特?爱因斯坦

猴子脑中的一个特定神经元也许会对视野中某块特定区域的颜色敏感。但是我们又如何确定它直接参与了对该颜色的知觉呢？比如说，也许它只是脑把注意引向视野中那块区域的系统的一部分。倘若如此，一个人由于脑部损伤而失去了感知真实颜色的神经元，那么他所看到的世界只有黑白两色，但他的注意仍可能被引向一个色块。

这不只是一个抽象的可能性。牛津的阿兰. 考维（Alan Cowey)及其同事详细地研究了一个由于脑部损伤而失去了颜色知觉的人（通俗他讲，他看不见颜色、只能看到黑色、白色及不同浓淡的灰色）。他们指出，实验中只要把两个小的颜色方块（被调节成等亮度）紧挨在一起，被试者就能说出两个方块的颜色是否相同。而事实上该被试者坚决否认他能感知两个方块的颜色。如果两个方块不挨着，他便无法完成这个任务，他的判断完全是一种猜测。这相当清楚地表明，脑在不感知颜色时仍能利用关于颜色的部分信息。

*****

为了发现猴子脑中某些神经元的反应是否与它所见到的事物有关，斯但福大学的威廉?纽瑟姆（wiiliam Newsome）做了一系列卓越的实验。实验中选择的皮层区域是MT区（有时称为“V5”）。这里的神经元对运动响应良好，但对颜色没有直接反应，或者根本不响应（见第十一章）。已经有实验表明，该区域受损伤后猴子对视觉运动的响应变得困难。不过这种障碍常常在几周后逐渐减弱，这或许是脑学会了使用其他通路的缘故。

继其他人的早期工作，纽瑟姆和同事们首先研究MT区的单个神经元对选定的运动信号怎样作出反应。这些信号是由显示在电视屏幕上的快速变化的随机点图组成的。一种极端情况是所有这些瞬变的点都朝一个方向运动。这种运动很容易被识别。另一种极端是使这些点的平均运动为零，这就像更换在电视频道时，屏幕上有时会看到“雪花”一样。观察者必须报告运动是沿给定的方向还是相反方向，当平均运动为零时，结果是随机的。

纽瑟姆和同事们使用了这些闪烁图案的各种组合。如果所有的运动是朝一个方向，猴子（或人）总能正确地发出信号报告该运动方向，如果只有部分点朝一个方向运动而其他各点作随机运动，则观察者有时会犯错误。沿该特定方向运动的点所占的比例越小，犯错误就越多。通过改变这个比例，就有可能画出一条观察者的准确度与具有相同运动方向的点所占的百分比的变化关系的曲线。①使用一种特殊的数学手段，找出那些正以最有效的方式判断运动方向。

他们总共研究了二百多个不同的神经元。其中大约三分之一的神经元判断的准确度与猴子相当。有些判断很差，但另一些对运动的判断比猴子要好得多。那么，既然猴子脑中有这些皮层神经元，为什么它不能更成功地做出判断呢？最可能的回答是，猴子不能仅仅选择一个神经元（即判断最有效的那个）来控制它的反应。它的脑必定使用了一群神经元。现在还不清楚它是如何做到这一点的。

这个实验的确说明了做出选择所需的视觉信息存在于MT区的神经元的行为之中，因此我们不能说那些神经元不能完成这个任务。遗憾的是，这并不能证明它们确实执行了这个任务。

纽瑟姆的下一个实验则更深入一步。他和同事们提出了这样一个问题：当猴子进行较难的鉴别任务时，如果我们能适当地刺激MT区的神经元并便它们发放，猴子的判断能否得到改进呢？

从技术上讲要仅仅刺激一个神经元并不容易。幸亏在皮层MT区，具有相似反应形式（即对视野中一个特定部位的一个特定运动方向反应）的神经元通常彼此形成一簇。这样用电刺激靠近目标神经元的那一小块区域，很有可能使这些具有相似特征的神经元一起受到刺激。

他们一共做了62次实验。其中大约半数情况下电流刺激明显改善了猴子对运动的鉴别，这是一个相当惊人的结果。它意味着通过使视皮层中适当位置的神经元兴奋，我们可以改变猴子对特定视觉刺激的反应方式。电流必须加在这一特定位置。如果电流刺激皮层MT区其他位置则对猴子完成这种特殊任务几乎没有影响。

这是否意味着MT区的一小块区域包含在识别那种运动的神经相互关联之中呢？这当然是可能的，但要肯定这个结论还有不少困难。

可能有一种反对意见是，虽然猴子表现出了恰当的（鉴别）行为，但实际上它并没有看见任何东西。它仅仅像个自动机器那样做出反应，而并没有视觉觉知，要确切地回答这种反对意见必须完全了解猴子和人的视觉系统；因此，在目前，我们只能假设猴子具有视觉觉知，直到有证据表明并非如此。

人们还可能争论说，即便猴子具有视觉觉知，但它在完成这个特殊任务上并未形成视觉觉知。看来这不大可能，因为在这一任务中猴子和人做出的选择是类似的，也就是说，他们的心理测量曲线是相当一致的。猴子的表现并不比人差很多。很可能是二者的脑运用了相似的机制；不过，还有一个困难。

如果一个人重复进行这项任务，他的行为差不多常会变成机械了，他会报告说他几乎没有瞥见这个运动，尽管如此，他的选择却比随机情况要好得多。由于不能用语言向猴子描述这个任务，故它比人更难训练。纽瑟姆的猴子可能经受了过度的训练，因此它们的行为或多或少变得机械了，而几乎没有什么视觉觉知参与。

我怀疑这种反对意见是否很重要。因为当所有的闪烁光点向一个方向运动时，我们很清晰地看到了这个运动，几乎可以肯定猴子也看到了。遗憾的是，由于猴子已能近乎很好地完成任务，在这种情况下刺激电流引起的差异微乎其微。或许可以进行这样一种实验，先让猴子学习鉴别另一种运动刺激（如一个有朝向的棒）的运动方向，并在它被过度训练之前进行这种运动光点的测试。这种实验具有一定的风险，因而并不容易做，但或许值得一试。

一种更激烈的反对意见是，虽然皮层MT区的神经元的行为看上去与猴子的鉴别有关联，因而也可能与视觉觉知有关，但这并不意味着这些特定的神经元就是产生觉知的地方。它们可能通过发放影响其他的神经元（或许是视觉等级的其他部位）。而那些神经元才是真正与觉知相关的。

要回答这个问题，唯一方法是研究其他皮层区域。如果我们在其他地方不能发现具有相似的鉴别能力的神经元，则MT区的神经元与觉知相关的可能性便增加了。从长远考虑，在我们更多地了解全部视觉区域，特别是它们如何相互连接之前，我们不可能寄希望于能将视觉觉知的区域限定下来。无论如何，纽瑟姆的一些实验在这一研究方向上迈出了非常重要的第一步。

如果视野中的某些刺激引起有关神经元发放，我们自然会猜测该神经元可能是与那些刺激相关的神经对应物。不过，正如刚才解释的那样，这种结论并非必然。是否有某些更有效的方法可以缩小搜索觉知神经元的范围呢？我们能否找到这样一种情况，其中视觉输入保持恒定，而知觉却在变化？那样我们便可尝试去寻找猴子脑中哪些神经元的发放随输入的变化；更重要的是，哪些神经元是随知觉而变的。

一个显著的情况是观察内克立方体（见图4）。此时图形保持不变，但当我们把它看作三维时，开始时知觉是一种形式，然后又变成另一种形式，如此下去。目前并不清楚脑中什么部位具有关于三维立方体的知觉。我们应该研究某些容易在猴子视觉系统中定位的情况。

一种很值得注意的可行性是基于已知的双眼竞争现象。当两只眼睛接收与视野中同一部分有关的不同视觉输入时，这种情况就会出现。头部左侧的初级视觉系统接收视野中双眼凝视点右侧的输入信息（右侧则与此相反）。如果两侧的输入不能融合，而是先看到一个输入，再看到另一个，如此不断交替，则这两种互相冲突的输入称为是“竞争的”。

你可以在旧金山的博览会看到一个颇具戏剧性的双眼竞争的例子。它是由萨莉?杜宁（Sal1y Duensing）和鲍勃?米勒（Bob Mlller）设计的。在博览会的演示中，观察者把头放在一个固定的位置上并要保持凝视点不动。通过一面适当放置的镜子，观察者的一只眼睛能看到他面前的另一个人的脸，而另一只眼睛看到的则是侧面的一个空白的屏幕。如果观察者在这个屏幕前晃动他的手，则在他的视觉中，脸从原来的位置上被抹掉了！手的运动在视觉上非常显著，从某种意义上吸引了脑的注意。若不注意的话，是看不见脸的。如果观察者移动他的眼睛，脸又会重新出现。

在某些情况下消失的只是脸的一部分。例如，有时还会留下一只或两只眼睛。如果观察者看的是一个人脸上的笑容，此时会出现脸消失了而只留下微笑的情况。由于这个原因，这种效应被称为“柴郡猫效应”（Cbeshire Cat effect，是以《爱丽丝漫游奇境记》中的猫命名的）。你可以自己用一个简单的袖珍镜子做试验。结果非常有趣。如果被观察者和观察者的手后面都是均匀的白色背景的话，实验效果会更好。

到目前为止尚未对猴子进行这种实验。在麻省理工学院进行过一种简单得多的实验。尼科斯?罗格赛西斯（Nikos Logothetis）和杰弗里. 萨尔（Jeffrey Schall）训练猕猴对看到的向上或向下运动的水平光栅作出判断。为了产生双眼竞争，向上运动的光栅被投射到猴子的一只眼睛，而向下运动的则投射到另一只眼睛，并使两个影像在猴子的视野中重叠。结果猴子交替发出信号表示它看到了向上和向下的运动，这和我们所会作出的反应是一样的。请注意，到达猴子眼中的运动刺激总是一样的，而猴子的感受大约每秒钟改变一次。①

皮层MT区主要检测运动而对颜色不感兴趣。当猴子对运动的感觉有时向上有时向下时，短时间内MT区的神经元的行为是怎样的呢？回答是，有些神经元的发放与感觉有关，而其余的神经元的平均发放率则相对地保持不变，与猴子当时看到的运动方向无关。（实际数据要比这简单的描述杂乱得多。）

这一结果表明，在某一时刻，不可能所有的视皮层神经元的发放都与我们的视觉感受有关。当然，如果有更多这样的例子，情况就会更好些。遗憾的是，这并不能准确地限定出觉知神经元的位置。如同对纽瑟姆的实验的解释一样，真正的关联或许是视觉等级系统其他地方的神经元的发放，而它们受到了MT区的那些神经元发放的影响（至少是部分受影响）。拉马参准曾经提出，这种竞争可能不是一种真实运动的竞争，而是一种形状的竞争，其真正的位置或许在于视觉等级系统较低的层次，或许是皮层V1区或V2区。同样，即使某些觉知神经元确实位于MT区，目前的结果并不能证实它们是哪些神经元。它们在哪些皮层区呢? 哪些类①时间间隔遵从r 分布。型的神经元趋向于随知觉而不是视觉输入而改变呢？正如对纽瑟姆的结果的讨论一样，这里同样存在着猴子被过度训练的可能。尽管这种可能性不大，因为训练对竞争的影响很小，但仍引起忧虑。再说，即使有所保留，这些也是很重要的实验。进一步的研究将会把我们引向用神经术语来解释视觉觉知。

在其他条件下，是否还会出现视觉输入不变而知觉却由于某种原因发生变化的情况呢？当然，有时观察者会突然“看见”一个原来并未发现的物体，如图9中的隐藏着的达尔马提亚狗一样。但要在猴子身上进行这种研究并不容易。人们会说：“瞧，我现在看见一只狗。但我以前却没看见过。”而让猴子告诉我们这些则困难得多。此外，一旦观察者从图中辨认出那只狗，在随后的实验中他通常能直接认出它。因而要多次重复同样的实验是困难的。而这种重复正是取得科学的可靠结果所必需的。

一种可能性就是研究从觉知中逐渐消失的图像在脑中产生的影响。这些影像是稳定在视网膜上的。（回想一下，我们通常通过各种各样小的眼动来防止这种消退。）初通过在眼球上放置一个小的装置来将图像稳定在视网膜上，这使眼睛感到很不舒服。它能将选定的光学图案投射到视网膜上。不管眼睛如何运动，图案一直保留在视网膜上的同样位置，因而会逐步褪去。50年代时曾进行过多次这类实验，但此后，虽然产生稳定的影像的装置更精密也更舒服，但这类实验似乎却不再进行了。

人们或许认为这种消退过程主要发生在视网膜，因而对我们来说兴趣不大。但看来这不大可能是真的。这些早期的研究表明复杂的图像并不总是以一个整体消退。一条直线常被作为一个整体，但是构成一个方块或三角形的几条边却可能独立地消失。锯齿形的图形不如弧形稳定。格式塔心理学家所谓的“好的图形”比“差的图形”的活动更具整体性。如果有一个图案是一个大写字母B，并有粗糙的弯曲线穿过，弯曲线通常比字母日更早褪去。这表明消退主要发生在脑中，而不是在眼睛里。因此我们值得去做一些尝试，比如去训练一只猕猴，使它能在清醒状态下用信号表示它所见到的东西。将各种不同的图案固定在它的视网膜上，观察当部分影像从觉知中褪去时哪些神经元受到了影响。

另一种可能性是对拉马参准的引人注目的实验报导（见图19）进行进一步研究。人为地损坏猴子皮层V1区的一小部分可造成一个局部盲区（称为“盲点”）。该实验涉及到由静止的两条未排成一线的平行线段在触及这个盲区时产生的表观运动。如果我们能训练猴子用信号报告，区分运动和静止、对准和错开、中断和连续等各种情况，那么这项研究就有可能在猴子身上进行。据我所知，迄今为止还没有人做这种尝试。

已经有人在猴子的真正盲点做了一项简单的实验。（关于我们盲点的心理学描述，请见第三章。） V1区有一个区域与盲点相对应，在这里皮层仅接受来自一只眼睛的直接输入，而另一只眼的光感受器不能覆盖视野中的这一部分。（回想一下，脑中一侧的V1区的大部分神经元均接受来自双眼的输入，虽然它只处理视野对侧一半的信息。）人们或许认为育点区域内的神经元仅对来自一只眼的信号有反应。令人吃惊的是，这并非事实。里约热内卢联邦大学的里卡多?伽塔斯（Rlcardo Gattass) 和同事们已经证实，猕猴的盲点区中有些神经元确实对来自双眼的输入有反应。这种令人意想不到的、来自在该区域是局部上盲的眼的输入，或许直接或间接地来自邻近的接受双眼输入的皮层组织。不管它来自何处，实验表明，V1区盲点上的神经元按第三章所述的方式发放脉冲对讯号作出反应，对外界图形实现填充。同时，这决定性地否定了丹尼特（Dennett）的观点（在第四章作过概述）。这样简洁的例子却说明了一个普遍原理：无论何时你清楚地看见视觉场景的某个特征，那么一定有一些神经元在发放，它们的活动显而易见地象征那个特征。（另一个关于这个原理的例子是第十一章描述的对主观轮廓的神经反应。）

与通常的视觉输入引起的神经反应的例子相比，这个特殊的盲点现象没给我们提供多少关于觉知神经元定位的信息。如果它能像早期建议的那样扩展一下，研究对于不变视觉输入下的感觉的变化情况（如图19），那对我们的探索是有所帮助的。

另一个途径是研究在哪些情况下不同的视觉输入会产生相同的知觉，或者至少是产生了这种知觉的某些组成单元。一个例子是索尔克研究所的汤姆?奥尔布莱特（Tom Albright）和合作者在猕猴皮层MT区做的实验。结果表明，即使所研究的运动物体有相当大的差异，MT区的某些神经元的发放也具有非常一致的特性。比如，一块波纹穿过视野运动，它们在MT区引起某些神经元的发放，与一根直棒在相同位置朝相同方向运动的效果大致相同。尽管图案不同，但它们的运动却很相似。（他们把这称为“形状一线索不变性”。）

到目前为止他们尚未证实这种神经元在类型、定位或发放行为上是否存在特别之处。如果它们是觉知神经元，我们也许希望，不管输入信号是什么，它们的发放（或是其中某些特性）总与视觉知觉相关。

由于至今证据仍不充分，因而有理由提出这样一个问题：人们能否精确地研究在动物警觉及处于无意识状态下同一个神经元的行为呢？由于技术上的原因，当动物被麻醉而处于无意识状态时做这样的实验是很困难的。不过有实验比较猫在警觉状态和慢波睡眠的情况。①

1981年神经科学家玛格丽特?利文斯通（Margaret Livingstone)和戴维。休伯发表了这样一个实验。他们研究的神经元大多在皮层V1区。②动物的眼睛是睁开的，因而即便在慢波睡眠时V1区的神经元也对放置在动物面前的屏上由计算机产生的视觉信号作出反应。当他们记录到某个特定神经元的反应时，他们把动物唤醒，并用它刚看到的同样刺激再次测试。

当动物清醒时，他们研究的每个神经元的反应形式与睡眠时大致相同，也就是说，如果它对视野中某个位置的具有一定朝向的直线敏感，那么无论动物是处于清醒状态还是睡眠状态，它的最佳刺激都是一样的，只是清醒时通常信噪比要好一些。①不管怎样，有相当数目的细胞的发放率在动物清醒后比睡眠时要高。或许这没什么可惊讶的，而令人感兴趣的结果是，皮层较低层次（第5、6层）的反应的改变比高层更为显著。

他们使用一种化学物质（有放射性的2 - 脱氧葡萄糖）来证实这个一般性结果。这种物质可以显示在这些皮层层次由视觉刺激产生的平均行为。这些行为是在大约半小时内的平均结果。一种情况下动物处于清醒状态，而在动物睡眠时则使用一种不同的放射性同位素作为对比。结果大致是相同的。当动物有意识时，皮层较低层次的行为有显著改变，而较高层次的变化却很小。

这促使人们得出这样一个广泛的推论，它远超过目前的证据。这就是，皮层较高层次的活动主要是无意识的，而至少有部分低层神经元与意识有关。我必须承认我过分地喜爱这个假设。如果确实如此的话，那将会是十分美妙的。但我不能全身心地接受它，或许有其他原因使得慢波睡眠时较低层次的活动变弱。

通过研究注意机制，我们能够得到对有关觉知的任何知识吗？关于注意的神经机制的实验研究已经进行了一段时间。一些实验是在清醒的猴子身上做的。他们记录了当猴子在完成特定视觉任务时脑多个部位神经元的发放，也有一些实验对人使用如第八章所描述的PET扫描。我不打算重复所有这些实验；相反地，我将只简述其中一个实验及其结果。

马里兰州贝塞斯塔（Bethesda）的国立精神卫生研究所的罗伯特?德西蒙（Robert Desimone）和同事们曾经训练猴子凝视视觉显示一侧的一个点并（目不转睛地）注意该显示的某个特征卜。随后闪现各种信号。实验者研究了在皮层V4区的一个特定神经元对该位置上的视觉显示的响应， V4区的神经元对颜色更敏感。假设研究的神经元对具有一定朝向的红色棒有反应，而绿色的棒对它没有影响。（当然，此时V4区中未被研究的其他神经元，有些也会对绿色棒而不是红色棒有反应。）每次显示均包括两种颜色棒，一根红色的（对该神经元为有效刺激），而另一根为绿色（无效刺激）。二者均在神经元的感受野内。当猴子注意红色棒占据的位置时，神经元的发放与猴子不注意时相同，或者更高些。①然而，在那些猴子注意绿色棒的实验中，这个对红色敏感的神经元的发放降低了。因此，注意不仅仅是个心理学的概念。它的影响可以在神经元水平上观察到。当猴子注意某处时，对被注意刺激敏感的神经元发放会增强，而当猴子注意其他位置时，尽管眼睛的位置以及输入的视觉信息与上次完全相同，那个神经元的发放也会减弱。

他们这样描述所得的结果：

V4区的神经元……具有如此大的感受野，以致许多刺激都落入其中。人们也许期望这样的细胞的行为就反映了其感受野内所有刺激的特征。然而已经发现，当猴子将其注意局限在一个V4区……细胞的感受野的一个位置时，该细胞的反应首先由被注意位置上的刺激决定，就好像感受野围绕着注意到的刺激渐渐“收缩”一样。

由于理解它们并不容易，我就不详细描述他们的结果了。他们指出，关于注意的探照灯的简单理论似乎并不正确。要解释它们需要更复杂的机制，而这种机制尚未建立。丘脑是否参与了注意呢？作为“皮层的入口”，丘脑具有许多相当不同的区域，其中有些与视觉有关。从眼睛到皮层的主要通路需要经过侧膝体（the LateraI Genicu1ate Nucleus，缩写为LGN）。侧膝体是丘脑的一部分（见第十章的描述）。（灵长类）其他丘脑视觉区位于称为“丘脑后结节”的区域。①它是一个大的丘脑核，比侧膝体显然要大得多。

贝塞斯塔的国立眼科研究所的戴维?李?罗宾逊（David LeeRobinson）和同事们在猴子的丘脑后结节的一部分做了大量实验。看来，引起丘脑后结节反应的特征依赖于它们来自视皮层的输入。而不是来自上丘。②

如果通过化学手段使丘脑后结节的一小块区域的抑制增强，猴子转移注意会更困难；相反，降低抑制将使转移变得容易。其他人进行的一些实验表明，丘脑后结节扮演的角色是抑制来自无关事件的输入。对三名丘脑损伤患者的研究表明他们形成注意有一定困难。对正常人的PET扫描显示，当视觉任务分散注意力时，丘脑后结节的活动增强。这些干扰物使得被试用更多的注意来完成任务。所有这些结果（综述文章见参考文献13）有力地表明丘脑的这些部分与在视觉注意的多个方面密切相关。①

这里尚有广阔的领域可以从事进一步的工作。需要进一步更细致地研究上面提到的每个丘脑后结节区的准确连接。比如说，几个视网膜区域对应区的连接方式有何不同？我们能否更准确地了解丘脑后结节的每个特定部位如何影响注意，以及它如何与和它相关的各个皮层区域的神经元相互作用呢？进一步的实验工作应当能回答这些问题。（我在第十六章对关于丘脑后结节不同区域的一些推测性想法进行了讨论。）

我们从对丘脑的研究中得到了多少关于视觉觉知的神经机制的知识呢？既然注意对觉知是重要的，忽略它将是愚蠢的。为了揭示视觉的奥秘，我们不仅需要了解新皮层如何工作，而且还需要了解侧膝体和丘脑后结节。

有关的实验能否在人而不是猴子上做呢？这种实验的优点在于被试者可以口头报告他们的体验，而猴子则做不到。然而，出于伦理学原因，不太可能将电极插入一个人的脑中，不过有时为了医学治疗必须这样做，从头颅外面研究脑波也是可能的，但这些结果通常更难以解释。

这个方法最初是由在加利福尼亚州立大学旧金山分校工作的本杰明. 里贝特（nenjamin Libet ）开展的。他喜欢在人体上做实验，因为他有理由相信别人是有意识的。（他对猴子是否也有意识则并不那么有信心。）在过去，不仅仅是心理学家和神经科学家，还包括职业医生，都对关于意识的任何实验工作持严肃的怀疑态度。对于外科医生和麻醉师而言，他们几乎唯一的兴趣是如何在手术过程中对病人麻醉，以使他察觉不出所发生的事情。这样做，部分是为了减轻病人的痛苦，部分是为了防止病人控告他们。（里贝特告诉我，在他获得终身教授职位以前，他很明智地不在清醒的人身上做意识实验。）

里贝特的主要工作涉及自发运动前的某些脑波，以及脑中这些事件与被试者出现试图或希望运动的觉知出现的时间有怎样的关系。①他的结果表明，对于这种形式的有意识的觉知，必定存在某个最短时间（大约100 毫秒左右）的神经活动。这个时间的精确值或许依赖于信号的强度以及环境。

他的其他一些更新的工作是关于刺激丘脑的一部分――腹基复合体的效果。腹基复合体主要与触觉和痛觉等感觉有关，这种实验是在一些病人身上做的，在丘脑的这一部分安插电极可以减轻他们难以控制的疼痛。虽然这些实验并不涉及视觉，但可能与盲视（如第十二章所讨论的）的解释有关。因此我将对它们进行描述。

被试者的丘脑接受了一定数量的刺激。然后，他（或她）需要判断刺激在何时出现（如果必要的话可以猜）。更精确他说，判断刺激是出现在一种特殊的光点亮的1秒时间内，还是随后另一种不同的光点亮的1 秒以内。被试者按下提供的两个按钮中的一个来表明他的选择。如果他不知道刺激何时出现，他就必须猜测，因而平均来说有50％的正确性，当刺激及反应结束以后，他需要按下三个按钮中的一个来表示他是否曾经察觉到刺激。如果被试者在通常的位置上曾察觉到刺激，即便非常短暂，他也应按第一个按钮。如果他无法确定，或者认为他可能感受到什么，就按第二个按钮。如果他只是觉得什么也没感觉到，则按第三个钮。

里贝特及同事们设计的实验十分复杂，因而我将只叙述其大致结果。刺激是由每秒72 次的电脉冲组成；在不同次实验中会传递不同数目的脉冲，其幅度保持不变。结果表明，即便脉冲序列过于短暂而不足以引起觉知，被试者的成绩也比随机选择要好。而要察觉刺激（即便这种觉知有不确定性）需要相当长时间的序列。

里贝特和同事们解释说，这暗示着形成觉知需要一定时间的脉冲刺激，遗憾的是，在这些实验中他们并没有系统地改变刺激的强度。但这些及较早的工作已表明，提高一个固定时程的序列的强度可以改变被试者的反应，即从无觉知状态到有觉知状态。简而言之，在躯体感觉系统中，一个弱的或短暂的信号能影响行为但不引起觉知，而较强或较长时间的同样形式的刺激则能使觉知出现。由较强或较长时间刺激引起的精确的神经行为尚有待确定。

这一结果意味着，当试图解释盲视时，我们不能忽视一种类似的解释，即，从侧膝体到诸如V4区的通路太弱，不足以产生视觉觉知，但足以对人的行为产生影响。

虽然本章描述的实验尚不能得出任何关于视觉觉知的精确的神经关联的强有力的结论，但它们确实表明通过实验途径来研究意识是可能的。只要我们热情而执着地追求，这样的实验最终一定能导致问题的解决。

另一个平行的途径是试图猜测答案的一般本质，并把它仅仅作为进一步实验的指导。没有这种指导，实验便无法进行，其中一些猜测性的观点将在下一章概述。它们至今尚未形成一个和谐的观点集合，而更像是尝试性建议的大杂烩。不过我们将看到，它们当中的一些可以合理地组织在一起。

============================

①这样一条曲线称为“心理测量曲线”。

①在快速眼动（REM）睡眠上，脑波与清醒时很相似，表明这时脑至少是部分有意识的，如同我们做梦时好像是有意识的。而慢波睡眠（非快速眼动）的脑波与警觉时相差很大，此时很少做梦。因而有理由假设慢波睡眠时我们通常是无意识的。

②他们也测试了一些侧膝体的神经元。

①即，神经元对刺激的发放卒与背景发放率之比更高。

①如果任务是简单的，那么发放大致相同。如果颜色的鉴别变得更为困难，注意会提高发放率。

①丘脑后结节包括三个主要部分和一个较小的部分。其中两部分前区和侧区是与视网膜区域相对应的，每个均有一个或更多的关于视野的投射。它们与大多数初级视觉区域有双向连接，并接受来自上丘的很强的、非双向连接。第三部分称为中丘脑后结节，并不具有与视网膜区域的对应，而主要与顶叶及额叶有双向连接。它可能对其他感觉反应，而不仅仅是视觉它可能更多参与认知过程，而很少参与形成生动的视觉觉知。

②回想一下，上丘与眼动控制有密切联系，而眼动控制是视觉注意的另一种形式。另一方面，从上丘到丘脑后结节的输入，看来更多的与视野不同部位中显著特征有关。

①安德森（Jim Anderson）和范?埃森（David van Essen）也提出了这种观点，作为他们的移动回路理论的一部分。

①由于两个原因我将不描述这些实验：它们并不直接与视觉系统有关而这是我涉及的主要方面，而且很难解释并引起了争论。这样，如果要全面讨论它们，要用一定的篇幅来描述。这作为一个旁证来说大长了。它们更多的与自由意志问题有关，将在跋中作简要讨论。

复第十五章一些实验

家园

第十六章种种推测

第十六章种种推测

“无论何时我宁愿犯一个前进中的错误，只要它充满不断自我改正的种子。而你就抱看你的僵化的真理去吧！”

――维弗雷多?帕雷托（Vilfredo Pareto) ①

在一个指定时刻，某些神经元的发放与视觉感知的某些特性有关联。到此为止所概述的实验将有助于我们去识别这些神经元。在猴子脑的一侧的视觉皮层区域大约有五亿个神经元。是否存在一些线索能将我们引向所寻找的神经元呢？

存在这样一种可能性，即虽然在任何特定时刻这些神经元中只有一小部分会成为觉知神经元，但它们全都具有扮演这一角色的潜力。从双眼竞争时神经元的行为来看这似乎不大可能（见上一章的讨论）。不过也有可能有些非觉知神经元却在某些场合起这种作用。更为可能的是存在若干种形式各异的视觉觉知，对应于简单特征的觉知可能十分短暂，而生动的视觉觉知则维持时间更长一些；或许还有一种更深层的形式，它确实是与视觉有关的，但并不与好像出现在脑中的视觉“影像”相对应。我在概述戴维?马尔的观点（见第六章）和杰肯道夫的观点（见第十四章）时已经涉及这个问题。为了把问题简化，让我们把话题集中到生动的视觉觉知上（此时杰肯道夫的观点大致等同于马尔的2．5维图）。

我们的视觉世界的内部图像有一个显著的特征，那就是它组织得相当好，心理学家会很乐意向我们展示它并不像我们常常想像的那样有规律――即，我们对相对大小和距离的判断并不总像工程师的图纸那样精确。但在一般情况下我们观察周围环境的时候很少会把它们弄混。真实的外部世界永远存在于那里，这是事实，因而脑可以利用这一点来检验它可能做出的任何暂时的判断。但是，即便如此，当我们的脑产生一个关于眼前的视觉世界的符号表象时，该表象在空间上仍组织得非常好。

如果视觉等级所有层次上的神经元都对它们所响应的特征在视野中的精确位置十分敏感的话，这就不会让人感到十分惊讶了。但我们已经看到这并非事实。有的神经元对复杂物体（如一张脸）的反应特别好，而不管这张脸是直接位于动物的凝视中心，还是稍微偏向一侧，甚至比正常的正上方位置更偏一些，该神经元的反应都几乎一样好。这是合理的。对于所有的高层次特征，几乎不可能在每个可能的位置上都有一个独立的神经元与之相对应。不可能有足够多的神经元来完成这个任务。

另一方面，V1区的神经元，确实对有关特征（诸如朝向、运动、颜色、视差等）在视野中的准确位置敏感。它们之所以能做到这一点，是因为那些特征相对简单且固定不变。同时，这也得益于V1区中处理出现在凝视中心附近的特征的神经元特别多。

在1974年，心理学家彼得?米尔纳（Peter Milner）发表了一篇颇具洞察力的文章(1)。在文章中他主张，基于上述原因，初级视皮层（如vi区）也像高层视皮层一样被紧密包括于视觉觉知中。他猜测，其实现机制可能涉及了从视觉等级高层的神经元向低层的大量反馈。目前尚不清楚这些反馈的确切功能。由于它们是皮层之间的连接，它们都来自那些传递兴奋性的神经元。关键问题是它们的强度有多大。对此见解各异。有一种可能是，虽然这些反馈足以调节由其他输入引起的任何发放，但通常仅靠它们的强度尚不能使细胞快速发放。这可能意味着其作用对于后续的几个阶段来说大弱，不足以产生影响，如果区域C反向投射到区域B，而B 同样也反向投射到区域A, 人们就可能怀疑，除非从C有直接的反馈到A, 否则在C发生的事件能否间接地通过B 而对A产生足够的影响。我们将此图解为：

A<--------B〈----------C

（仅显示回传通路）。C能影响A吗？或许我们需要一条附加的通路（显示在另外那两条通路的上方）来做到这一点？

ㄌ……………<………………ㄉ

↓ ↑

A〈----------B<----------C

因此我们会问，猴子脑中的哪些皮层区域直接反向投射到了V1 区？

参照图52的连接示意图我们可以看到，几乎所有不高于V4和MT层次的视觉区域确实有直接返回v1的连接，而大多数等级上更高层次的区域则没有这种连接。这是否意味着仅仅是图52中较低部分的神经元直接与生动的视觉觉知有关呢？

由于皮层V2 区也很大，并具有完全的视网膜区域对应，作为一种替代，或许我们只需考虑那些向Vl或V2 有反向投射的区域。这将涉及更多的皮层区域，但不包括颞下区域（那些名字以IT开始的区域）。

我相信这些观点会包含一定的真实性，但其论据是站不住脚的，无法作为引导我们探索的依据。它有所暗示，但并不令人信服。此外，更新的工作表明向回投射到V1 区的皮层区域比最初想像的要多。此时最好是在探索问题的过程中暂且将此事记在心里，但并不过多地相信它。在这一阶段，最重要的是更多地去了解关于这些众多的皮层反馈的解剖学和行为学。

另一种可行的策略是研究在某种意义上觉知是否需要脑与自身的通讯的参与。用神经学的术语说，这或许意味着像杰拉尔德?埃德尔曼（Gerald Edelman）曾经提出的那样，经过一步或多步之后能回到出发点的再进入通路是必不可少的。然而问题是很难发现一条通路不是再进入的。从该判断规则来看，海马是意识的确切位置（由于它的大部分输入来自内嗅皮层，而它的大部分输出回到那里，故是属于再进入的），但事实并非如此。这个反面的结果表明，我们必须小心地使用再进入规则。

再进入通路最简单的形式也许就出现在仅仅两个皮层区域之间。例如，区域A投射到区域B, 而B 也投射到A; 但通常这种情况总会出现，它并不能给我们更多的帮助。我们能否将再进入的观点更加精确，并使之更加有用呢？

回忆一下，对于许多皮层区域，如果区域A投射到B的第4层，那么B 并不投射到A的第4层。反向投射避开了那一层。我们可以用符号表示为：

<-------

A B

――――>

其中实线箭头表示“进入第4层”。这表明我们只需在少得多的情况下寻找两个彼此投射到第4层的皮层区域，用上面的约定即是

<-----

A B

----->

在图52的等级中，同层次上的皮层区域之间存在这种情况，但不总是如此。 MT、V4和V4t就是明显的例子。

这个观点对我很有吸引力。很容易得到一些理论上的论据，使它具有一定的学术地位。遗憾的是，这种所谓的第4层的精细的神经相互连接细节尚未得到仔细研究。这种观点确实值得关注。

让我们来尝试一种相当不同的途径。到目前为止我们主要在谈论皮层区域。我们能否更进一步，试着猜测一下皮层的哪些层可能参与了表征觉知呢？或者更进一步，在这几层中哪些类型的神经元可能参与了呢？现在我们确实有了为数不多的零散的证据。

有一类引人注意的皮层神经元，它们是第5层的一些锥体细胞。它们是投射到皮层系统之外的唯一的神经元（我指的皮层系统是大脑皮层及丘脑、屏状核等与此紧密相关的区域）。可能有人争辩道，在脑中，从某一部分传到其他部分的应当是神经计算的结果。我已经说过，视觉觉知可能就对应于这些结果的一个子集。这使人们对这些特殊的锥体细胞感到好奇，它们还有其他不寻常的特性吗？（归根结底，科学家所谓的“证明”就是在对一个物体或概念的许多显然不同的方面终究达成一致。）事实上，其中一些神经无能以一种特殊的形式发放。许多神经科学家发现这种神经元①趋向于“成簇”发放。他们将电流注入皮层切片上的许多不同的单个神经元中，发现其发放模式有三种类型。第一种对应于抑制性神经元，第二种是大多数锥体细胞，但第三种神经元看来大部分是第5层较大的锥体细胞，它们在这种环境倾向于成簇发放。这些细胞的顶树突延伸到皮层的顶层（第1层），在那里它们可能接受前面提到的反向投射的输入。

所有这些证据相当粗糙，仍使人不禁怀疑这些第5层的锥体细胞是否与觉知密切相关。即使第5层的锥体细胞确实表达了皮层计算的“结果”，也不能由此得出在各个皮层区域上所有这样的神经元发放时就产生了某种形式的觉知。形成觉知或许还需要其他一些机制，比如说，某些特殊的短时记忆形式，如本章后面讨论的回响回路。

虽然这些观点还只是推测，它确实勾画出了一种重要性，即当一个神经科学家报告某些实验结果时，他应当知道他所记录的神经元是在哪一层，如果可能的话，还应知道它是哪种类型的神经元。在研究警觉的动物时，这通常会有技术上的困难，尽管更加精心设计的新方法能使之变得容易些。

更为一般的观点认为我们应更为密切地注意皮层的各个层次。虽然一个神经元的树突和轴突经常延伸到几个层，但细胞体位于哪一层也许在正常胚胎发育过程中是由遗传确定的。（与之相反，神经元的连接细节则主要受它的经历影响。）如果确实存在某些特殊类型的皮层神经元，其发放与我们所看见的相关，那么我们可以期望这些神经元的细胞体仅仅位于一个或少数几个皮层层次或亚层中。

脑试图理解进入到眼睛的信息，并以一种紧凑的、组织良好的方式来表达它，其结果就是视觉觉知。但除非它对生物体真的有用，否则没必要这样做。可能有几处不同的区域需要它。这些信息在脑中被送到哪些部位呢？两个明显的部位是海马系统（包括事件记忆的临时贮存或编码）和运动系统（特别是它的较高的规划层次）。我们能否从这两个目的地跟踪回传连接来确定皮层上视觉觉知的位置呢？

遗憾的是，目前这种方法带来的困难比它所解决的更多。视觉觉知很可能与其他感觉（如听觉和触觉）的信息在某个阶段结合。当你喝一杯咖啡胼，你能感觉杯子的外观及用手摸的感觉，还有咖啡的气味和味道。高级视觉区域确实投射到多重感觉的皮层区。目前尚不清楚的是，2.5维略图的生动的表面视觉觉知，以及三维模型的不那么形象化的信息，哪一个与送到海马及运动系统的视觉觉知的类型关系更密切。或许二者均是需要的。

目前对皮层视觉区、多重感觉区与海马结构之间的解剖学连接已经了解很透彻了（见图52）。它们清楚地表明，视觉区中如V4和MT区以及颞下皮层，并不直接投射到海马。视觉信息必须通过其他皮层区才能到达那里。遗憾的是，当前我们关于这些区域神经元的行为的了解还相当肤浅，还需要作进一步研究。

目前对到运动皮层的通路已开展了一些研究，但仍有待深入。此外，还有其他路径更为间接地到达运动皮层。从皮层有大量通路到纹状体，有趣的是这些连结也来自第5层的一些锥体细胞。信息从那里传向丘脑的一部分，再传到皮层的多个运动和前运动区。还有一个通路从皮层到小脑，然后返回到丘脑，再到皮层。这些通路中的一些或许参与了“无意识的”、相当机械的活动。如果我们希望了解各种形式的视觉以及其他感官的觉知，还需要更多地通过实验对脑的这些部位进行研究。

觉知神经元的发放常常可能就是有关的神经网络决策而得的结果，这是它的特点之一。做出公正的妥协是个线性过程，而做出一个敏锐的决策则是高度非线性的。比如说，选举美国总统是一个非线性过程，而按比例选代表则更接近于线性，至少在每个人投完选票以后是这样。神经元及经扩展而形成的神经网络，其行为是高度非线性的，原则上这是没有困难的。

对于神经元而言，这个机制很可能像总统选举那样是胜者为王过程――即有许多神经元相互竞争，但仅有一个（或极少数）能获胜，这就是意味着它的发放更为剧烈，或以某些特殊形式发放，同时其他所有神经元则被迫发放更慢，或者根本不发放。

这在人工神经网络中是很容易实现的，只需使每个神经元具有兴奋性输出，同时抑制其他所有竞争者即可。活动最强的神经元有希望压制所有的对手（就像在选举中那样！）但对于真实神经元而言就不那么简单，因为大多数情况下单个神经元的输出只能是兴奋性的或抑制性的，而不能二者兼有。有许多种策略可能避开这个困难，比如，使得所有兴奋性神经元刺激一个抑制性神经元，而后者反过来又抑制所有的兴奋性神经元，那么对平均抑制优势最大的那个神经元则有可能成为胜者。设计一个能令人满意地执行胜者为王操作的神经网络需要一定技巧，但确实是可以做到的，特别是如果允许有不止一个获胜者的话。

似乎没理由认为自然界不曾进化出这种机制。问题在于如何发现在脑中正在进行这种操作的准确位置。到目前为止我们对皮层内部及附近的高度复杂的局域回路的了解还不够，不能有很大帮助。当然随着我们的知识的增加这将有所改变。人们也许会发现皮层内的神经相互作用十分复杂，以致其中不包含简单的机制。但也可能这种关键过程使用了一些特殊的神经策略，我们所能做到的只有密切注视种种有希望的迹象。觉知并不总要求在两个或多个选择中作出决定（如同看内克（Necker）立方体），这便问题变得复杂化。在其他情况下，在不同来源的信息间达成妥协或许更为有效，例如利用不同的深度线索判断视野中一个物体的距离。反之，在判断一个物体是否在另一个物体的前面并部分遮挡了它时，决策是必不可少的。

迄今为止我们寻找觉知神经元可依赖的线索相当少，虽然它也指出了一些有希望的方向。我们是否还有更多可循的途径呢？研究短时记忆的神经机制能否使我们获得关于视觉觉知的一些有用的东西呢？事实上似乎可以肯定没有短时记忆我们便不会有意识，但它应该短到何种程度，它的神经机制又是什么呢？

回想一下，记忆有两种主要类型。当你主动回忆某件事情时，必定在你的脑中某些地方有神经元发放来表达这个记忆。然而。你能记忆许多事情，诸如自由女神像，或是你的生日，但在某一时刻你并不在回忆它们，一般情况下，这种潜在的记忆并不需要相关的神经发放。在贮存记忆时，许多突触连接的强度（以及其他参数）被改变了，使得在给定合适的线索后，所需要的神经活动能被重新生成。这样记忆就贮存在脑中了。

活动回忆和潜在记忆，（这两种记忆形式中）哪一种参与了我们所感兴趣的极短时记忆呢？比较可能的是活动形式的记忆，即，你对一个目标或一个事件的立刻的记忆很可能是以神经的主动发放为基础的。这又是怎样发生的呢？我认为至少有两种可能的方式。

由于神经元具有的某些内在特性，如它的许多离子通道的特点，一旦它被激发之后，可能会持续发放。这种发放会持续一段时间后消退，或者该神经元在接受到某些使它停止发放的外界信号之前一直发放。而第二种机制则有很大差别，它不仅涉及神经元本身，还与其他神经元的连接方式有关。可能存在一些“回响回路”，即由神经元组成的一个闭环，环上的每个神经无要使下一个神经元兴奋，并保持这种活动性不断地循环。这两种机制都可能出现，它们并不互相排斥。

此外，是否可能具有某些潜在形式的短时记忆呢？这将意味着参与的神经元开始受到刺激而发放，继而停止发放：但如果有一个足够强的线索唤醒潜在记忆而成为活动记忆，这些神经元会迅速再度开始发放。但是，除非第一轮的发放在系统中留下了某些痕迹，否则这又怎能发生呢？或许，有关的突触强度（或其他神经元参数）能瞬间改变，可以在短时间内体现这种短暂的潜在记忆？事实上，是否有实验证据表明存在这种突触的瞬间改变呢？附带提一下，克里斯托夫?冯?德?马尔斯博格（Cristoph von der Malsburg）在前面提到的一篇相当难以理解的理论文章中曾提出这种变化。

克里斯托夫有所不知，此前已有一些关于瞬间突触改变的实验证据。它们最早是在50年代被发现的，位于神经和肌肉结合的地方(即激发肌肉的神经与该肌肉接触的地方），离脑很远。不久以后，在海马也发现了类似的瞬间突触改变（综述见参考文献6）。当轴突脉冲到达一个突触时，它几乎同时改变了该突触，以使该突触强度增加。一个快速脉冲序列可产生一个较大的增长。这种突触强度的增加随后以一种复杂的方式衰减，有些较快，约50毫秒；而慢者衰减时间在几分之一秒到一分钟左右。这正是短时记忆所涉及的时间。还有一些证据预示这也出现在新皮层的突触上。看来这主要是由突触的输入一侧（突触前侧）的改变引起的，并可能牵涉到附近的钙离子，以及突触结合处附近的突触囊泡的运动。①无论是何原因，几乎可以肯定它是存在的。其大小是可察觉到的。

遗憾的是，现在关于这些瞬间改变的工作极少，这主要是由于突触强度的长时程改变（一个当前很热门的话题）更容易研究。大多数神经网络的理论工作也没有考虑这种情况。因此我们处于很奇怪的境地：一种对意识（特别是视觉觉知）可能是十分重要的现象，同时被实验学家和理论学者忽略了。

或许这种突触权重的瞬间改变对短暂维持回响回路也是重要的。有关突触强度的增加有助于回路保持其回响发放。

如何防止这种持续的发放过度传播井影响其他回路，这个问题更困难。脑中有大量的复杂回路，因此如果回响回路确实存在的话，要限定它的准确位置几乎是不可能的。这种类型的回响（与活动的短时记忆有关）是否可能仅出现在一个或少数特殊的位置呢？是否有迹象表明这种回路在构建时与附近具有相同形式的回路多少有些隔离，从而使记忆不会以一种无控制的方式传播呢？

有一条回路被认为可能参与了极短时记忆。它从丘脑投射到皮层第6层的一类锥体细胞，而这些细胞又有信号返回丘脑的同样部位。这些丘脑神经元和皮层神经元都只有极少的向侧边伸展的轴突侧枝，这样它们可能极少与其近邻有相互作用。这使它们具有刚才提到的部分隔离性质。

对通路的研究主要集中在皮层V1 区及其到侧膝体的连接。其中从侧膝体到第6层的锥体细胞的前向通路，看上去很弱。回传通路从第6层到侧膝体，具有极大量的轴突，可能是从侧膝体到第4层这一主要的前向连接的5至10倍。这本身很令人吃惊，特别是很难发现它们具有什么功能。然而，有关这一通路的大多数实验是在动物被麻醉情况下进行的；此时极短时记忆可能很弱甚至不存在，因而动物是无意识的。利文斯通和休伯在数页前提到的文章中，指出他们发现侧膝体神经元的活动在慢波睡眠时降低了。这可能产生影响。虽然信号能从侧膝体传到皮层V1 区（如他们发现的那样），但这些信号不够大，无法维持任何回响活动。现在已经知道有来自脑干的通路可以在慢波睡眠期改变侧膝体的活动（同时，通过延伸也可改变丘脑其他部分的活动）。

那么可以假设这些第6层的神经元与意识的一个关键因素――维持体现极短胼记忆的回响回路――紧密相关。这与早期的一般观点是一致的，即主要是皮层较低层次的活动一般与意识有关，特别是与视觉觉知有关。

是否可能存在与所有皮层区域关联的这种回响回路呢？换句话说，是否所有的皮层区域都在第6层具有锥体细胞投射到丘脑的某些部位并从那里向回投射到同样那些第6层的锥体细胞呢？很遗憾，我们对此尚不完全清楚。或许只有感觉处理（它们具有可察觉的第4层）的低层及中间层次具有这种短时记忆形式所需要的第6层的回响回路。这也是杰肯道夫提出的有意识的觉知所需要的。或许一个到第4层的较强的输入能使第6层的回响回路激起更大的活力。如果所有这些都被证明是真的，这把脑结构和杰肯道夫的假设有意义地联系在一起。这种可能性令人振奋。

让我们先把这些推测放到一边。是否有证据表明神经元的持续发放与短点记忆的某些形式有关联呢？在前人工作的基础上，那鲁大学的帕特丽夏?戈德曼- 拉基克（Patricia Goldman一Rakic）和她的同事们做了这样的实验。他们训练一只猴子凝视电视屏幕中央的一个点，同时在屏幕其他地方随机地呈现一个目标刺激。当目标不再呈现，经过一段延迟后，要求猴子把眼睛移到刚才目标所在的位置。实验者研究了动物脑前额叶区视觉神经元的反应。通常当目标在屏幕的一个特定地方呈现时，有一个特定的神经元会对它作出响应，而其他的神经元则会对屏上不同地方的目标作出响应。引人注目的是，这种神经元通常在刺激被撤掉后许多秒仍能维持发放，直到猴子做出反应。此外，如果这种活动不再保持下去（这偶尔也会发生），猴子很可能会出错误。简而言之，看来这些神经元像是对应视觉特定的空间位置的工作记忆系统的一部分。①或许在脑中其他地方还有这种系统对应于其他类型的工作记忆。这样我们至少有一个例子是神经元的持续发放参与了短时记忆，②虽然其他情况下的证据还有怀疑。

注意到这是一个单一的任务，因此猴子可能在延迟中在脑中重复这个任务，如果猴子必须执行两种迎然不同的任务的话，神经元的活动情况又会如何，尚不得而知。我们也不了解维持这种持续发放的神经机制。就像对注意的研究一样，我们可以说对短时记忆的神经机制的研究已经开始，但要揭示其奥秘还需大量的实验工作。

============================

①维弗雷多?帕雷托（ 1848一1923），意大利经济学家和社会学家，他在华莱士之后将数学应用于经济学，他的关于社会的精英理论对后来的墨索里尼的法西斯党有很大影响。――译者注

①这篇文章是他在休假时写的，并不太为人所知。克里斯托弗. 科赫和我都没听说过。幸运的是，1991年我们和彼得在亚利桑那州参加一次会议，他向我们谈到了这篇几乎被忘记的文章。在这篇文章中他还提出了解决捆绑问题的相关发放观点。这些年来斯蒂芬?格罗斯伯格、安东尼奥?达马西欧、西蒙，厄尔曼等人对这些回传通路的功能提出了类似的观点。

①这些神经元产生的轴突脉冲并不完全很规则，但时间间隔并不随机；相反地，它们倾向于在一个时刻产生一短簇几个脉冲，而不同簇之间具有较长的间隔，并只有极少的脉冲，甚至没有脉冲。

①如果它们仅仅是突触前的――它们并不依赖于突触后侧发生的一切――它们就不可能像冯?德?马尔斯博格所要求的那样是赫布型的。是否存在赫布型的瞬间改变尚在研究中。非赫布型的瞬间改变尚在研究中。非赫布尔型的瞬间变化则长时期被理论家所忽略。

①他们也使用2- 脱氧葡萄糖技术，显示与前额皮层连接的区域，诸如海马结构，后顶皮层，以及丘脑的中背核，在这样的任务时活动更加剧烈。

②遗憾的是，这些神经元的发放方式并不能证明回响回路的存在。

复第十六章种种推测

家园

第十七章振荡和处理单元

第十七章振荡和处理单元

“预言是一件困难的事情，特别是如果它涉及未来的话。”

到此为止我很少谈及可能解决捆绑问题的方法。一个物体（或事件）的不同特征在脑中对应于不同的神经元发放。捆绑问题即如何将这些神经元捆绑在一起。如果在一个感知时刻察觉到不止一个物体，这个问题就显得尤为突出。捆绑的重要性在于它可能至少对某些类型的觉知是必需的。在第十四章曾提到捆绑可能通过有关的神经元的相关发放来实现。一种非常简单的相关发放形式是所有牵涉到的神经元同时以一种节律形式发放（虽然节律对相关而言并非本质）。图57是一个理想化的例子，它显示了神经元每100毫秒有一簇发放，频率约为10赫兹。频率在此附近的节律称为“α节律”。在从头皮记录到的脑波（即脑电波图，EEG）是相当杂乱无章的信号，从中可以探测到这种节律以及其他节律。是否有实验证据表明由神经元组成的群体中存在相关发放呢？

一段时期以来人们已经知道，嗅觉系统中出现了具有振荡形式的相关发放，但直到最近才在视觉皮层中清楚地观察到这种振荡。最令人振奋的结果来自德国的两个研究小组。法兰克福的沃尔夫?辛格（Wolf Singer）、查尔斯?格雷（Charles Gray）和同事们在猫的视皮层观察到了振荡现象。这些振荡在35至75赫兹范围内，常称作“γ振荡”，或不那么精确地称作“40赫兹振荡”。马尔堡的莱因哈德?艾克霍恩（Reinhard Eckhom）和他的同事们独立地观察到了这种振荡。他们使用了一种用于探测“场电位”的电极，能够特别清楚地观察到这种现象。大致说来，场电位所显示的是电极附近的一群神经元的持续变化着的平均活动，它很像是在鸡尾酒会上在一大群人中听到的叽叽喳喳的谈话声。

这些实验比较新，而更新的实验结果仍不断出现，在这里，我仅给出一个非常简单的描述。

正如前面已经叙述过的，当视野内出现适当的刺激时，视皮层的一些神经元会变得活跃起来，并以一定的节律形式发放。在它们附近的平均的局部电活动（场电位）常表现为在40赫兹范围内的振荡。这种神经元发出的脉冲并不随机出现，而是和局域的振荡“合拍的”（见图60）。一个神经元会合拍地发放由两、三个脉冲形成的短簇，有时它也可能根本不发放；但当它发放时，经常是与它的一些神经元“同伴”近似同步的。这些振荡并不很规则。它们的波形更像一个随手画出的粗糙的波，而不像具有恒定频率的非常规则的数学上的波。

辛格和同事们经常发现，当使用两个离得不太远的电极作记录时，如果其中一个电极附近的神经元发放，它们趋向于与另一个电极附近的神经元的发放同步，甚至当两个电极分隔达7毫米远，场电位还可能具有同位相振荡。不过这种情况更多出现在使它们兴奋的运动刺激是属于同一个物体而不是两个物体的时候。只是目前支持最后一个陈述的实验证据还相当少。另外有实验表明，运动光棒能在第一视区和第二视区的相应位置引起同位相的节律发放，这正说明同步可以出现在不同皮层区域的神经元之间。此外也有实验表明同步可以出现在大脑两半球皮层之间。

德国的这两个研究小组都认为，这些40 赫兹振荡可能是脑对捆绑问题的解答。他们提出，标志同一个物体所有不同属性（形状、颜色、运动等）的神经元通过同步发放将这些属性捆绑到一起。科赫和我将这一观点更推广了一步，认为这种与y振荡（在35至75赫兹范围内）合拍（或在此附近）的同步发放可能是视觉觉知的神经关联。这种行为将是其他理论家提出的相关发放的一个特殊情况。

我们还认为，注意机制的主要功能可能是选择一个被注意的物体，然后帮助把所有神经元同步结合起来，这些神经元对应于脑对这部分视觉输入的最佳解释。我们猜测，丘脑是“注意的器官”，它的某些部分控制注意的“探照灯”在视野中从一个显著目标跳向另一个。

这些开创性的实验是猫被轻度麻醉时进行的，在猫被非常深度地麻醉（使用巴比妥盐）的情况下没有观察到振荡，但此时神经元的活动性无论怎样都极度降低了，因而这一结果本身并未提供很多信息。最近的实验是在清醒的猫上进行的（查尔斯?格雷在同我的私人通信中提到此事）。这里也存在 40 赫兹的振荡，因而振荡并不是麻醉引起的伪迹。一些新的实验使用了轻度麻醉的猴，在皮层第六区的也发现了振荡。在清醒的猴子皮层MT区的实验表明，使用运动棒作为视觉输入时能观察到振荡，而当呈现伪随机运动的点组成的图案时则不然。目前尚不能解释这种行为上的差异。这更像是振荡参与了图形／背景的鉴别，而不是视觉觉知。艾伯哈德?菲尔兹（Eberhard Fetz）和同事们在清醒的猴子的运动／躯体感觉皮层的实验中也清楚地观察到了振荡，特别是当猴子完成一项需要注意的复杂的操作任务的时候。

观察到的振荡通常是相当短暂的。它们持续的时间常常依赖于所用的视觉信号呈现的长短。正如一些理论预测的那样，不同位置的神经元集团间的相关振荡仅持续几百毫秒。总的来说，很难让人们相信外部世界在我们的脑中留下的生动逼真的景象完全依赖于如此杂乱、难以观察到的神经活动。

现在你或许会感到迷惑，就像警察在侦破一个困难的谋杀案的初期一样。这里线索很多，但没有哪个能令人信服地指出这个谜团的可能的解答。这就是公众最难以体会的那一类警察工作――沿着众多相当弱的线索进行系统的、费力的追踪。对于视觉觉知方面的科学探索也是如此，我们都想知道答案，但若不仔细地检查不同的“痕迹”，我们就不可能找到答案。可能有许多线索最终被证明是误导甚至完全是错误的。

从所有这些考虑当中我们可以知道，视觉觉知可能有若干种形式；推而广之，一般说来意识甚至可能有更多种形式。我们能否找到某种方法把视觉觉知的这些不同形式同灵长类动物视觉系统的结构和行为联系起来呢？

回想一下我所描述的视觉处理有三个可能阶段：一个阶段非常短暂，大致对应于马尔的要素图；一个则更为持久和生动，大致相应于他的2．5维图和杰肯道夫的中间层次；还有一个三维的以物体为中心的过程，它并不对应于我们所真实看到的东西，而是对我们所看到的物体的某些推测。我生动地看到一个特定物体的轮廓和可视表面，这些表明它是茶杯，并具有所推断出的三维形状。通常看这个词包括这么两种用法。如果我说“你看见那边的那个杯子了吗？”，我在两种意义上使用了看这个词。我可能仅仅是指杯子呈现在我面前的可视表面，但也可能指所推断的整个杯子的三维形状。注意2．5维图和3维模型是一类问题的两种推断，即它们都具有对这个视觉输入的解释，并且都可能是错的。我们对单词的日常用法可能并不精确地描述脑的真实行为。

有一种观点认为视觉处理的每个层次都有某个丘脑区域与之对应，（1）我称之为处理假设。从同一个丘脑核团接受输入的皮层区之间有何共同之处？这个关键问题人们很少提及。

我们都知道在灵长类视觉系统中侧膝体（丘脑的一部分）主要与V1 区有关联。灵长类丘脑有一个很大的部分称为“丘脑后节结”，丘脑的其他视觉区都位于这里（见第十五章）。它具有大量不同的亚区，其中一些亚区可能由若干更小的小区域构成。是否每一个区域都与视觉处理的某一个阶段相关呢？这有两种可能性。这些亚区（其中三个是主要的，即前部、侧部和中部丘脑后节结）可能各与戴维?马尔理论中的一个阶段（即要素图、2. 5维图和三维模型）或某些类似的东西有较强的关联。另有一种可能，即更小的、数目更多的小亚区各与范?埃森的视觉等级（图52）的一个层次有强相关。当然，这两种可能性都具有一定真实的成分。

我所说的“强相关”是什么意思呢？丘脑向皮层发出的连接有两种形式：一种连接到第4层（或第3层）；另一种则避开了这些中间层，通常有很多向第1 层的投射。第一种类型连接可能是驱动性的，而第二种则更像是对已经发生的事件进行调节。我指的强相关是那些到中间层的驱动性连接。在这个简短的考虑中我暂时搁下另一种类型。

最简单他说，处理假设就是任何一个皮层区域仅仅与丘脑的某一部分密切相关。这种观点并非完全不可置信。皮层Vl区只与侧膝体密切相关，而与丘脑其他部分没有关系。人们发现，形成马尔的要素图（或某些类似的东西）的特征确实在V1 区出现。在那里标识的信息对应于相当简单的局部特征，如视野中一小部分图像的朝向。科赫和我设想Vl区可能是十分短暂形式的视觉觉知的所在地。我们认为这并不需要注意机制。实验表明，猴子的注意并不影响Vl区神经元的发放，这可以认为是对此种提法的支持。

我们对其他部分的丘脑连接的细节尚不够了解，不能判断处理假设是否正确。除了v1区以外，每个皮层区域是否仅仅与丘脑后节结的一个部分有强的连接呢？如若不然，它们又怎样连接呢？要回答这个问题还需要更多的实验。也有可能一些丘脑区域恰好与参与视觉觉知的皮层区有强的连接。

那么假设的三维模型阶段又怎样呢？这种情况我们几乎不知从何下手，心理学家欧文?比德曼（Irving Biedrman) 认为这种表象将基于他称为“几何子(1)”的某些原始的三维形状。一些理论家（如托马索?波吉奥）则认为我们脑中所具有的是一个物体的一系列二维视图，以及在它们之间进行内插的能力。这两种观点很可能都是对的。如果所有这些确实存在的话，它们在猴子脑中究竟发生于何处尚有待确定。由于缺乏这些知识，要评价处理假设是困难的，许多乍看起来很美妙的假设常常由于实验的不确定性而停滞不前。

不管怎么说，处理假设确有某些吸引人之处。它表明，我们或许将意识和无意识这两个词用于许多有差异的活动中。它们或许应该由某些短语如“处理单元”或者在某些情况下由“觉知单元”代替。每个觉知单元具有它自己的半全局表象，通常覆盖几个皮层区域。它们可能具有各自的特征处理时间，各自对应于极短时记忆的特征时间（如，V1区非常短，而高级皮层区域则较长些），以及，更重要的是，它自己的特殊的表象形式：Vl区的简单特征，下一个更高皮层表达的2．5维物体，等等，每一种形式的处理单元的特性会依赖子那种特殊表象的内容和组织，有可能每个特殊的丘脑区域都使用它自己的注意形式，允许它的皮层区域集团中的神经元发送信息到丘脑的神经元，而丘脑的神经元又将信息反馈回去，如此通过某种方式来协调它们的发放。这里还有一种推测性的观点（在第十六章描述），即丘脑一皮层一丘脑回路可能是紧密地关系到极短时记忆的回响回路。

当然，在许多不同皮层区域之间有复杂的、并不通过丘脑的直接连接，如图52所示。处理假设并不意味着神经元活动仅有一种流动方式，即从较低处理单元到较高单元。几乎可以肯定存在多个方向的信息流动。

这并不意味着丘脑自己能产生觉知的所有的不同形式。除了丘脑以外，形成觉知还需要各个皮层区域的电活动，这就像指挥需要演奏乐曲的管弦乐队一样。①（由此）至少可以说，如果你对视觉觉知或者意识的其他方面感兴趣，那就不能忽略丘脑。有人或许会元视那“微不足道”的侧膝体，说它不过是一个中继站。但是研究视觉系统的学生会间道：“那为什么一定要有丘脑后节结呢?”这并不是脑中一小块不重要的区域；事实上，它在灵长类进化过程中变得越来越大。它可能具有某些重要的功能，但那又是什么呢？尽管在细节上比较含糊，处理假设确实提出了一种可能性。

丘脑是意识过程的一个关键的参与者。这并非一个新观点。很早以前怀尔德?彭菲尔德（Wilder Penfield）①就提出过这个观点。詹姆斯?纽曼（James NeWman）和伯纳德?巴尔斯（Bemard Baars）在新发表的一篇文章中扩展了后者的观点（这在第二章有简短的讨论），提出，丘脑区的称为“层内核”的某些核团把信息传播到他们所假想的全局性工作空间。这些核团中有一个称为中央核，与视觉系统密切相关。它们主要投射到脑的一个重要的部分――纹状体，也有较少的一部分投射到许多皮层区域。纹状体与运动系统有很强的连接，但它的某些部分也可能涉及更具有认知特性的问题。它是脑中帕金森氏病侵袭的部位之一。

每个层内核向外发出何种具体信息，这尚有待探索(2)。纽曼和巴尔斯也很强调丘脑的网状核的作用（在第十章描述）。就像我曾经考虑过的，他们相信网状核可能参与了对注意的控制。目前还不清楚网状核在丘脑中是否能执行所要求的选择性的程度。它或许只有一个功能，就是当脑处于睡眠或清醒等状态期间全面控制丘脑和皮层的活动。如果丘脑确实是形成意识的关键，网状核很可能参与了意识的某些控制。

这里还须简述一下另一个脑区，即屏状核。它是靠近“脑岛”（皮层的一部分）附近低级皮层区的由神经元组成的薄片。其输入主要来自皮层，而大部分输出也返回到皮层，因而它犹如皮层中的一颗卫星。它接受来自许多皮层区域的输入，并可能向它们全体发回连接。皮层某些视觉区域（但不是全部）投射到它的一部分，（在猫脑中）在那里形成一个单独的视网膜区域对应图。这些视觉输入与其他屏状核的输入可能有所重叠。近几年似乎很少有关于猴子屏状核的工作，因而上面所说的可能有某些不准确之处。（例如，那里可能有两个视觉投射图。）

屏状核的功能尚不为人所知。为什么所有这些信息会汇总到一个薄片呢？人们或许会猜测屏状核具有某种形式的全局功能，但没有人知道那是什么。尽管它只是脑中一块相当小的区域，但也不可完全忽视它。

处理单元很有可能存在一个等级式系统，从某种意义上，有些可能对其他的部分执行某种类型的全局控制。还有一些神经元群（如屏状核和丘脑的层内核）向皮层有很广泛的投射，它们可能就扮演这种角色。

回顾以上两章可以看出，目前并不缺乏看似合理的观点和实验。令人失望的是，目前看来还没有一些观点能以令人信服的方式组织在一起，以形成一个详尽的、貌似正确的神经假设。如果你觉得我就像在丛林中摸索道路，那你是完全正确的。研究前沿领域时，情况通常会这样。但现在我确实感觉到比十年前对“关键问题是什么”有了更深刻的理解。我甚至常对自己说，我能瞥见某些答案。不过这是人们长久地研究一个问题时产生的一种共同的幻觉。我们已经突破到了较高的层次，因此，即使道路还很漫长和艰难，我们已经看到了探索的最佳方向。

尽管有所有这些不确定性，在仔细考虑所有这些非常分散的事实和推测之后，是否有可能描绘出一些全局性的示意图（哪怕是尝试性的），用来大致指导我们穿过面前的丛林呢？让我抛弃那些谨慎，勾画一个可能的模型。现实可能比它要复杂得多，而不大可能更简单。

意识是与某种神经活动相关联的。一个合理的模型认为这些活动发生在皮层的较低层次，如第5、6层。这种活动性表达了主要发生在皮层其他层次上的大部分“计算”的局部的（暂时的）结果。

并非较低层次上所有的皮层神经元都能表达意识。最主要的种类是位于第5层的大的“成簇”的锥状细胞，例如向皮层系统外投射的那些细胞。

除非这些特殊的较低层次的活动由某些形式的极短时记忆维持不变，否则它不能到达意识。有理由认为，这可能需要一个有效的回响回路，从皮层第6层到丘脑，再返回到皮层第4、6层。如果缺乏这个回路，或者第4层太小，就不可能维持这些回响。因此仅有一些皮层区域能表达意识。

处理单元（其中仅有一些与意识有关）是这样一些皮层区域的集合（1），它们处于视觉等级的同一层次上，并彼此向对方的第4层投射。每个这样的皮层区域集合都仅与丘脑的一个小区域有强连接。这样的区域通过同步发放协调与它相关的皮层区的电活动。

丘脑与注意机制密切相关。在进行物体标识操作（特别是图形／背景分离）时所需的特殊捆绑，通常具有调谐的发放形式，它的节律通常在40 赫兹范围内。

参与意识的区域可能影响（不必是直接的）自主运动系统的一部分。（二者之间可能有某些无意识的操作，如思考。）

再重复一下，意识主要依赖于丘脑与皮层的连接，仅仅当某些皮层区域具有回响回路（包括皮层第4 、6层）并具有足以产生明显的回响的强投射时，意识才可能存在。

这个似乎合理的模型就讲这么多了。我希望不会有人把它称为克里克（或克里克- 科赫）的意识理论。在我写下这个模型时，我内心对于材料的取舍颇为踌躇。如果它是别人提出的，我会毫不犹豫地指责它是一碰就塌的纸房子。这是因为它是拼凑起来的，并没有足够的关键性实验证据支持它的各个部分。它唯一的价值在于可能推动科学家和哲学家们从神经的角度考虑这些问题，从而加速意识方面的实验进展。

更加哲学性的问题又怎样呢？我确信当我们完全理解了意识的神经机制时，这些知识将回答两个重要问题：意识的一般本质是什么？进而使我们可以有意义地谈论其他动物的意识的本质，以及人造机器（如计算机）的意识。意识给有机体带来了哪些好处，从而我们可以发现为什么会有意识。最终或许会发现，视觉觉知的出现是因为它的详细信息需要发送到脑的若干不同区域。把这些信息彻底明晰化可能比把它们以隐含的方式沿着不同的通道传递更有效。具有一个单独的清晰的表象也可以防止脑的一部分使用对视觉场景的一种解释而同时另一部分使用另一种相当不同的解释。当信息仅需要被送到一个地方时，它会按照经验而不必有意识便可以到达那里。

真正被证明是困难或不可能建立的是意识的主观本质的细节，因为这将依赖于每个有意识的有机体使用的精确的符号体系。除非我们能够把两个脑以一种足够精确和详细的方式联系到一起，否则我们无法直接地把一个脑中的符号体系传递给另一个脑。即便我们能够做到这一点，它或许还有它自身的问题。但是，如果不了解意识的神经关联，我并不相信这些问题中的有哪个能得到会思考的人们能接受的答案。

我特别要对那些目前相当活跃地工作在脑（特别是视觉）研究领域的许多科学家说几句话。正是他们所持有的相当保守的态度，阻碍了实验研究的顺利进行。

他们过于看重那些我含糊略过的许多复杂问题。他们不应该用这些错误和忽略作为他们不面对本书的广阔的信息的借口。在我们观看时，脑中发生了些什么呢？忽略这个全局的问题而只研究视觉的某些特殊问题，这种作法现在是行不通的。一个门外汉会认为这种态度过于狭隘，而事实正是如此，就像我试图表明的那样，目前视觉觉知问题在实验和理论上都是可以进行探索的。此外，如果我们积极地面对这个困难，我们会开始从一个全新的角度考虑问题，寻找先前显得无关或很少有兴趣的信息（如动态参数或者短时记忆）。我希望不久以后每一个研究人类及其他脊椎动物视觉系统的实验室都在墙上张贴有一个醒目的标志，写着：

意识

就在现在

=============================================

①最近这种观点被哈佛的数学家戴维?芒福德（David Mumford）所发展。吴泉风（音译）送给我的一篇未发表的文章也涉及此。

(2)人们认为中央核参与了凝视的控制。

①某些集合可能仅有一个成员，如Vl区。

复第十七章振荡和处理单元

家园

第十八章克里克博士的礼拜天

第十八章克里克博士的礼拜天

“作为人类真正重要的是我们自己主观的精神生活，包括感官感受，感情，思想，有意志的选择。”

――本杰明?里贝特

意识问题的研究已经提到日程上来了。我们已经了解了视觉系统的复杂性，以及视觉信息是如何按一种准等级的方式进行处理的（这种准等级方式只有部分是我们所了解的）。我还概述了关于视觉觉知的神经机制的几个观点，并概要提出了可能有助于揭示它的机制的几个实验。我们显然还未完全解决这个问题，那么到目前为止已经得到了些什么结果呢？

科赫和我正在试图去做的就是使人们，特别是那些与脑研究有密切关系的科学家，相信现在是严肃地对待意识问题的时候了。我们猜测，真正有用的可能是那些关于意识的一般性的探讨，而不是某些详细的建议。本书所讨论的那些设想并不是一些详细拟定好的、有条理的观点。相反，它们还在发展之中。我相信，我们尚未发现将意识概念化的确切途径，而仅仅是在朝这方向摸索着前进。这正是实验证据如此重要的原因之一。新的结果会引出新的观点，同时也会使我们察觉出旧观念中的错误。

哲学家们试图去寻找解决这个问题的更好的方法，并想指出我们目前思考中的谬误，这当然是正确的。但他们仅仅取得了极少的实质性进展，这是由于他们是从外部观察系统的。这使得他们使用了错误的术语。从神经元的角度考虑问题，考察它们的内部成分以及它们之间复杂的、出人意料的相互作用的方式，这才是问题的本质。只有当我们最终真正地理解了脑的工作原理时，才可能对我们的感知、思维和行为作出近于高层次的解释。这将有助于我们以一种更加正确和严谨的方式理解脑的所有行为，以取代我们今天的那些模糊的庸俗观念。

许多哲学家和心理学家认为目前从神经元水平考虑意识问题的时机尚不成熟。然而事实恰恰与此相反。仅仅用黑箱方法去描述脑如何工作，特别是用日常语言或数字化编程计算机语言来表达，这种尝试为时尚早。脑的“语言”是基于神经元之上的。要了解脑，你必须了解神经元，特别是巨大数目的神经元是如何并行地一起工作的。

读者也许会接受所有这些观点，同时又抱怨我更多地用推测而不是铁一样的事实来谈论意识话题，并且回避了归根结底最让人困惑的问题。我几乎没有涉及可感受的特征（如“红颜色”的红）的问题，而仅仅将它推到一旁并期盼有个最好的结果。简而言之，为什么“惊人的假说”如此惊人呢？脑的结构和行为是否存在某些方面可以向我们暗示，为什么从神经角度了解觉知如此困难呢？

我认为是存在的。我已经描述了脑这个复杂机器的一般工作情况。它可以在一个感知时间内迅速地处理总量巨大的信息。脑是个丰富的相互关联的信息的载体，它的许多内容是连续变化的，然而这台机器却能设法保存它刚刚所做的各种运行的记录。我们通过自己内省得到的非常有限的体验，但除此以外并未遇见到任何机器具有这些特性。因而内省的结果显得比较奇特，这也不足为奇了。约翰逊- 莱尔德也提出过一个类似的观点（这在第十四章引述过）。如果我们能构建一台具有这些惊人特性的机器，并能精确地跟踪它的工作，我们会发现掌握人脑的工作原理就容易得多了。就像现在我们了解了DNA、RNA和蛋白质的功能之后关于胚胎学的神秘感已大部分消失了一样，关于意识的神秘特性也将会消失。

很明显这引出了一个问题：在将来，我们能否造出这样的机器呢？如果能的话，它们看上去是否具有意识呢？我相信，最终这是可以实现的，尽管也可能存在着我们几乎永远不能克服的技术障碍。我猜想，短期之内我们所能构造的机器就其能力而言与人脑相比很可能非常简单，因此，它们只可能具有形式非常有限的意识。或许它们更像是一只青蛙甚至是一只低等的果蝇的脑。在理解产生意识的机制之前，我们不大可能设计一个恰当形式的人造机器，也不能得出关于低等动物意识的正确的结论。

应当强调的是，“惊人的假说”是一个假说。我们已有的知识已足以使它显得合理，但尚不足以使人们就像信服科学――证实了许多关于世界本质（特别在物理学和化学方面）的新观点――那样信服它。其他关于人类本质的假设，特别是那些以宗教信仰为基础的观点，它们的证据更站不住，只不过这本身并未成为否定这些观点的决定性的论据。只有科学的确定性（及其所有的局限性）才能最终使我们从祖先的迷信中解脱出来。

有人会批评说，不管科学家们会怎么说，他们确实相信“惊人的假说”。这只在有限的意义上讲是对的。如果没有一些先人之见的思想指导，你不可能成功地解决一个科学难题。因此，泛泛而论，你信奉这些观点。但对一个科学家来说，这仅仅是暂时的信仰。他并不盲从于它们。相反地，他知道，或许某些时候推翻某个他所珍爱的观点会取得实质性的进展。我不否认科学家对于科学解释有一种先人之见的倾向性。这种倾向是有道理的，不仅仅是因为这支撑着他们的（科学）信念，更主要是因为近几个世纪以来科学取得了如此惊人的成功。

下一件需要强调的事是，意识研究是一个科学问题。科学与意识之间并没有什么不可逾越的鸿沟。如果从本书中能学到些什么的话，那就是我们现在看到了用实验的方法可以探索这个问题。那认为只有哲学家可以解决这个问题（1）观点是没有道理的。过去两千年来哲学家有着如此糟糕的记录，因而他们最好显得谦虚一些，而不要像他们常常表现的那样高高在上。毫无疑问，我们那些关于脑的工作原理的暂时性观点需要澄清和扩展。我希望能有更多的哲学家学习有关脑的足够的知识，以便提出关于脑工作观点，并在与科学证据相抵触时，能放弃自己所钟爱的理论。否则他们只会受到嘲弄。

历史上，宗教信仰在解释科学现象方面的记录是如此的差，几乎没有理由相信这些传统宗教会在将来能表现得更好。意识的许多方面，如可感知的特性，完全有可能是科学所不能解释的。过去我们已经学会了生活在这种局限当中（例如，量子力学的局限），它们仍将伴随着我们的生活。这并不意味着我们将被迫去信仰宗教。不仅仅大多数流行的宗教信仰是相互矛盾的，而且从科学准则来看，它们是建筑在如此脆弱的证据上，以致于只有那些盲目忠诚的人才会接受它们。如果教徒们真的相信死后会有生命的话，那么他们为什么不设计一些有力的实验去证实这件事呢？或许他们不能成功，但至少可以尝试一下。历史表明，许多神秘现象（如地球的年龄），过去教会认为只有他们才能作出解释的，现在都已被科学的探索所代替。此外，真实的答案通常与传统宗教给出的解答相差甚远。如果宗教曾经揭示了些什么的话，那就是它们通常是错的。这种情况在科学探索意识问题时显得格外强烈。现在，唯一的问题是如何着手去解决它以及何时开始。我极力主张应该现在立刻开始研究。

当然，有不少受过教育的人士认为“惊人的假说”是如此的合理，并没什么惊人的。我已在第一章中简要地谈到了这一点。我猜想这些人常常并未理解这一假说的全部实质。我自己有时也发现很难回避头脑中有个小矮人“我”的想法。人们很容易就滑到那个观点当中。“惊人的假说”说的是，脑行为的所有方面都来自神经元的活动。这并不是说，我们用神经术语解释了视觉处理的所有各种复杂阶段以后，就可以因为“看”这一行为确实是“我”所做的而草率地假设它的某些特征不需要解释。例如，除非有一些神经元的发放标志着你脑中的缺陷，否则你就不可能觉察这个缺陷，并不存在一个不依赖于神经发放的独立的“我”去识别缺陷。同样地，你通常不知道某些事情在脑中发生于何处，因为在脑中并没有这样一些神经元，它们的发放标志着它们或其他神经元在脑中的位置。

读者有道理抱怨本书所讨论的问题极少涉及像他们所理解的人类灵魂。我没有讲述任何关于人类最具特色的能力――语言，也没谈论我们如何求解数学问题，或是问题的一般求解。即使对视觉系统我也几乎没有提到视觉想像，或是我们对绘画、雕塑、建筑等的美学感受。没有一个词讲述我们在同自然界的接触中所得到的真实的愉快。诸如自我觉知、宗教体验（它可能是真实的，尽管通常对它的解释是错误的）等话题则完全被忽略，更不要说坠人情网了。一个教徒可能会断言，对他来说与上帝的关系才是最重要的。科学对此又能说些什么呢？

现在这种批评是完全有道理的，但倘若将这些内容加入本书中，那就显得对科学方法缺乏正确的理解。科赫和我选择考虑视觉系统是因为我们感觉到，在所有可能的选择当中，在这方面最容易取得实验上的突破。本书清楚地表明，尽管这种突破并不容易，但它确实有取得成功的机会。我们的其他假设是，一旦我们完全理解了视觉系统，将更容易研究“灵魂”的那些更迷人的方面。只

有时间能够说明这种判断是否正确。新的方法和观点可能会使得其他的探讨途径更有吸引力。科学的宗旨是解释人脑的所有方面的行为，包括了音乐家、神秘主义者以及数学家的脑。我并不认为这能很快实现，但我确实相信，只要我们保持这种探索，我们迟早会到达这种理解。这一天或许在21世纪。我们越早开始，我们就能越早地得到对自然本质的清晰的认识。

* * *

当然，有些人会说他们并不想了解思维如何工作。他们相信，理解自然便是亵读她，因为这消除了对她的神秘感和本能的敬畏感，这些感觉是我们面对那些知之甚少从而留下深刻印象的事物财产生的；他们更喜爱古代神话，即便它们已经和现代科学有明显矛盾。我并不同意这种观点。对于我来说，现代的宇宙观――它比我们的祖先所想像的要古老得多，也大得多，并且充满了神奇的、难以预料的物体，如快速转动的中子星――使早期以地球为中心的世界显得过于自大和狭隘，这种新的知识并没有减少对其的敬畏感，反而大大地增加了这种效果。我们关于动植物结构（特别是我们的身体）的详细的生物学知识也起到了同样的作用。赞美诗的作者写道：“我是多么神奇和美妙啊！”，但他也只不过是非常间接地瞥了一眼精巧和微妙的分子结构的本质而已。进化过程中包含了许多我们祖先一无所知的奇迹。 DNA的复制机制，尽管其本质是那样简单和优美，令人难以置信，但在进化过程中却变得十分复杂和精细。如果一个人看到这些而并不感到很神奇的话，那一定是感觉迟钝。认为我们的行为是以大量相互作用的一群神经元为基础的，这并不会贬低我们对自身的看法，相反大大扩展了我们的观念。

有报道说，有一位宗教领袖看到一幅很大的单个神经元的示意图后叫道：“脑就是像这样的啊！”虽然单个神经元是一件精密的、设计良好的奇妙的分子机器，但我们的脑并不是由单个神经元构成的。真实脑的情况是：神经元有数十亿个，它们之间的相互作用模式十分复杂且不断发生变化，而这些神经元相互之间的连接方式从细节上说因人而异。我们平常用来描述人类行为的方式是经过删节和近似的，它只不过是我们真实自我的一种模糊的描述。莎士比亚说过，“人是一件多么伟大的艺术品！”如果他生活在现代，定会给我们写出衷心庆贺所有这些伟大发现的诗篇。

如果“惊人的假说”能最终被证明是正确的话，它也不太可能被广泛接受，除非它的表达方式能迎合大众的想像力，并能满足他们的需要，以他们所容易理解的方式形成对世界和自身的和谐观

点。具有讽刺意味的是，虽然科学的目标恰恰是形成这样一种统一的观点，但许多人发现目前大多数的科学知识过于没有人性，过于难以理解。

这并不奇怪，因为大多数科学研究的是诸如物理、化学等领域及其相关学科（如天文学），这些都与大多数人的日常生活多少有些距离。将来这会有所改变。我们可以期望更准确地理解诸如直觉、创造力和美学享受等精神活动的机制，以便能更清楚地掌握它们，并如所希望的那样更好地从中得到乐趣。自由意志（见跋）将不再神秘。这就是为什么如果以一种过于幼稚的方式理解我们的假说就会产生误解而一无所获。深入洞察脑的神奇的复杂性会使我们产生惊奇和赞叹，而这种复杂性我们今天只能隐约地感受到。

尽管仅从科学事实中我们可能无法推断出人类的价值，但是，如果假装说科学知识（或非科学知识）对我们如何形成价值观没有影响，那是没有说服力的。我们需要灵感和想像来构成一个新的世界体系，但建筑在错误基础上的想像最终是不会成功的。我们可以做梦，但现实已经无情地敲响了大门。即使我们所感知的现实大多是我们脑所构想出来的，它也必须与现实世界相一致，否则最终我们会对它越来越感到不满。

如果科学事实足够明显，并被很好地确认，而且是支持“惊人的假说”的，那就可以说人具有实体的灵魂的观点就像人具有“生命力”这个古老的观点一样是不必要的。这与当前数以亿计的人的宗教信仰是直接矛盾的。人们又怎样接受这种激进的挑战呢？

或许有人会自慰地相信大多数人会被实验证据说服而立即改变他们的观点。令人遗憾的是，历史表明恰恰相反。当今关于地球年龄的证据已确凿元疑了，但是在美国有数百万原教旨主义者仍然固执地坚持那种幼稚的观点，按圣经字面推断地球年龄相对比较短。他们也否认在这漫长的时期内动植物出现了进化，发生了剧烈变化，虽然这一点也早已被确认。这很难使人相信他们关于自然选择过程的言论是无偏见的，因为对宗教教条的盲从早已预先决定了他们的观点。

在我看来，有几种原因导致了人们固执地坚持这些陈旧的观念。在幼年时影响我们的一般观点，特别是道义上的观点，常常在我们脑中根深蒂固。要改变它们是十分困难的。这有助于解释为什么宗教信仰被一代又一代地传下来。但这种观点最初是怎样产生的？为什么它们常常是错误的呢？

原因之一是我们对全面解释世界和我们自身的本质有着非常本能的需要。各种宗教都用一种一般人所容易理解的方式提供了这样的解释。应当记住，我们的脑正是在人类处于狩猎采集者的时期大大发展起来的。在一小群人的合作当中，在邻近的竞争部落间的敌对行动中，到处都存在着强大的选择压力。甚至在本世纪，在亚马逊丛林中，在厄瓜多尔的偏僻地区，部落人员死亡的主要原因是部落间相互格斗所造成的伤害。在这种环境中，一种共同的信仰能增加部落成员之间的凝聚力。这种需要不太可能是因为进化而在我们脑中建立起来的，毕竟，我们高度发达的脑仅仅能使我们足够机敏地生存和繁衍后代，它不是为了发现科学事实而不断进化的。

从这种观点来看，这些共同的信仰并不必完全准确，只要人们相信它们就可以了。我们最有特色的能力是能流利地处理复杂的语言。我们不仅能用语言表达外部世界的事物和事件，还能表达更为抽象的概念。这种能力导致了人的另一种突出的特点，即我们具有几乎无限的自我欺骗的能力，但这很少被提及。我们脑发展成为从可用的有限的证据中去猜测最合理的解释，它的本质特征使得在缺乏科学研究训练时，我们几乎不可避免地陷入错误的结论中，对于那些相当抽象的事物尤为如此。

最终的结果尚有待观察，或许“惊人的假说”被证明是正确的；或许，某些接近于宗教的观点会变得更加合理。当然还有第三种可能，即事实支持一种全新的替代观点，从一种与许多神经科学家如今所支持的唯物主义观点以及宗教观点都显著不同的角度来看待“心- 脑”问题。只有时间和更多的科学工作能使我们作出决定。不管答案是什么，要达到它，唯一切实可行的方法是进行详细的科学研究。所有其他的途径都不过是吹口哨给自己壮胆罢了。人类对世界具有无止境的好奇心，不管传统和宗教仪式曾在一段时间内有多大的魅力以消除我们对其合理性的怀疑，我们永远也不会满足于昨日的猜测。我们必须不断地追求，直到形成了关于我们生存的浩瀚宇宙以及我们自身的明了的、合理的图像。

=================================================

①原文为“Dr. Crick’s Sunday Moming service”，在西方，人们在星期天早上到教堂做礼拜。教堂的神职人员负责向教徒讲道，本章为全书正文的最后一章，作者在此总括“惊人的假说”的主要思想。故以做礼拜布道作比喻。――译者注

①不客气他说，哲学家通常是这样一种人，他们更喜爱想像中的实验而不是真实的实验，并认为解释这样一个现象用日常用语就足够了。

复第十八章克里克博士的礼拜天

家园

关于“自由意志”的跋 END

关于“自由意志”的跋

“意识，意志使它充满活力……”

――托马斯?哈代（Thomas Hardy)

从许多方面来说，“自由意志”是一个老话题了。许多人认为它是一件理所当然的事，因为他们感觉到，通常他们可以自由地想干什么就干什么。律师和神学家必须面对这个问题，但总的来说哲学家对这个问题已失去了兴趣。心理学家和神经科学家几乎从不提及这个问题。那些关心量子测不准原理的少数物理学家和别的科学家，有时猜测不确定性原理也许会是“自由意志的基础。

1986年以前，我本人还没有注意“自由意志”。当时，我收到老朋友的一封信，情况才有所改变。他叫卢斯. 里纳尔蒂尼（LuisRinaldini)，是一位阿根廷生物化学家。40 年代后期，我与他在剑桥第一次相遇。卢斯和他的夫人现居住在门多萨（Mendoza，阿根廷的一个省城），该城靠近安第斯山脉。一次他来到美国访问期间，想会见一些人，谈谈他的一些想法，当我们在纽约会面时，他告诉我，他与他的朋友在门多萨已经组成一个讨论组，他们对“自由意志”很感兴趣，随后，他写信给我，更详细地谈到这一问题。

直到那时，我浑然不知我个人关于“自由意志”已有了一种理论。但是。从他谈到的一些方法，我能看出，我的一些思想有别于他。那时我把它写出来，十分简短，我坚信我发现了一些什么，并把它寄给他，整个内容不足三十行。我曾把它给哲学家帕特丽夏?丘奇兰德（Patricia Churchland）看过。这样做的部分原因是使这个问题的叙述不致于太傻。她十分乐意给予帮助，在词语上加以明晰化，并附加了一些注记，她认为我的想法似乎是合理的。下面的内容就是我寄给卢斯稍加扩充的版本。

我的第一个假设是：人脑的某个部分与制定进一步行动的计划有关，但不一定执行它，我也假定人可以意识到这个计划，即，至少可以直接回忆起来。

我的第二个假设是：人不能意识到这部分脑所执行的“计算”过程，而只知道它作出的最终“决定”，也就是计划。当然，这些计算将依赖于这一部分大脑的结构（部分由于进化，部分由于过去的经验），也取决于来自脑其他部分的当时输入。

我的第三个假定是：执行这个计划或那个计划的决定受到同样的限制。换句话说，人可以直接回忆起决定是什么，但不知道作出这个决定的计算过程，即使可能知道一个计划在进行中。①

于是，如果这种机器（这是我信中使用的字眼）能像人一样决定自己的行为，即有一个“自身”的映象，那么这种机器看来具有“自由意志”了。

决策的实际起因可能是十分清楚的（帕特丽夏添加的），即：可能是决定性的但却是混沌的。一个非常小的扰动可能造成最终结果的巨大差异。由于这一点，输出结果在本质上成为不可预测，所以，使得“意志”看起来似乎是“自由”的。当然，意识活动也可能影响决策机制（帕特丽夏附加的）。

这样一种机器能够试着解释自己为何作出某种选择（运用内省法），有时会达到正确的结论。而在另一些时候，它将不知不觉，或者更可能进行虚谈，因为它没有意识到作出选择的理由。这意味着一定存在着一种虚谈的机制，只要给出一定量的证据，不管它们是否会产生误导，脑的某部分总会得出一个最简单的结论。正如我们已经看到的，这一切太容易发生了。

这就是我的自由意志的理论。显然，它依赖于对意识的理解（这是本书的主要议题）、大脑是如何计划（和执行）行为的以及我们如何进行虚谈，等等。我不知道整本书里是否真的有点儿新东西，尽管这里的某些细节并没有被包括在以前的解释中。

***

在那之后，我心满意足地将事情丢在一边，接着我在纽约会见了卢斯，随后他访问了加利福尼亚州的拉霍亚（La Jolla），得以同保罗?丘奇兰德（Paul Churehland，帕特丽夏的丈夫）讨论这个问题。我本不想在这个问题上多加思考，但是，一旦引起了我的兴趣，我就发现自己一天到晚在不停地思考着它。

我想知道“自由意志”可能位于脑的哪个部位。显然，“意识”牵涉到大脑几部分的相互作用，但是，大脑皮层的某个特殊部位应当与其有种特别关系，这个想法不是不合理的。人们可能期望，这部分接收来自感觉系统高级水平的输出，又要馈送到运动系统的高级计划水平。

在这一点上，我偶然找到了一个有利于我的理论的证据，这就是安东尼奥?达马西欧（Antonio Damasio）及其同事关于一位大脑受损妇女的病例的描述。她受损伤后，表现出对事物没有反应。她一声不响地躺在床上，脸上带着警惕的表情。她能用眼睛追随别人，但不能自觉地与人讲话。她对任何提问都不回答，虽然看起来她是理解这些问题的。她只是用点头加以答复。她用极慢的语调能重复词汇和一些句子。总之，她的反应极其有限，又总是一成不变。

二个月以后她得到很大程度的康复。她说她以前不能交流，并不感到不安。她能跟上交谈，但她感到“没有什么可说的”而不开口，她的头脑是“空”的。我马上想到“她失去了意志”！那么，大脑的什么部分受损呢？文献中指出，受损部位靠近波罗德曼（Brodmann）区的24 区(1)，在一个叫做“前扣带回”的地方。如果大脑被一切为二，它就位于上顶部的内表面上。我高兴地得知，这部分接收许多来自高级感觉区的输入，又在靠近运动系统的高级水平。

索尔克研究所的特里?塞吉诺斯基小组在工作周内有多次午茶会。这是讨论最新实验结果的理想场合，比如提出一些新的想法，或者只是关于科学、政策和一般新闻的闲聊。我曾参加过一次午茶会，并对帕特丽夏和塞吉诺斯基说，我已经发现了“意志”的部位！它就在“前扣带回”上及它的附近。当我与达马西欧讨论此问题时，我发现他也有类似的想法。他帮助我补充有关这部分脑区的解剖学上的联系。它与大脑另一侧的对应部分有极强的联系――正如我们所知，尽管裂脑人有两个独立的“意志”（看第十二章），而我们正常情况下只能有单个“意志”在起作用。再则，大脑一侧的这一区域有极强的投射到两侧的??胝体（运动神经系统的重要部分），这也正是我们从单一意志当中所要预料的结果。的确，这一切看来十分理想。

过了一段时间，我读了一篇迈克尔?波斯纳（MichaeI Pesner）写文章。在论文中他也提到了一种罕见的病症，由于一种特殊类型的脑损伤引起的“异己手”症。例如，患者的左手可以活动，做一些十分简单的、刻板的动作，但他却拒绝对此手负责。例如，此手可能自发地抓住放在近旁的某个东西，但有的时候却不能把它放下，不得不用右手把它从东西上拿开，有一位患者发现，他不能用他的意志力使“异己手”放开物体，但如果大声地喊：“放开！”，也许它会把抓住的东西松开。

那么“异己手”症是什么部位受损呢？又是靠近或正好在前扣带回上（如果“异己手”为左手，那么损伤位于右脑），也可能是胼胝体的相应部分受损，以致于左侧区域发出指令不能到达由受损的右边区域控制的左手。再则，正如第八章提到的，某种选择性过程前扣带回处于活动状态，这可以从这部分血流增加上看出。

“自由意志”位于或靠近大脑的前扣带裂上，这一想法可能有点新意（1）。实际上，事情可能会更复杂。脑前区的其他部位也可能与其有关联。需要的是更多的动物实验、“异己手”和有关病例的仔细研究，其中首要的是，对视觉意识的神经生物学有更多的了解，并由此增加对其他形式的意识行为的了解。这也是把这些建议附在本书末尾的原因。

致谢

在著书过程中，我曾得到过许多人的帮助，其中少数人为此做出了决定性的贡献。我的同事克里斯托弗?科赫不仅同我一起发展了这些思想，而且在撰稿的几个阶段都作了详尽的评论。谨以此书献给他。我的校订者，Scribners公司的Barbara Grossman，提出了中肯的建议，使文稿得到相当大的改进。多余的一些材料已果断地删去了，而剩余的部分已作了有说服力的校订，以使它更为清晰易读。书中还有难以阅读的部分，这就是我的过错了。担任十六年之久的我的私人助手，Maria Lang 不仅要一章接一章、一个版本接一个版本地辨认我的手写稿，而且为插图的正确格式及获得合法使用权、为完成办公室必要的各种杂务都付出了辛勤的劳动。我要特别感谢他们三位。

我还要感谢对我的手稿的较早版本提出建议与评论的那些朋友们。他们是Tom Albright， Patricia Churchland，Paul Churchland，Odile crick，Antonio Damasio ，Peter Dayan，Ray Jackendoff，Graeme Mitchison， Read Montague，Leslie Orgel，Piergorgio Odifreddi，V.S. Ramachandran(Rama），Paul Rhodes，Terry Sejnowski和Dan Voll。他们的评论已使文稿水平得到很大提高，而且消除了很多错误。他们不应对出现的错误负责。

我还要感谢Jamie Simon，他重新绘制了许多插图及创作了一些新图，还加上了一些简练的注释。

最后，我的妻子，奥黛尔，能够容忍我接连数月全神贯注地思考这些困难的问题。没有她爱的支持和理解，这本书根本不会面世。

=====================================

①邻近的运动附区也被破坏。

(1)约翰.埃克尔斯爵士先前提出，靠近24区（运动附区）可能是“自由意志”所在。

①奥蒂弗雷蒂（Odifreddi）教授对我指出，应当假定，决策与相应行为之间应当有某种一致性。

复关于“自由意志”的跋 END

家园

搬完

收工

全看树展主题 · 分页首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明