摘自 Vectors of Mind —— 图片见原文。
“向外看的人,做梦;向内看的人,觉醒。”——卡尔·荣格(Carl Jung)
[图片:原文中的可视化内容]《回声与那喀索斯》(Echo And Narcissus),约翰·威廉·沃特豪斯(John William Waterhouse)
未经审视的人生不值得过,然而,那里潜伏着“巨龙”。先知提瑞西阿斯(Tiresias)曾警告说,如果“他从不认识自己”,那喀索斯(Narcissus)就会长寿。事实上,他确实死于他所热爱的事物之中:凝视自己美丽的倒影,并被爱人宠爱着。凡事适度,我想是这样。
关于何以为人,哲学家们争论了数千年,而内省始终是一个有力候选。向内凝视需要数学上的递归原理:自我感知自我。近来,语言学家也加入战局,并带来了来自计算机科学的洞见。出人意料的是,他们对“人性”的问题采取了截然不同的路径,却得出了同一个答案。递归使我们能够想象未来,然后朝着它努力。有了递归,我们既能在天上建造空中楼阁,也能在地上建造城堡。通过进入模因生态位(memetic niche),我们得以支配所有仅生活在物质世界中的物种。
如此分歧的方法能够收敛,或是某一单一属性能解释如此之多,实属罕见。因此,本系列将对递归在人类进化中的作用采取一种“极大化”(maximalist)的立场。这片领域早已被反复耕耘,前两篇文章将回顾他人的工作:什么是递归,它何时演化而来。我曾提出一个理论:递归在一定程度上是可以被教授的。后续文章将讨论这一想法如何暗示出一条更好地同步进化证据与考古证据的时间线。最后,我将探讨一个可能性:自我意识最初是带有性别差异的。女性首先发现了内在生活,男性随后跟进。
计算机科学#
“Money for nothing, chicks for free” ——恐怖海峡乐队(Dire Straits)
随着年岁渐长,人会意识到世上没有免费的午餐。一切都有代价;总有“坑”。与此相关的是,计算机科学家有时看起来有些天真。原因在于他们未能真正内化“免费午餐原理”,因为他们学过递归。他们知道可以“免费”获得计算;他们亲眼见过!
递归函数会将自己的输出再次作为输入来调用自身。通常,每一次后续调用都是一个子程序,其中输入会变得越来越简单,直到达到某个停止条件。在算法层面,这是一种超能力。想想下面这个分形图像。最直观的保存方式是枚举每一个像素的颜色。或者,也可以将其压缩为 JPEG。在底层,JPEG 使用递归来计算快速傅里叶变换(Fast Fourier Transform)。如果没有递归,它的速度将会慢上若干个数量级。
[图片:原文中的可视化内容]“分形是自然的建筑结构,揭示了塑造我们世界的底层递归模式。” ——伯努瓦·曼德博(Benoît Mandelbrot)
对于这幅图像,我们还可以更进一步,因为它本身就是通过递归过程生成的。因此,这幅图可以用写出该递归算法所需的几个字节进行无损编码——几行代码即可。不仅如此,这种表征还可以延伸至无穷,因为你可以对任意边缘不断放大,看到分形在越来越精细的尺度上永远自我重现。递归几乎像炼金术一样,以极少生极多。用传奇程序员尼克劳斯·维尔特(Niklaus Wirth)的话说:
递归的力量显然在于:可以用一个有限的陈述来定义一个无限的对象集合。同样地,一个有限的递归程序可以描述无限多次的计算,即便该程序本身并不包含任何显式的重复。
我的领域——自然语言处理(Natural Language Processing)——也使用递归。直到最近,循环神经网络(Recurrent Neural Networks)一直是处理语言的首选模型。顾名思义,RNN 以递归方式逐词处理句子1。这种序列式处理“免费”地表示了时间信息:一个词在句子中的位置由其被接收的顺序决定。自 2018 年以来,几乎所有语言模型都变成了一种称为 Transformer 的前馈网络。然而,在使用前馈网络时,必须为每个词附加时间信息。最终,计算机的算力足以让我们不必过于担心这种低效,但我们会回到这样一个观点:递归会自动表示时间。如果在大脑中实现这一点,那将是一次现象学上的飞跃。
哲学#
要具备自我意识,自我必须意识到自身。它自身的内部过程将自身作为输入。这就是递归。
我这样来想象它。设想一个原初的自我,尚不能感知自身。写成函数形式:self(perceptions)。这将是你对自己心智或兴趣的模型。作为输入,它会接收你所感知的一切。内省必然会产生递归;自我会将自身作为输入接收:self(self, perceptions)。两步时间上的内省可以写成2:
借用 RNN 的例子,想象这种递归会如何改变我们对时间的感知与体验。它将是一种“免费”表示这一维度的新方式,对“活在某一特定时刻”的状态构成一种激进的转变。
同样有益的是,设想这一函数在起步阶段的坎坷。递归程序很容易“爆炸”,而这个程序是在你的脑子里运行的。以最简单的例子 f(x) = x+1 为例。如果你在每个时间步都递归地将输出作为输入,这个函数会增长到无穷大。意识链条在最初不太可能是连续或愉快的。它一开始一定是断断续续的,自我偶尔抬头一瞬,却又被自身的指数级增长所扼杀。神经元所能承受的兴奋程度是有限的。这个函数需要某种控制系统来稳定递归,避免触及生物学极限。那时很可能有更多“分裂人格”和我们并不认同的内在声音。除了幻觉之外,递归爆炸似乎也很可能产生其他副作用,比如剧烈头痛。递归的演化必然“打破了几个鸡蛋”。
有理由相信,即便在我们没有主动向内凝视时,自我依然是递归的。这是论文《Consciousness as recursive, spatiotemporal self-location》以及道格拉斯·霍夫施塔特(Douglas Hofstadter)的《I Am a Strange Loop》3所持的立场。然而,这一点存在大量争论。
语言学#
笛卡尔将主体性与自我意识等同起来4。动物由于缺乏产生“我思故我在”(I think therefore I am)所需的语言与一般智力,因此只是自动机——“肉做的机器”。语言学家并不对动物的主观体验做出任何断言5,但他们在一个分界线上达成了共识:递归是人类与兽类的分水岭。这是乔姆斯基(Chomsky)的重大贡献:所有语言在本质上都是递归的,而这赋予了人类独特的能力。
若想进一步了解语言学中的递归,我推荐 Corballis 的文章或脚注6。但对本文而言,只需知道:语言学家普遍认为,递归对于具有语法的语言是必不可少的。
心理学#
敏锐的读者此刻可能对潜在的“偷换概念”感到眩晕。仅仅因为我们用“递归”来描述所有这些事物,并不意味着它们就是同一回事!这很合理。它们之间很可能存在一些差异。但将多种类型的递归归为一类,完全属于主流做法。心理学家兼语言学家迈克尔·科尔巴利斯(Michael Corballis)在他的著作《The Recursive Mind》中,又添加了若干其他心理“超能力”,包括心智时间旅行(mental time travel)和计数能力。心智时间旅行指的是将自己投射到过去或未来。由于这是一个被想象出来的未来,它也意味着创造虚构——创造并不存在的世界。这种分离产生了心身问题,在那里,“我”首次从物质世界中区分出来。一旦我们拥有了递归,许多系统便开始加以利用。
它是如何演化的?#
平克(Pinker)和杰肯多夫(Jackendoff)在《The Faculty of Language》中写道:
“语言之所以需要递归,唯一的原因在于它的功能是表达递归的思想。如果不存在任何递归的思想,那么表达这些思想的手段也就不需要递归。”
也就是说,递归可能在语言之外独立演化,随后在语言出现后被“移植”进我们的交流系统。交流本身并不必然需要递归。鉴于如此多的能力都需要递归,它最初为何会演化出来?这就是百万美元级的问题!无人知晓。
“在这里,问题不在于缺乏潜在的进化前身,而在于候选过多。正如赫伯特·西蒙(Herbert Simon)指出的,几乎所有复杂系统都具有层级组织结构。因此,如果将‘递归’等同于层级分解,并将其作为识别某种既有认知功能、从而可被外适应(exaptation)到语言上的标准,那么各种臆测就可以毫无约束地泛滥。” ——平克与杰肯多夫
他们也提出了一些可能性:音乐、社会认知、将物体分解为部分的能力,以及制定复杂行动序列的能力。
心智理论(Theory of Mind)的论据#
[图片:原文中的可视化内容]在驱逐污秽之灵之前,耶稣先问它的名字。“我名为‘群’,因为我们众多。”他们说。同样地,你体内也蕴含着“众多”。
在这些前身中,社会认知尤为突出。递归在建模他人心智时显然十分有用。想想那条基本的道德规则:己所不欲,勿施于人(do unto others as you would have them do unto you)。这就是一种关于正确行为的递归模型。即便只是粗略地运用它,人们也会逐步逼近递归。达尔文写道,声誉管理将是人类的首要选择压力来源:
“在获得语言能力之后,群体的愿望便可以被表达出来,而关于每个成员应当如何为公共利益行事的共同意见,自然会在极大程度上成为行动的指南。” ——《人类的由来》(The Descent of Man)
这实际上是最初把我引入这个“兔子洞”的洞见。我注意到,在人格模型中,主导因素本质上就是黄金法则。因此,现代语言建模在这一点上支持了达尔文。
类似地,邓巴(Dunbar)提出了“社会大脑假说”(Social Brain Hypothesis),认为对智力的选择主要是为了解决社会问题。更直接地说,论文《Recursion: what is it, who has it, and how did it evolve?》严肃对待心智理论(ToM)作为通往递归的一条路径。在某个复杂度阈值上,ToM 的相变可能会产生递归。我在上文给出了一条路径:自我模型被临时拼接(jerry-rigged)成可以将自身作为输入。
因此,我们并不清楚递归究竟源自何处,但社会认知是一个很好的寻找方向。顺带一提,如果语言学上的递归与自我意识所需的递归是同一回事,这就简洁地解释了语言与意识之间的关系。自我意识需要递归,而递归反过来又允许完整的句法语言。
结论#
[图片:原文中的可视化内容]“维纳斯递归”的诞生(The Birth of Venus Recursion)
如果说眼睛的进化让我们得以看见电磁波谱,那么递归的进化就像是长出了一只“第三只眼”7,让我们能够向内看见自己以及符号世界。有了它,我们看见了被想象出来的未来,并进入了模因生态位。你不可能教一个尚未具备递归能力的人类去理解勾股定理,甚至可能连数数都教不会8。此外,递归提供了一种自然的方式来表示时间,揭示出一个全新的现象学维度9。我们向内看去,并自此一直生活在那里。
递归在定义上就是自我意识所必需的。它使得诸如“我思故我在”(I think therefore I am)之类的领悟成为可能,并很可能还支持了更多内容。许多专家认为,主体性、语言、计数以及心智时间旅行同样需要递归。多条证据链表明,只有人类拥有这种能力,而这正是我们成功的关键。
在本文中,我们探讨了“递归工具箱”的组成部分。下一篇文章将深入各种尝试,试图为递归的演化时间定年。作为预告,想象第一个具备自我意识的个体。那会是什么样子?他们是儿童还是成人?男性还是女性?甲壳动物?黑猩猩?人类?文献中的答案范围极其宽广。
例如,对于句子 “the cat chased the rat”,RNN 首先接收 “the” 作为输入,并产生一个上下文向量(context vector),即网络迄今为止所见一切的某种记忆。这个上下文向量会在下一阶段与下一个词一起作为输入。因此,当处理 “cat” 时,它是相对于该上下文向量来处理的。随后上下文向量被更新,“chased” 又在这一更新后的上下文下被处理。这个过程递归进行,直到最后一个词。在每一步中,上下文向量都会被更新,然后馈送到下一阶段。 ↩︎
其中必然存在中间步骤。想象这些“近乎递归”的调用:self(rival(self)) 或 mother(self(mother))。事实上,你也可以论证这些就是递归,只是尚未标准化:在它们之间有多少时间步,或者哪些信息会穿过每个函数。那时一定存在大量模块,以及在它们之间跳跃的信息。如果 self() 被频繁调用,那么标准化“自我信息以何种频率、以何种方式回到 self”可能会带来优势。一种解决方案就是持续递归。 ↩︎
另见尼克·亨弗里(Nick Humphrey)的工作:“An evolutionary approach to consciousness can resolve the ‘hard problem’ – with radical implications for animal sentience”(一种进化论的意识研究路径可以解决“难题”——并对动物感知力产生深远影响)。 ↩︎
当然,这中间有若干步骤。他是实体二元论者,相信精神与物质是截然不同的两类实体。一般智力与内省被视为前者(精神实体)的证据。 ↩︎
他们为什么要这么做呢?对语言学家而言,这种关联是一个不必要的“蠕虫罐头”(can of worms)。他们已经有大量证据表明递归对人类很重要,何必再去争论没有递归的动物就是自动机? ↩︎
语言学中的递归,与其他领域类似,意味着句子可以通过自指的子程序进行解析。例如,句子 “Watson wrote that Holmes deduced the body was in the shed” 可以被分为三部分:
X1 = Watson wrote
X2 = Holmes deduced
X3 = the body was in the shed
要解析 X2,必须先解析 X3。合在一起可以写作 P(P(X3), X2)。而这一结果又可以与 X1 结合:P(P(P(X3), X2) X1)。随着每一个附加从句的加入,句子的意义都会完全改变,而且这一过程可以无限继续。我们可以在 X1 + X2 + X3 前面无限地加上 “Jane said that John said that Harold said that…”。即便词汇表是有限的,也不存在“最长的语法正确句子”。通过递归这一近乎炼金术的过程,我们从有限的构件中撬出了无限。 ↩︎在科学中,“内涵”被视为累赘,人们竞相寻找不带任何情感色彩的词语。因此,第一个人格因素被称为“社会自我调节”(social self-regulation)。我更愿意把它与黄金法则以及为其奠基的数千年宗教与哲学辩论联系起来。同样地,我认为“第三只眼”是描述我们内省能力的一个好说法,即便它曾被宗教(包括最近的新世纪运动)所使用。 ↩︎
令我感兴趣的是:即便在发现勾股定理的过程中,也有如此多的神秘主义成分。 ↩︎
显然,动物也存在于时间之中。这里的论点是:递归在现象学上可能具有重要意义。 ↩︎