摘自 Vectors of Mind —— 图片见原文。


[图片:原文中的可视化内容]

意识的夏娃理论(Eve Theory of Consciousness) 提出,自我意识是由女性“发现”的,并通过模因方式传播。为了论证这一点,我借鉴了语言学考古学药理学遗传学人类学以及神经科学的成果。然而,我的本职是电气工程师。我怎么可能在一个有那么多受过正规训练的人参与的领域里,说出有价值的东西?事实上,EToC(意识的夏娃理论)的想法最初就源自机器学习。老读者们已经见证了这个博客的演进,从机器学习心理测量学,到递归,再到比较神话学。下面我来解释我是如何走到这一步的。

从词语中抽取人格结构#

心理学有一个“真值”(ground truth)问题。一个研究者可能会提出,人类差异只有少数几个基本轴线,最重要的是“内化(Internalizing) vs 外化(Externalizing)”。另一个研究者则可能认为,基本因素得有30个左右,因为人类就是这么复杂。谁是对的?早在1890年,高尔顿(Galton)就提出,与其让心理学家基于各自的偏爱理论构建人格模型,不如说最好的模型早已嵌入在语言之中。每一个人格形容词之所以存在,是因为数以百万计的人在评判他人时觉得它有用。这些词语必然揭示了人格的所有重要方面。形式化之后,这就是“词汇假说”(Lexical Hypothesis):

  1. 对某一群体而言重要的人格特征,最终会成为该群体语言的一部分。

  2. 越重要的人格特征,越有可能被编码为单个词语。

这个思想可以用来构建人格模型。只需列出人格形容词,考察它们之间的关系,然后压缩为少数潜在因子1。(LL Thurstone 为此发明了因子分析,而那篇论文也成了本博客名字的来源。)传统上,形容词之间的关系是通过询问心理学本科生“哪些词最能描述你”来估计的。那些说自己 bright(聪明)的人,也往往会说自己 open-minded(思想开放)。这表明它们都与某个潜在因子相关。在我的博士论文中,我使用语言模型来估计词语相似度,并得到了与传统问卷类似的结果(两种方法的一阶因子相关系数 r=0.93)。

用一个例子最容易理解这个过程。下面是100个随机人格形容词,投影在两个捕捉最多人格信息的维度上。可以把它们看作大五人格中的两个维度(尽管在旋转方式上存在差异)。人格心理学家的任务之一,就是观察这样的散点图并对其进行定性描述。你可以在“猜因子”(Guess the Factor)中练习这个游戏,或者在下面试一试。你会如何概括因子1?

[图片:原文中的可视化内容]因子1和因子2是通过 PCA 得到的,这是一种将人格信息提炼到最少轴线上的方法。关于如何从词向量中得到这些因子,详见我的论文 Deep Lexical Hypothesis。你也可以使用我的代码复现这一结果(以及更多),它可以在 Google Colab 上免费运行。

从统计学角度看,因子1已经“赤身裸体地挥舞着一面大旗”: “我远远是最重要的”,正如我在人格的主因子(PFP)中所解释的那样。从定性上看,它本质上是“社会对你的期待”。要体贴、尊重,不要自命不凡或不合群。

为了从另一个角度抽象 PFP(因子1),回到2000年前是有帮助的。以色列人有专门的图书馆来收藏社会规则及其正确适用方式。随着几个世纪的争论和阐释,律法的字句不断增多。但同时也有一股运动,试图提炼律法的精神。

根据传统叙事,一位潜在的皈依者走近拉比沙迈,请他在单脚站立的时间里解释整部《妥拉》。以严格遵守犹太律法著称的沙迈拉比认为这个问题不敬,便拒绝了他,把他打发走了。

这位皈依者并未气馁,随后又带着同样的请求去找拉比希列。以慈悲和智慧著称的希列采取了不同的回应方式。他没有把这位皈依者打发走,而是接受了挑战,在单脚站立时给出了对《妥拉》的简明概括。他说:“你所厌恶的事,不要加诸于人:这就是整部《妥拉》,其余的都是注释。”

这同样是对 PFP 的极佳描述。要做到体贴他人、拒绝不宽容,人必须能够设身处地。事实证明,达尔文在《人类的由来》(The Descent of Man)中也是以同样的方式概括我们的社会本能:

道德感或许提供了人类与低等动物之间最好、最高的区分;……社会本能——人类道德构造的首要原则(50. 《马可·奥勒留的思想》等,第139页)——在积极的智力能力和习惯效应的帮助下,自然会导向黄金法则:“你们愿意人怎样待你们,你们也要怎样待人”;而这正是道德的基础。

八卦作为适应度景观#

[图片:原文中的可视化内容]心智映射

我用机器学习,从经由亿万次八卦锤炼而成的形容词中提炼出人格因子。事实上,对他人的评判与我们的进化密不可分。再次引用达尔文在《人类的由来》中的话:

在获得语言能力之后,群体的愿望可以被表达出来,关于每个成员应当如何为公共利益行事的共同意见,自然会在最高程度上成为行动的指南。

在草原上,你的名声就是你的生命。如果别人觉得你懒惰或残忍,你留下后代的机会就会更少。第一个人格因子反映了这一点,它由诸如 considerate(体贴)、pleasant(和善)与 uncooperative(不合作)、intolerant(不宽容)等词语所定义2。**在构建人格地图的同时,我也构建了一张适应度地图。**但你不必只听信我的话。往上翻,看看因子1。你会不会用类似黄金法则的东西来概括它?这并非偶然,它之所以反复出现,是因为它被博弈论所支撑,并通过八卦得以执行。

在过去200年里,达尔文的思想得到了发展。看看2020年的这本书:《最友善者生存:理解我们的起源并重新发现我们共同的人性》(Survival of the Friendliest: Understanding Our Origins and Rediscovering Our Common Humanity)。封面文案写道:

_在智人(Homo sapiens)存在的大约30万年中,我们曾与至少另外四种人类共享地球。所有这些人类都聪明、强壮且富有创造力。但大约在5万年前,智人在认知上取得了一次飞跃,使我们相较其他物种占据优势。发生了什么?

自从查尔斯·达尔文写下“进化适应度”以来,适应度这一概念就常被误解为体力强壮、战术高超和富有攻击性。事实上,使我们在进化上具有适应度的,是一种非凡的友善,一种高超的协调与沟通能力,使我们得以实现人类历史上所有文化与技术的奇迹。布赖恩·黑尔(Brian Hare,杜克大学进化人类学系与认知神经科学中心教授)及其妻子、研究科学家兼获奖记者凡妮莎·伍兹(Vanessa Woods)提出他们所谓的“自我驯化理论”(self-domestication theory),阐明了人类认知中那次神秘飞跃,使智人得以繁荣昌盛。_

书中明确指出,对达尔文而言,适应度包含合作;它反驳了那些将适应度等同于冷酷无情的“达尔文主义者”。(更多内容可见与 Brian Hare 的访谈。)我几乎可以肯定,我发现的第一个因子与这一过程有关。因此,我在《良心的后果》(Consequences of Conscience)中,在高尔顿的词汇假说基础上提出了一个额外的主张:

  1. 首要潜在因子代表了使我们成为人类的社会选择方向。

为了理解人格结构,我把它与自己熟悉的其他概念联系起来。其中最重要的是黄金法则和人类自我驯化。

信仰之跃#

[图片:原文中的可视化内容] 多梅尼基诺(Domenichino):《逐出伊甸园的亚当与夏娃》

当时,我手里只有一张适应度地图,上面写着黄金法则至高无上。那么,它可能促使我们的心理发生了什么演化?“良心”似乎是一个相当显然的猜测。也许这与我们内在声音的演化有关。假设最初的内在声音说的是“分享你的食物!”;第一次把自己与这个内在声音认同在一起,会是什么感觉?我认为,那会很像《创世记》,而这就是我自那以后一直追逐的核心火花。当然,这是一跃而下的大胆推断。内在声音的演化并不必然从黄金法则中推出,我们对它的认同也不必然产生内在生活。但这两者看起来都很可信,而且随着我进一步研究,它们在我们的进化时间线上嵌入得非常自然。

至于《创世记》,有三点立刻让我觉得颇为可信:被上帝遗弃的感受、农业的发明,以及女性引领这一切。(关于蛇毒仪式的可能性,则是读了其他创世叙事之后才出现的想法。)

被上帝遗弃#

起初,我只关心内在声音从何而来。我的设想是,自我某种程度上“吸收”了一个内在的道德声音。我认为,这种体验会很像获得“善恶知识”,因为你接管了原本由幻觉中的守护灵(tutelary spirit)承担的角色。(在这个思想实验中,我一开始就假定了这样一个守护灵。)如果你习惯于把道德决策外包出去,那么亲自掌舵会感觉像是离开了那种与上帝直接交流的孩童状态。

再多读了一些之后,我意识到,这一刻的自我觉察本身就足以首次产生一个“我”。我在《似曾相识的你:自我的递归建构》(Deja-you, the recursive construction of self)中提出了这一论点。那将是对“人类处境”的创造——或者更准确地说,是发现——在一个非常真实的意义上。

农业的发明#

在《创世记》中,农业是人类处境的结果。事实证明,“我”的发现也足以解释农业革命。因为它很可能是与递归能力捆绑出现的“套餐”,以及灵活思考未来的能力。也就是我们规划能力的一次整体相变。

如果你认为人类已经具备理性(sapient)有20万年之久,那么一个巨大谜团就是:为什么他们会在过去1万年中,独立地发明农业达11次之多?这可是把很多事情都挤进了我们存在时间的10%里。而且,如果你认为自己的某个特定理论可以解释这一点,请先读一读这篇综述:25位学者聚在一起,最后一致同意他们无法就导致这一转变的原因达成共识。

女性引领#

“feminine”(女性化)的词向量与 PFP 相关。甚至在思考与《创世记》的联系之前,我就设想,第一个把自己与内在声音认同起来的人是女性。(你可以看出,我对这些词向量能告诉我们的东西深信不疑。)

《创世记》是一个复杂的故事。获得能动性被等同于“如同神一样”,并被视为足以致死的罪。但这同时也是整个计划的一部分。基督教又添一重复杂性:我们被教导要克服原罪,变得像上帝本人一样,背起十字架以获得永生(再次把生命与死亡混合在一起)。

同样地,夏娃开启了死亡,却被赋予“众生之母”的称号。看看当今的影视作品,为了把女性塑造为行动者(agent)投入了多少努力。然而在数千年前,夏娃就已经被清晰地描绘为那个把人类从天真状态中拉出来的行动者。亚当只是跟在后面。夏娃的好奇心被描绘成坏事,但在这样一部父权色彩浓厚的文本中,它仍然是一个颇为有趣的添加。

在“自我意识被发现”这一前提下,探索者是女性似乎相当可能。在“女性做出这一发现”这一前提下,亚当与夏娃似乎就很可能是一段记忆。当然,这些都是巨大的“如果”。但我隐约觉得它们是可能的,而且我也有足够的意愿去调查。

[图片:原文中的可视化内容]得墨忒耳(Demeter),丰收与厄琉息斯秘仪女神

智性悖论(Sapient Paradox)#

本文的目的,是阐明我在机器学习方面的工作如何引出了 EToC,而不是提供证据。不过,我想简要指出,为什么“自我意识是被发现的,并被记录在神话中”这一点是可信的。很简单,人类处境似乎是一个相对较新的现象。在5万年前之前,我们没有太多关于内在生活、递归或任何高阶思维的证据。你也许会认为,那个年代的任何证据都不会太好,但许多考古学家和人类学家并不这么看。“智性悖论”的关键在于,行为现代性在1万年前之前是区域性的。这已经非常晚近了!如果在“走出非洲”之后,我们的心理发生了一次根本性改变,那么它的扩散在很大程度上必然是模因性的,而非遗传性的。“自我意识被发现并传播”这一设想,正好符合(或至少被这些约束所暗示)。

“人类处境可能是近来的产物”是一个极为奇幻的想法。但“现代心理学在20万年前就已完全到位,却在数万年间闲置不用,直到我们最终应用它并征服世界”同样是一个极为奇幻的想法。意识的夏娃理论通过允许扩散主要是模因性的,而不仅仅是遗传性的,解决了这一扩散问题。根本性的改变完全可能发生在我们离开非洲之后。

不相关的真理(Uncorrelated Truth)#

我认为,PFP 最好的描述是一个人践行黄金法则的倾向,即希列和达尔文所看到的那个潜在维度。这在心理测量学界是一个相当特立独行的观点。作为对比,可以看看那篇广受好评的论文:《Two, five, six, eight (thousand): Time to end the dimension reduction debate!》

词汇分析和降维方法是用来探索人格空间粗略轮廓的工具。然而,我们不应自欺,以为自己正在“顺着自然的关节切割”,从而发现一个“真实”的人格结构。

本质上,这个观点认为,数据的任何一种旋转都可以,因为我们无法从结构中挖掘出根本性的洞见。但是,根据预处理方式的不同,所有人格信息中有80%都包含在第一个因子中。这肯定在告诉我们某些东西!然而,研究者们仍然普遍认为,这个因子根本不是人格信号。一篇2013年的论文开篇写道:“关于 GFP(第一因子)的压倒性主流观点是,它代表了一种伪影,要么源于评价偏差,要么源于以社会期望方式作答。”(我想指出的是,即便在认为这一因子完全是偏差的同时,心理测量学家们还是把因子1的内容分配给了因子3–5,以构建尽责性(Conscientiousness)、情绪稳定性(Emotional Stability)和经验开放性(Openness to Experience)。)

在这样的观点之下,人们就无法把词汇数据与进化联系起来,也无法开始对自我驯化过程进行假设。撰写我的博士论文需要花许多小时盯着这些因子3。在整个过程中,我都认为它们代表了一张适应度景观,并时不时会想,这会导致什么结果。作为一名工程师,我对“结构其实并不重要”这一主流观点一无所知。我带着“可以顺着自然的关节切割”的错觉闯了进去。

结论#

希望这能说明,为什么一个电气工程师会在写神话与意识。这个想法其实是“找上我”的。我在绘制人格地图,结果它竟然成了一张进化地图。与黄金法则的联系暗示,一种原始的“良心”可以作为自我驯化的机制。这是我的第一次飞跃。随后,我推测内在声音可能参与其中。第一次意识到内在声音就是“我”,会是什么样?《创世记》在我看来简直是一个完美的对应4。此外,许多专家都曾论证,人类心理在过去5万年中发生了变化,并常常援引语言、宗教或自我驯化作为这一转变的关键因素。在这样的时间尺度上,如此重要的故事有可能在神话中被保存下来。“太初有道,道与神同在,道就是神”……或者——请不要把这当作亵渎——也许那是内在的声音。

鉴于行为现代性出现得如此晚近,我的主张是,创世神话可以启发形式化模型,而这些模型又可以与哲学心理学语言学考古学以及遗传学相连接。或许这些模型也能帮助我们理解这些神话。对我而言,夏娃“如同神一样”,而这又要求她与上帝分离,这一点意义重大。在《创世记》中,解释是:一位常常嫉妒的上帝行使了公义的审判。对我来说,这更像是一条自然法则:人类与神不能同居,因为我们是用他们的残余塑造出了“我”。人与兽之间的距离于是变成了两步:先是进化出良心,然后是拒绝它。或者,这样说也许太过阴郁。更准确地说,我们生活在张力之中,并且始终拥有选择。这一顿悟赋予了我们递归,也就是那把用以弯曲自然、使之屈从于我们意志的沉重工具。如果要我用一种可以流传1万年的方式来解释这一切,我会讲述亚当与夏娃的故事5

很自然地,这段旅程始于我有把握的专业领域。对我来说,我的人格地图记录了进化压力,这一点似乎非常可信。鉴于我们改变得如此之晚近,以及黄金法则作为一股力量存在了如此之久,我甚至进一步在高尔顿的词汇假说上加上第三条公设:**首要潜在因子代表了使我们成为人类的选择方向。**从那里开始,我确实做出了若干飞跃,但在落地时,我发现自己与杰恩斯(Jaynes)、荣格(Jung)、平克(Pinker)、乔姆斯基(Chomsky)和笛卡尔(Descartes)为伴。这种探索正是科学的本质;并非一切都需要 p 值。

[图片:原文中的可视化内容]伊西斯(Isis)小像,埃及智慧女神,公元2世纪


  1. 让我颇为惊讶的是,乔丹·彼得森在一次与乔·罗根的访谈中,把大五人格的推导描述为早期形式的人工智能。我在本博客的第一篇文章中就提出过这一观点,而且此前从未听别人这么说过。不论你如何看待他的政治立场,他在人格心理学方面确实相当在行。 ↩︎

  2. 有人可能会指出,“不宽容”似乎是一个相对较新的“死罪”。也许吧。用历史文本来训练词向量,并观察第一主成分(PC1)如何变化,会是一件很有趣的事。鉴于现代文本的潜在因子与黄金法则高度吻合,我猜从1900年前后的语言起,变化不会太大。要撼动一个由如此多博弈论机制支撑的东西并不容易,即便道德关怀的圈子已经扩展。 ↩︎

  3. 尽管人格形容词是人格模型的基础,但研究者直接处理词语的情况其实也很少。到了90年代,一旦类似大五人格的结构被反复验证,研究者们就开始用基于短语的问卷来测量人格,以近似词汇结构(例如 Big Five Inventory)。 (业内小秘密:第五因子“开放性/智力”(Openness/Intellect)并不总是能被稳定地提取出来。)这种方式更简单,从那以后,关于语言本身的工作就很少了。更重要的是,我的数据比早期尝试要好得多。如果你想理解词语之间的关系,就该用语言模型,而不是本科生问卷。没有人像我这样花这么多时间盯着一张如此精确的人格地图。(你可以在“Guess the Factor”中练习这一游戏。) ↩︎

  4. 想想这个事实:亚当在伊甸园中给动物命名。即便没有自我意识,也会存在非递归的语言。猎人对植物和动物有百科全书式的知识。这可能是“堕落”之前语言中最重要的部分。如果这一事实能流传1万年,那真是令人惊叹。 ↩︎

  5. 我对《创世记》印象深刻,但那可能只是因为那是我最熟悉的文本。如果我是印度人,我大概会谈论萨拉斯瓦蒂(Saraswati);如果我是纳瓦霍人,则会谈论女性在“出现神话”(Emergence myth)中的角色;如果我是埃及人,则会谈论阿图姆(Atum)通过说出自己的名字而将自己召唤为存在的那一刻(然后与一条原初巨蛇战斗)。EToC 要求将这些视为同一个故事的不同视角。显然,传统上这是通过构建系统发育树来展示的。在这样的时间尺度上,以我的能力,这是不可能做到的。这就是为什么我的关注点放在递归的演化上。我想要论证,人类很可能是在最近才获得递归能力,并且这一能力随后扩散开来。这将从根本上改变我们对于创世神话是否共享同一根源以及这一根源本来面貌的先验判断。 ↩︎