摘自 Vectors of Mind —— 图片见原文。


[图片:原文中的可视化内容]The Mask,作者 Rozzi Roomia

如果自我意识是最近才出现的,这一点应该会在比较语言学中有所体现。内省能力是一件大事,它要求发明新词来表达新的体验。最显而易见的新增成分就是第一人称单数代词 I(“我”)。

稍微正式一点,可以表述为原初代词假说(primordial pronoun postulate)只要我们具备自我意识,我们就已经拥有代词。 由此可以推出一个推论:我们可以通过追踪第一人称单数(1sg)的扩散来追踪意识。 如果自我意识非常古老,这个想法就毫无用处。想象一下,如果它在两亿年前、两百万年前,甚至五万年前就已经进化出来,那么此时,“我”这个词的最初形式早已化为尘埃,在当今的言语中已无法辨认其轮廓。

然而,当我们考察全世界的代词时,发现的情况完全不是这样。相似性太多,远远超出偶然、趋同演化,或自“走出非洲”(Out of Africa)事件扩散所能解释的范围。最简单的解释是:这些代词大约在一万五千年前扩散开来。

这篇文章是意识系列的一部分。意识的夏娃理论(Eve Theory of Consciousness)提出:意识是近期才出现的,首先具备自我意识的是女性,而农业是这一过程的结果。意识的蛇崇拜(Snake Cult of Consciousness)则论证,蛇毒可以作为一种致幻剂,帮助入会者获得自我意识。如果你两篇都没读过,我推荐先读《蛇崇拜》,因为它更易读也更有趣。或者,你也可以把这篇文章当作一篇独立的语言学谜团导览来阅读。

提纲#

  1. 全球范围的代词相似性:大多数第一人称单数(1sg)都包含辅音“n”。这不可能是偶然。

  2. 巴布亚新几内亚和澳大利亚代词扩散的案例研究。

  3. 一位语言学家的宏大语言理论,将“完整语言”的起源定位为原始巴斯克–德内语(proto-Basque-Dennean),这是一个由代词维系起来的语系。

  4. “智人悖论”(Sapient Paradox)提出:既然解剖学上的现代人类已经存在了二十万年,为何“完全的人类行为”只在一万两千年前才广泛出现?如果在全新世之前缺失的仅仅是货币或宗教等概念,这个悖论就名不副实了。代词的扩散意味着主观自我意识本身也是新的。

  5. 朱利安·杰恩斯(Julian Jaynes)本应把意识起源的时间点,修正为代词的起源时间。

全球范围的代词相似性#

“总体而言,代词和数词最不受[时间]模糊性变化的影响,因此是判断语言之间亲缘关系的最佳标准。” —— Roland G. Kent, 1932

理解代词的起源需要一些术语。一个语系(language family)是由遗传关系(genetic relationships)界定的。也就是说,如果两种语言都源自同一母语,那么它们就被认为属于同一语系。比如,考虑下图所示的尤托-阿兹特克语系(Uto-Aztecan)。将其指定为一个语系,语言学家就是在假定:所有这些语言——从今天的爱达荷州一直到尼加拉瓜——都源自几千年前的一种单一语言。

[图片:原文中的可视化内容]尤托-阿兹特克语系(Uto-Aztecan)分布范围

关于语言的分类存在大量争议。例如,在尤托-阿兹特克语系之上,还有一个颇具争议的“阿美林语系”(Amerind language superfamily),它包括了北美和南美所有不属于爱斯基摩–阿留申语系(Eskimo–Aleut)纳–德内语系(Na–Dene)的原住民语言(后两者的祖先是在更晚的迁徙浪潮中到来的)。支持阿美林语系的主要论据,是这些语言中第一、第二人称代词的相似性:第一人称单数(1sg)往往包含“n”,第二人称单数(2sg)则包含“m”。维基百科贴心地列出了一些例子

[图片:原文中的可视化内容]

但在大多数情况下,这个语系并不被接受。维基百科对这一状况的总结是:“由于1987年著作《Language in the Americas》中存在大量方法论缺陷,他对这些语言之间关系的主张已被大多数历史语言学家视为伪造。”紧接着是11条参考文献(就维基百科而言,这已经是“宿怨”级别了)。

这主要是关于语言学工具箱能回溯多远时间的一场争论。否认该语系的语言学家同样相信:大约在一万五千年前,确实有一支人群跨越白令海峡,填补了美洲的人口空白。这支人群应当说着同一种语言,现存的诸语言皆由此演化而来。但在如此漫长的时间之后,即便相似性非常显著,也很难判断它们究竟是偶然巧合,还是确有信号。类比到遗传学:称呼你的五代表亲为“家人”还有意义吗?你们共享的家族故事或DNA可能微乎其微。如果你们确实发现了一些相似之处,那会比与陌生人更多吗?(“哦!你也叫你爸爸‘pappers’?这概率有多小?”)很难说。

我们稍后会回到阿美林语系的争论,以便理解语言学界内部的不同阵营。但我们主要的兴趣并不在语系本身,而是要追踪“I”的发明。支持古老阿美林语系的学者用代词相似性来论证自己的观点,而这一点又在存在一个已知的一万五千年前原始人群的前提下,遭到了如此多的反对,这一点引起了我们的兴趣。

说 ni、na、ŋay 等等的骑士们#

[图片:原文中的可视化内容]亚瑟王与“说Ni的骑士”谈判(戏仿)

我要教你一个强大到足以让语言学家,乃至某些版本的亚瑟王都为之战栗的词:Ni!!! 或者,变体形式 na、ŋay、‘a(ŋ)kƏn、hinu。这些只是不同语系中的第一人称单数代词,但它们蕴含着一个巨大的谜团:如果这些语言彼此相距如此遥远,为何它们会如此相似?答案只能是:偶然、趋同演化,或遗传关系。我们将在先建立全球相似性程度的基础上,依次讨论这些可能性。

为此,我们参考语言学家梅里特·鲁伦(Merritt Ruhlen)的工作。鲁伦曾是斯坦福大学人类学与人类生物学讲师,并与默里·盖尔曼(Murray Gell-Mann)共同担任圣塔菲研究所“人类语言演化项目”的联合主任。他绝非边缘人物,尽管他的一些观点仍具争议。他的著作《On the origin of languages: studies in linguistic taxonomy》主张:所有语言都源自一个单一源头,通过比较现存语言,我们可以了解这一原始智人语言的一些特征。为支持这一主张,他收集了各语系中所有已知的第一、第二人称单数代词形式。在一个语系中,“原始形式”(proto-form)指的是在分化为不同语言之前所说的那个词。专家们通过比较许多现存形式,往往要花费数年时间来三角定位某个词在单一语系中的原始形式。鲁伦则把这些分散的成果汇总在一起。相似性之强令人震惊:在他识别出的44个语系中,有30个包含辅音 n 或 ŋ1。这些是:

Khoisan:na

Kordofanian:*ŋi

Niger-Congo:(n)a

Australian:*ŋay

Indo-Pacific:na

Miao-Yao:*weŋ

Austroasiatic:*eŋ

Austronesian:*‘a(ŋ)kƏn

Basque:ni

Caucasian:*nI

Nahali:eŋge

Sino-Tibetan:*ŋa

Afro-Asiatic:*anāku

Etruscan:mi-ni

Kartvelian:*me(n)

Dravidian:yan

Elamite:un

Korean-Japanese-Ainu:na

Gilyak:ni

Almosan:*ne

Keresiouan:hinu

Penutian:nV

Hokan:na

Central Amerind:nV

Chibchan:na

Paezan:na

Andean:na

Equitorial:nV

Macro-Panoan:nV

Macro-Ge:nV

以下14个语系则不包含:

Daic:*ya

Hurrian:es

Urartian:jesƏ

Hatti:es

Burushaski:mi

Yenesian:*?aj

Na-Dene:*swi

Sumerian:ma

Indo-European:*me

Uralic-Yukaghir:*me

Altaic:*mi

Chukchi-Kamchatkan:-m

Macro-Tucanoan:hi

Macro-Carib:awe

在这份“被排除”的名单中,有6个包含与“n”相关的辅音“m”,叶尼塞语(Yenesian)已被重构为带有 n 的形式2,而胡里语(Hurrian)则可以有理由与乌拉尔图语(Urartian)合并为一个单一语系。我本可以继续举例。超语系“跨巴布亚新几内亚语系”(Trans-Papua New Guinea)被重构为 na,其中包含鲁伦名单之外的60个语系。我们可以把它们加进来,让“得分”更高。但鲁伦是斯坦福的讲师,并为这个问题投入了多年时间。最好还是接受这份名单为完整,然后在此基础上继续讨论:44个语系中有30个包含辅音“n”。你可不想给像我这样的人太多研究者自由度

细心的读者可能已经注意到,“I”并不包含“n”。我用英语写这篇文章,而英语恰好是少数打破这一模式的语言之一,这多少有点讽刺。人生大概就是这样吧。要是巴斯克人当年造的船再大一点就好了。

代词的分布只能用三种方式解释:偶然、趋同演化或扩散。先说偶然。如果这是随机的,那么要多“幸运”才能在44个语系中得到30个包含“n”?大多数语言大约有20个辅音音位,所以随机命中“n”的概率是1/20。也许我们可以说,“n”本身就是一个常见音,我们也把 ŋ 算进来,而且有些代词包含多个辅音(尽管也有像“I”这样一个辅音都没有的)。这些因素都会提高“包含n”的概率,所以我们可以用1/10来代替1/20。我们给出的折扣其实并不重要。即便把概率翻倍,30/44这一结果出现的概率也只有 1/36,127,314,938,069,163,114。

我们可以用同样的推理来检验趋同演化。假设存在某种力量,会坚定不移地把代词推向“n”。要让我们在44个语系中观察到30个独立地采用带“n”的第一人称单数,这种力量得有多强?假设这种力量把概率从1/20提升到1/2,整整提高了一个数量级。即便如此,这种情形仍然可以被拒绝(p<0.05),因为我们观察到的是30/44。趋同的力量必须强大到近乎不可思议。

还有一些非统计学的理由可以用来否定这种力量。首先,机制本身就值得怀疑。mamapapa世界上许多语言中都表示相同的意思。这大致是婴儿学会的前两个词,因此很可能需要的是最容易发出的音。相似性是由婴儿学语的约束所产生的。这种约束不应以同样的强度作用于代词,因为代词是更晚才学会的,那时孩子已经在使用许多其他辅音了。(I 这个概念比 kittyball 复杂得多。)

此外,在各个语系内部,代词往往会从原始形式 na分化出去。此时,我们有必要深入考察一个具体语系。

巴布亚新几内亚#

巴布亚新几内亚(Papua New Guinea, PNG)大约在五万年前就有人类居住。漫长的时间、陡峭的山脉和难以穿越的丛林,使得这一地区成为世界上语言多样性最高的地区,约有1000种语言和60个语系。在同一语系内部,有些语言之间的差异堪比英语与梵语;而在不同语系之间,其差异则堪比芬兰语与普通话。尽管差异极其巨大,大多数语言中的代词却是同源的。在那本1000页巨著《New Guinea Area Languages and Language Study, Vol. 1》[^书名原文保留]中,包含了一幅关于这些代词进入该岛可能路径的重构图。

[图片:原文中的可视化内容]图引自:Papuan Linguistic Prehistory, and Past Language Migrations in the New Guinea Area

这些代词被估计是在公元前8000年进入该岛的。它们的广泛采用之所以令语言学家感兴趣,是因为这主要被理解为一种“模因式”(memetic)的传播;在这一时期并不存在大规模的人口更替。想想要在另一种语言中取代一个代词有多难:代词被各种语法结构牢牢固定住。然而,这种替换却在整个岛上发生了,影响了(现今的)数十个语系和上千种语言。注意,这种影响的来源方向是欧亚大陆。

用代词重构语群#

在论文《Pronouns as a preliminary diagnostic for grouping Papuan languages》中,马尔科姆·罗斯(Malcolm Ross)试图用代词来界定PNG的语系,而不是依赖更广泛的考量:其他同源词、语法和音位。科学上的兴趣在于:代词可以以一种更简约的方式完成这一任务。这些基于代词的分组在地理上是合理的,也支持关于跨巴布亚新几内亚语系(Trans New Guinea, TNG)内部各语系的合理历史假说。至少这是作者的论点,而从引用次数来看,领域内的其他学者也表示认同。下表是他所识别出的14个语系的原始代词重构形式。还记得我说过,可以通过增加语系来“给鲁伦那44个原始代词的名单加分”吗?看看这些第一人称单数 na 吧!

[图片:原文中的可视化内容]

这篇论文本应是一次“全垒打”。当你能简化一个模型却仍然能做出预测时,这就是科学的进步。然而,它却与“趋同演化”这一解释相矛盾——后者被用来解释为何 na 会在全世界反复出现。和许多其他语系一样,跨巴布亚新几内亚语系的第一人称单数原始形式被重构为 na。从这一形式的分化被用来界定TNG内部的各个语系,而且效果极佳。那么,我们是否还要用趋同演化来解释这一形式与欧亚、美洲、澳大利亚和非洲诸多原始形式之间的相似性?(尤其是考虑到,这个代词是从欧亚方向传入该岛的。)

罗斯的可贵之处在于,他意识到了乍得语支(Chadic,亚非语系的一个分支)以及阿尔冈昆语支(Algonquian,阿尔吉克语族(Algic Amerind languages)的一个分支)中存在同样一组代词。他花了11页篇幅来论证用代词来归类语言的合理性,包括处理“趋同 vs 分化”的难题。为了解决这一问题,他援引了另一位语言学家莱尔·坎贝尔(Lyle Campbell)的观点:

坎贝尔对这一问题的回答——我认为他是对的——是:每一个“区块”都是一个语系,但这三个区块[TNG、阿尔冈昆语支、乍得语支]在全球范围内的分布,是偶然的产物。

但请回想一下,在更大范围的44个语系中,要用“偶然”来解释这些现象,其概率是多么荒谬。作者并没有意识到“偶然”需要解释的东西有多多。为了获得不同的视角,很有必要长篇引用我们自己的梅里特·鲁伦3

当然,有些语言学家根本不知道,其他语系中往往也存在与他们所研究语系中相似的词根,我怀疑这就是迪克森(Dixon)的情况。然而,还有一些语言学家虽然意识到这些词根,却选择忽略它们。格林伯格(Greenberg, 1987)为支持阿美林语族(Amerind phylum)所提供的最有说服力的证据之一,就是在全部11个分支中都存在第一人称 n 和第二人称 m。正如第12章所指出的,第一、第二人称代词被认为是在时间上最为稳定的语义项。多尔戈波尔斯基(Dolgopolsky, 1964)发现,第一人称代词是最稳定的词项,而第二人称代词在稳定性上排名第三(仅次于数字“2”)。众所周知,词首鼻音辅音也是最稳定的音之一,而“稳定音”与“稳定义项”的结合意味着,即便在一万两千年之后,这些代词仍在阿美林语族的每一个分支中被保留了下来。格林伯格并未声称自己是第一个注意到这些代词在南北美广泛分布的人。斯沃迪什(Swadesh, 1954)在一篇文章中强调了它们的分布,该文还包含了关于阿美林语族(当时尚未命名)的其他证据。一年之后,格林伯格在不知道斯沃迪什文章的情况下,独立发现了同样的分布。格林伯格指出:“两位学者能够独立地做出同样的基本观察,这在某种程度上也是我所界定的阿美林语族论证中的一个有趣旁证”(1987: 54)。

莱尔·坎贝尔,一位美洲印第安语言学者,也是格林伯格的主要批评者之一,则有不同看法:“广泛分布的第一人称 n 和较少分布的第二人称 m 标记……从一开始就已被认识到,但对分类并未产生显著影响”(Campbell 1986: 488)。令人遗憾的是,坎贝尔说得没错,但如此关键的证据被忽视——或者更糟,被蔑视——并不是值得骄傲的事情。如果一位生物学家得意洋洋地说:‘你老提到的那群动物,就是那些有脊椎的,我早就知道了,我一点也不觉得惊讶’,他的同事们只会笑笑,然后转而去做别的事。在这里,我们或许可以看到,生物学与语言学之间的差异之一,尤其是它们在当下各自呈现出来的样貌。

所以,大家都同意:在美洲数百种语言之间,以及在全球许多原始语言之间,确实存在相似性。反对者只是说那是偶然4。但别忘了我们一开始算出的概率:在全球尺度上,这不可能是偶然!

这并不只是我一个人的看法。一小群声音响亮的语言学家几十年来一直在敲打这一点。比如,参见论文《Once Again on the Comparison of Personal Pronouns in Proto-Languages》中更为详尽的论证:

“声称‘偶然相似’在不同语系原始语言的代词比较中可以发挥重要作用,这是不正确的。在现代长程比较语言学家认为不存在遗传关系的语言之间,绝对不存在代词范式模式上的巧合。”

为什么他们在说服更广泛的语言学界接受这些关系方面如此不成功?他们手里有大量由许多独立研究者收集的有力数据。如果我可以大胆一点,这也许是因为这些数据把语言学家置于“进退维谷”的境地,正如论文《Where Do Personal Pronouns Come From?》所展示的那样。该文试图解释:为何代词“无论属于哪个语系,都如此大规模地趋同到少数几个词干辅音上,而在过去的一万到一万五千年间,似乎几乎没有新的代词被创新出来?”

为此,论文指出:一再出现的情况是,大约在一万五千年前,各种原始语言中都有相似的代词。但如果智人(Homo sapiens)离开非洲时已经拥有完整语言,那么他们就应当已经有了代词。因此,论文把解释的根源追溯到五万到十万年前。这就要求语言学家相信:这些同源词被保留的时间不是一万五千年,而是十万年。书写系统存在了三千年,我们知道语言变化可以有多快。试着读一读仅仅一千年前写成的《贝奥武夫》(Beowulf)。语言学家有充分理由对任何声称可以追溯到八千年以上的遗传关系持高度怀疑态度。

这个“上限”可以被稍微拉高,但不能被打破。亚非语系(Afroasiatic)被普遍接受为一个语系,其年代估计为一万到一万八千年。在所有词类中,代词被认为是最为耐久的。也许它们可以比八千年再多坚持一段时间;至少可以追溯到亚非语系的年代。即便如此,要相信代词同源关系可以存续十万年——一直追溯到智人只生活在非洲的时代——仍然令人难以置信。这根本不是语言运作的方式。因此,要回答这些相似性的起源问题,语言学家要么必须假定人类离开非洲时还没有代词,要么就得否定最基本的语言学规律。不出所料,这类论文并没有获得太多关注5

澳大利亚#

以防你以为巴布亚新几内亚只是一个孤例(或者如果按语系算是60个孤例,按语言算则是1000个孤例),澳大利亚也存在类似的谜团。我们将引用2020年书籍章节《Time, diversification, and dispersal on the Australian continent: Three enigmas of linguistic prehistory》中的内容。

人类大约在五万年前首次抵达澳大利亚,与PNG的时间相同。事实上,在人类在这两块陆地上生活的85%时间里,它们是连在一起的,被称为萨胡尔大陆(Sahul)。直到大约八千年前,海平面上升,它们才分离开来。澳大利亚有27个语系,如下图所示。你会注意到,其中一个语系——帕马–纽干语系(Pama-Nyungan)——占据了八分之七的陆地面积,而其他所有语系都集中在北部。对于一个古老语系来说,这样的分布非常奇特。

[图片:原文中的可视化内容]

正如我们已经习惯看到的那样,这些语系中的第一人称单数都是 na 的某种变体,如下表所示(再一次,我们可以找到许多原始形式来为 na “加分”):

[图片:原文中的可视化内容]

该章节所讨论的三个谜团是:

  1. 时间:澳大利亚各语系之间存在的相似性,如果它们像人口那样在五万年前就已经分离,本不应如此明显。

  2. 多样化:与PNG相比,澳大利亚语言(在代词、语法和音位方面)并不多样。这一点很奇怪,因为在它们存在的85%时间里,两地同属一块陆地。此外,尽管长期为邻,澳大利亚语言与PNG语言(不包括代词)却毫不相似。为什么它们会如此迅速地分道扬镳?

  3. 扩散:是什么促使帕马–纽干语系扩散到整个澳大利亚大陆?

关于时间问题,作者提出了一条出路:澳大利亚语言的变化速度可能远远慢于其他语言。这个解释并不令人满意,因为并不清楚为何语言学的规律在那片稀薄空气中就不适用了。又不是说原住民生活在某种静止状态中,Pama-Nyungan 语系的扩张就清楚地表明并非如此。进一步说,如果我们接受澳大利亚的代词在基因上与世界其他地区的 na 变体有关联,那么这些代词在两个地方存续的时间必须是一样长的;澳大利亚不可能是个特例。

关于扩散问题,《Nature》上有一篇很有帮助的论文:The origin and expansion of Pama–Nyungan languages across Australia。其摘要如下:

It remains a mystery how Pama–Nyungan, the world’s largest hunter-gatherer language family, came to dominate the Australian continent. Some argue that social or technological advantages allowed rapid language replacement from the Gulf Plains region during the mid-Holocene. Others have proposed expansions from refugia linked to climatic changes after the last ice age or, more controversially, during the initial colonization of Australia. Here, we combine basic vocabulary data from 306 Pama–Nyungan languages with Bayesian phylogeographic methods to explicitly model the expansion of the family across Australia and test between these origin scenarios. We find strong and robust support for a Pama–Nyungan origin in the Gulf Plains region during the mid-Holocene [6,000 BP], implying rapid replacement of non-Pama–Nyungan languages. Concomitant changes in the archaeological record, together with a lack of strong genetic evidence for Holocene population expansion, suggests that Pama–Nyungan languages were carried as part of an expanding package of cultural innovations that probably facilitated the absorption and assimilation of existing hunter-gatherer groups.

你会猜测澳大利亚主要语系是什么时候确立其分布范围的?令人惊异的是,覆盖八分之七陆地面积的这个语系仅在约 6,000 年前才开始扩张,而且研究者认为这是文化创新的结果。他们到底拥有什么是其他文化所没有的?有一篇博士论文认为,启蒙仪式和岩画促进了 Pama-Nyungan 的扩张6。值得注意的是,这与彩虹蛇(Rainbow Serpent)的起源相对应。正如 Birth of the Rainbow Serpent in Arnhem Land rock art and oral history 中所解释的那样:“The Rainbow Serpent has been used to define the nature of human existence for at least 4000–6000 years.”(参见 myth wiki 以了解这些神话的例子。)他们还讨论了一例被定年为 1 万年前的彩虹蛇异例。

在未来的一篇文章中,我将更深入地考察那些伴随na 在巴布亚新几内亚和澳大利亚出现的考古学变迁。迄今为止,语言学和考古学事实与意识蛇教(Snake Cult of Consciousness)之间的契合度相当不错。自我意识(因而也包括代词)可能是随着涉及蛇毒的仪式而传播的。首先进入巴布亚新几内亚,方向来自欧亚大陆。然后从巴布亚新几内亚方向传入澳大利亚。这就是为什么巴布亚新几内亚和澳大利亚的语言如此不同,因为它们最具动态性的阶段发生在二者分离之后。这也是为什么 Pama-Nyungan 能够席卷整个澳大利亚,因为他们在文化上同化的人群并不具备自我意识。这也解释了为什么所有澳大利亚语系都具有相似的代词形式,并且这些形式与巴布亚新几内亚以及许多其他语言相共享。

这并不是唯一的解释,但总得有某种解释,而如果意识蛇教促成了全新世的到来,那么目前的情形大致就是你所预期的那样。这一观点与一位语言学家关于语言起源的宏大理论出人意料地相得益彰。

如果你喜欢这篇文章,请分享。

Share

巴别塔之前(Before Babel)#

Morris Swadesh 于 1933 年在耶鲁大学获得语言学博士学位。接下来的十年里,他大部分时间都在从事美洲原住民语言的田野工作。在“红色恐慌”期间,他被指控同情共产主义(事实上,他确实是持证党员),因此被美国大学列入黑名单。

他是一个有信念、也不陌生于争议的人。在他去世前不久7,他完成了《The Origin and Diversification of Language》,在书中提出了自己的理论。下面是他对冰河时期语系关系的时空分布草图:

[Image: Visual content from original post]

他认为语言起源于原始巴斯克–德内语(proto-Basque-Dennean),然后向世界其他地区辐射。敏锐的读者会注意到,这一假设并未将其置于非洲,因为 Swadesh 的年代早于“走出非洲”(Out of Africa)理论被广泛接受。他是根据语言格局本身来推断的,那是在我们对遗传学知之甚少的年代。

那么,什么是巴斯克–德内语(Basque-Dennean)?这是一个雄心勃勃的假说,以其分布极端处的语言命名:巴斯克语(Basque),一种现今在西班牙境内的孤立语言,以及纳–德内语(Na-Dene),由美洲原住民使用,其分布一直延伸到今天的墨西哥。它还包括高加索语、布鲁夏斯基语(Burushaski)、汉藏语系(Sino-Tibetan)、叶尼塞语(Yeniseian)、萨利希语族(Salishan)、阿尔吉克语族(Algic)以及苏美尔语(Sumerian)。它们的现代分布见下图(为已灭绝的苏美尔语洒一滴泪)。

[Image: Visual content from original post]Range of Basque-Dennean

从地理上看,这些语言根本不该是亲属。但许多著名语言学家为此奋力辩护8。与许多其他语系一样,它是由符合预期形式的代词维系在一起的:

[Image: Visual content from original post]

有生与无生(两种性别)#

一旦人类变得具有自我意识,他们首先必须应对的事情之一就是“能动性”(agency)。(要像神一样,知道善恶,是很难的。)想想你在完全沉浸于某项任务时的那些时刻。这可能是像开车上班那样平凡的事情,你几乎没有意识到自己在做什么。或者,如果你从事体育运动或演奏乐器,那些完全活在当下的“心流”状态。在“自我”尚未产生出一个与身体分离的心灵之前,整个人生大概就是这样。一旦自我出现,语法反映能动性就变得合情合理。

在许多语言中,名词被划分为阳性或阴性。例如,西班牙语中的 mesa(桌子)是阴性。一些巴斯克–德内语中的语言采用有生/无生的性别系统。它不是按性别,而是按名词(或动词)是否有生来分类。例如,在巴斯克语中,“跑”这个动词是有生的,而“绊倒”则不是,因为完成这一动作并不需要能动性9。这反映了你自身的能动性,但我们也具备“心智理论”(Theory of Mind),会将这种能动性投射到他者身上。一些名词是按有生性来区分性别的10,例如在苏美尔语以及高加索地区阿尔吉克语族的语言中。因此,一块石头会被归为不同于狮子的类别。语法取决于我们是否对某个对象运用了心智理论。

这一点作为证据并不足以强有力地支持 Swadesh 所提出的“原始巴斯克–德内语是第一种完整语言”的观点。所有人类都是行动主体,而某些语言将意志性语法化,并不意味着这些人群在其他人之前就成为了行动主体。我之所以提及这一点,是因为思考语言在自我意识出现后会如何改变本身就是一项有趣的练习,无论这种改变发生在 15,000 年前还是 150,000 年前。全新的语法系统都有可能出现。一旦人属(Homo)变得“智人化”(sapient),这将像一颗陨石撞击一样冲击语言生态。如果那发生在 15,000 或 30,000 年前,其涟漪大致会呈现出类似 Swadesh 重建的样貌。

智人悖论(Sapient Paradox)#

“智人悖论”提出的问题是:为什么完全人类式的行为在约 12,000 年之前仍然是区域性的,而在那之后才在全球范围内出现。原始论文对这种变化的程度描述得稍微温和一些。它讨论了两种我们现在认为是根本性的近期行为:内在价值(例如对黄金之类的东西赋予价值)以及神圣之力(例如将灵性力量赋予某个物体)。但这还不完全等同于“智性”(sapience);我们可以想象,完全成熟的人类在没有货币和宗教的情况下也能生活(至少 John Lennon 可以这样想象)。

我通过代词所要做的是将“自我意识”加入这一列表。即便只把观察范围限制在萨胡尔(Sahul),na 在全新世期间席卷巴布亚新几内亚和澳大利亚这一事实本身就是一个谜。从更广泛的角度看,na 是以下这些相距甚远的语系中第一人称单数的原始形式:汉藏语系、安第斯语系、科伊桑语系、尼日尔–刚果语系以及澳大利亚语系。如果人类在离开非洲时就已经拥有代词和内在生活,那么我们不会期望看到这样的局面。有一位语言学家甚至将巴斯克–德内语(原始形式:ni)视为欧亚大陆上的第一种语言。而且这类理论并未被束之高阁。就在 2021 年,还有一位语言学家主张,完全语法化的语言仅在 20,000 年前才出现11

当然,目前并不清楚巴布亚新几内亚或澳大利亚的居民在 na 出现之前是否就已经拥有代词。但如果是那样,为什么 na 能如此有效地取代那些本土代词?而且,正如“智人悖论”所论证的那样,为什么在此之前的文化如此贫乏?

或者,na 也许在“走出非洲”事件之前就已经存在。那么,为什么它现在仍然保存得如此完好?为什么语言学家认为它是在 10,000 年前进入巴布亚新几内亚,而不是随着第一批人类一同到达?为什么我们会看到它在过去 10,000 年中偏离原始形式,而如果它在此前的 50,000 年里一直保持完好无损?这几乎好像要求我们假定在大约 10,000 年前发生了一次改变世界的心理断裂。也许可以称之为“智人悖论”?

双脑心智的崩溃(Breakdown of the Bicameral Mind)#

Julian Jaynes 或许是唯一另一位提出“意识是近期现象并通过模因方式传播”的科学家。《The Origin of Consciousness in the Breakdown of the Bicameral Mind》一书提出,在人类获得意识之前,他们拥有一种“双脑”(bicameral)的心智:大脑的一半负责产生行动计划。这些计划以听觉幻觉的形式传达给另一半,后者则负责执行。不存在一个可以进行反思的内部空间。那时的人类是“高贵的自动机,他们不知道自己在做什么”。

他对“类比自我”(analog I)以及通过双脑崩溃发现内在空间的过程有长篇论述。他认为这一过程仅在 3,200 年前发生于近东地区。他的书被引用了 5,000 次,但据我所知,他本人及其他人都没有费心去问“第一人称单数代词有多古老”这一问题。事实上,Jaynes 还提出了一整套关于语言演化的理论12。在“其他发展”(Other Developments)一节中,代词仅被顺带提及一次:

As for the other parts of speech, pronouns being redundant with names, would develop very late, and even in some older languages never get much beyond verb endings first differentiated on the basis of intensity.

与名字冗余!然而代词却是许多语系的支柱。我向仍然活跃的 Julian Jaynes 学会(Julian Jaynes Society)询问,为什么代词的证据早于 Jaynes 所提出的时间点。该学会的管理员(他曾是 Jaynes 的学生)表示,J-意识并不影响代词。十年前也有人在他们的论坛上提出过同样的问题,唯一直接的回应是:“你怎么知道古人使用‘I’?”

现在,如果你相信意识的起源不会改变我们用来展示心身问题的那些词语(“我思故我在”),那是你的自由13。但是,如果你认真对待代词,那么在许多地方 na 的引入与考古学家所谓的“智人悖论”相对应。这对于任何关于“智性通过模因方式传播”的理论来说,都是一个非常好的信号。

J-意识似乎并没有做太多事情。Jaynes 声称,文字的发明和金字塔的建造都发生在意识出现之前。它既不触及代词,也不对应任何令其他学科困惑的悖论或革命。另一个问题是,他没有提供自我发现的机制。如果人类在如此长的时间里都在无意识状态下运作,那么是什么促成了这种改变?对 Jaynes 而言,只是因为青铜时代近东地区的生活变得更加复杂。人们意识到,自己脑中如神一般的命令与邻城居民脑中的命令不同。“类比自我”便从那场顿悟的废墟中崛起。好吧,那这又是如何传播到澳大利亚的?而我可以指出,同一组代词扩散到(或至少在)巴布亚新几内亚和澳大利亚(以及美洲、非洲和大洋洲)。我还可以指出,在所有这些地方都存在对蛇的崇拜,它们与创世和知识相关联,而且它们的毒液作为迷幻剂的效力也有据可查。即便蛇并未参与其中,要想象“双脑崩溃”不会成为仪式的对象和创世神话的主题,本身就令人难以置信。

我曾有一个与 Jaynes 类似的想法:如果自我意识是一种“领悟”呢?我认为,我们不同的路径凸显了工程思维方式的优势。我没有花那么长时间去哲学化(这当然也可以被视为目前为止的一个漏洞)。相反,我问的是:什么可以导致自我意识?这一转变会留下什么证据?另一方面,Jaynes 要求人们相信,意识在历史时期才出现,但如今已被遗忘,只能通过希腊史诗中的语言皱褶来探测。

这并不是在随意抨击一个已经过时的观点。Eric Hoel 在 substack 上撰写 Intrinsic Perspective。在此之前,他曾在哥伦比亚大学和普林斯顿大学研究神经科学和意识,并在塔夫茨大学担任助理教授。他凭借一篇将“智人悖论”解释为人类八卦倾向的文章赢得了 2022 ACX 书评大赛。今年夏天,他将出版新书 The World Behind the World,该书承诺会更新 Jaynes 的《Origin of Consciousness》等内容。Jaynes 仍然被严肃的人所严肃对待。一个非遗传学的意识起源答案在哲学上极具吸引力。而且只要将时间点往前推移到“类比自我”和其他智性附属物首次出现之时,它也与数据相符。

如果自我意识在 3,200 年前才出现,就会产生许多谜团。什么是意识,如果我们在没有它的情况下也能完成如此多的事情?它是如何传播的?如果它在约 15,000 年前出现,这些问题就会得到缓解。例如,人们认为“心理时间旅行”(mental time travel)——想象自己处于未来——需要自我意识。当然,农业也需要灵活地规划未来。农业在全新世早期分别独立发明于肥沃新月地带、中国、墨西哥和秘鲁。这一全球性转变几乎同时发生,是一个巨大的谜团,尽管相关研究已持续数十年。同样的逻辑也适用于艺术,艺术需要在想象中进行心理旅行,而它只在“走出非洲”之后才出现。意识蛇教可以解释这两者。

欧亚语中的超保守词(Ultraconserved words in Euroasiatic)#

为了理解语言学上的争论,有必要再看一篇论文,它试图在欧亚大陆的七大语系之间寻找同源词。这些语系如下图所示,与巴斯克–德内语没有任何重叠。

[Image: Visual content from original post]Figure 1 from Pagel et al.

此时,我希望读者已经预期到代词会跃居榜首。“汝”(thou)和“I”分别在 7/7 和 6/7 个语系中被发现是同源的。这篇论文被《华盛顿邮报》媒体报道,引发了那些希望对任何“窥视过于久远过去”的项目泼冷水的语言学家的愤怒。一位语言学家回应说,整个项目不过是一种用统计方法在“火焰中看脸”的行为。除了对 8,000 年上限的常规抱怨之外,他对欧亚语所提出的诱发事件——冰河时期的结束——也并不满意:

Eurasiatic’s supposed “fit” with the usual suspect, the retreat of the glaciers, is only in (their) chronology. It is no explanation of why Eurasiatic should exist at all. Why should changing climate have favored just one language lineage, out of a single homeland, to dominate Eurasia, rather than a generalized advance of multiple, independent groups right across the continent?

我建议,关键并不在于冰川本身,而在于对意识的发现。

总结(Summary)#

  1. 如果自我意识是近期现象,那么我们可以通过追踪第一人称单数代词的扩散来追踪自我意识的扩散。

  2. 第一人称单数代词在全球范围内存在惊人的相似性,这只能用偶然、一致演化或扩散来解释。

  3. 偶然在统计上是不可能的。

  4. 在语系内部,我们观察到的是从共同原始形式的“分化”,而不是“趋同”。此外,要解释目前这种相似程度,趋同的力量必须强大得不合理。

  5. 我们只剩下“扩散”这一选项,但很难相信这些原始形式可以追溯到 5 万年以上。语言在这段时间内变化太大。

  6. 对原始智人语言(proto-Sapiens)感兴趣的语言学家(这是一个颇具争议的研究领域)认识到全球代词的相似性。研究特定区域的主流语言学家也认识到这些相似性(至少在他们所研究的区域内),但往往不愿与其含义正面交锋。

  7. 与“智人悖论”相一致的是,na 的引入与巴布亚新几内亚和澳大利亚在宗教、艺术和技术上的转型相吻合。

  8. 综合来看,这支持了这样一种观点:自我意识大致是在全新世期间传播开的。

  9. 那些认为 Jaynes 的工作颇具说服力的人,应该顺着代词的线索继续追踪。

我不是语言学家,也不是考古学家。所幸的是,他们已经明确说出了许多类似的观点。一个学科愿意为谜团撰写论文,而不仅仅是解决自己能够解决的问题,这本身就说明了很多。从娱乐的角度看,很少有领域像这个领域一样乐于提出宏大理论或展开激烈争论,而在这次研究中学习到一些鲜为人知的理论是一件乐事。到目前为止,我的贡献有:

  1. 一个认识论上的论证:如果自我意识是近期现象,那么我们应该能够从创世神话的描述中理解这一转变,而创世神话至少可以存续 12,000 年。

  2. 在此基础上,我主张,蛇在创世神话中的普遍性并非源于荣格式或进化心理学意义上的原型,而是源于扩散。蛇毒是这一过程中的活性成分。

  3. 原初代词假设:自从我们具有自我意识以来,我们就拥有代词。

  4. 其推论:我们可以通过追踪第一人称单数代词的扩散来追踪意识。

我希望代词能够证明意识蛇教是站得住脚的。 这为至少两种宏大理论提供了一种机制:Jaynes 的双脑心智理论,以及 Swadesh 关于语言起源为巴斯克–德内语的理论。Jaynes 有意识地将心理学与遗传学分离开来。对于 Swadesh 而言,这种分离则发生在后来的科学家更多地了解我们在非洲的遗传根源之后。

从遗传学角度看,人类家谱中存在深层分叉。科伊桑人谱系在10–15 万年前就已分离。因此,他们的第一人称单数代词与巴斯克人、印加人、汉藏语族、高加索人、乍得人以及南岛语族的第一人称单数代词相似,这一点就显得格外引人注目。

语言学家受过训练,认为他们的方法只能追溯到约 8,000 年以前。即便如此,在这一原则的应用上仍存在不一致之处。亚非语系(Afro-Asiatic)被广泛接受,尽管它的年代与那些被语言学家嗤之以鼻的“欧亚语系”(Euroasiatic)一样古老。澳大利亚语系则据某些说法已有 50,000 年历史。尽管如此,在回溯约 10,000 年、考察原始代词时,语言学家发现世界各地的语言都收敛到少数几种形式。这要如何解释?

有一小群“乌合之众”的语言学家认为,这些代词是原始智人语言(proto-Sapiens)——“母语”——的回声。这个群体与研究生物进化的人几乎没有交集。因此,他们通常假定自人类离开非洲以来,我们的基本神经结构就没有发生变化。这就要求存在至少存续 50,000 年的全球同源词。

为这一观点辩护,对学者而言并非易事。即便是在美洲印第安语(Amerind)中提出基因关系——在那里的假设是所有人在 15,000 年前都还彼此相关——也会遭遇强烈反对。那么,如何处理全球代词的相似性呢?想象一下,如果某位语言学家试图通过宣称代词(或语法,或任何其他根本性事物)是在人类离开非洲之后才被发明出来的,来解决这一冲突,会发生什么。

我的立场不同。这次探索的设计初衷是为了证伪意识蛇教和“夏娃意识理论”(Eve Theory of Consciousness)。我原以为,如果自我意识是近期现象,那么“I”也必然是近期现象,而这一点相当容易检验。第一人称单数代词的分布本应是随机的,那样的话,问题就可以画上句号。结果我发现,数十个语系使用相似的代词形式,而语言学家们已经就这一谜团争论了数十年。不仅如此,彩虹蛇的引入与 Pama-Nyungan 在整个澳大利亚的模因式(而非遗传式)扩张相对应。耐人寻味,不是吗?如何在没有大规模屠杀的情况下引入一种语言和一种创世神话?必然存在巨大的优势。这又回到了一个问题:为什么对蛇的崇拜如此普遍?如果这是出于对蛇的本能恐惧,为什么它又如此频繁地与知识和创世联系在一起?

虽然这还称不上“铁证如山”,但代词确实改变了我们对“智人悖论”应被多认真对待的判断。它或许实际上包含了“智性”本身。

Subscribe now

[Image: Visual content from original post]


  1. ŋ 是 thanks、anger、rung 中的那个“n”音。类似于:ng ↩︎

  2. Dene-Yeniseian 与 Dene-Caucasian:代词及其他思考 “因此,当在 Kott 语中作为第一人称单数主语动词词尾标记时,其形式为 ŋ(如 igejaŋ ‘我出生’),但在 Ket 语中作为第一人称单数主语动词前缀标记时,其形式为 b(a),如 ba-kissāl ‘我过夜’。Starostin 假定——大概是正确的——这里 ŋ 是原始形式,在原始 Yeniseian 语中由于该语言对词首响音容忍度较低,已经发生了向 m 再到 b- 的转变。” ↩︎

  3. 《On the origin of languages : studies in linguistic taxonomy》(第270页) ↩︎

  4. 唯一其他非遗传性的选项是趋同演化,即人类舌头以惊人的规律性将第一人称单数映射为 na(或某种相似形式)。巴布亚新几内亚(PNG)的证据表明情况并非如此。代词会像其他任何词一样从其原始形式漂移(也许除了 mama 和 papa)。Ross 理解这一点,因此将与另外两个地区的相似性解释为偶然。我的理解是,其他区域专家也倾向于这种解释,因为他们可以在自己的语言中看到分化。 ↩︎

  5. 《Where do personal pronouns come from?》只有一条引用。专家们在评论中表示,该论文在描述问题方面做得很好(代词极其相似,一再可以追溯到一万到一万五千年前),但对其解决方案则持否定态度。 ↩︎

  6. 《Ritual Evolution in Pama-Nyungan Australia》 ↩︎

  7. 实际上,这本书只是大部分完成。包含该图表的最后一章并未完成。 ↩︎

  8. 引自维基百科:“与 Dené–Caucasian 类似的分类在20世纪由 Alfredo Trombetti、Edward Sapir、Robert Bleichsteiner、Karl Bouda、E. J. Furnée、René Lafon、Robert Shafer、Olivier Guy Tailleur、Morris Swadesh、Vladimir N. Toporov 以及其他学者提出。” ↩︎

  9. 由一位我在墨西哥偶然遇到的巴斯克语母语语言学家向我解释 ↩︎

  10. 炼金术士在《Animus and Anima》中将这一类比更推进了一步 ↩︎

  11. 语言学荣休教授 George Poulos:“迹象表明,人类语言是智人相当晚期才获得的能力。本研究认为,就我们今天所知的语言而言,其很可能在大约两万年前开始出现。”该研究主要关注声道的演化,以及带有喀音语言与非喀音语言之间的比较语言学。他认为语法起源于南非(他的专业领域),并且要么存在某次(未有文献记录的)额外“走出非洲”事件,要么世界各地存在多次独立的语法发明。对我而言,这一理论里“蛇”远远不够多。 ↩︎

  12. 《The Evolution of Language in the Late Pleistocene》 ↩︎

  13. 在尽可能强化他们立场的前提下,“I”可以仅仅指代第一人称行动者,而不是行动者的心灵。假设我们在猎一头猛犸象,我说“mindvector 往这边走”。这可以被抽象为第一人称单数,而不必包含心灵。这就是《Where Do Personal Pronouns Come From?》中提出的情形,其中,行动者词不是一个名字 mindvector,而是一个头衔,比如“父亲”或“母亲”。因此,“Nana 往这边走”最终变成了我们在全世界范围内的朋友 na。即便在这种情况下,笛卡尔和 Jaynes 都认为词语 “I” 在传达身心二分方面是有用的。我的论点是,一旦我们具有自我意识,就需要这种语言学上的实用性。如果有其他语言在第一人称单数中不包含身心区分,那对我来说会很有趣,并且会成为反对“原初代词假说”(Primordial Pronoun Postulate)的证据。 ↩︎