知者自我与 Gn 侵蚀假说

摘要

关于全球范围内第一人称单数代词中普遍出现的 n‑/ŋ‑ 的两个推测性解释：
(1) “知者 = 自身”（由“知道”动词产生的反身形式），以及
(2) “我知道”中 ǵn‑ 的语音弱化。
二者都需要假定更新世晚期的扩散，或极深层的继承。
二者都没有在规则音变或可见的中间形式中获得直接支持。
类型学显示，代词很少源自动词；反身形式则常常源自身体部位词。
因此，全球代词趋同之谜依然未解。

背景#

在世界各大语系中，第一人称单数代词往往包含一个 n 音（齿龈鼻音或软腭鼻音）。
例如巴布亚祖语（巴新）na、阿尔冈昆祖语 ne- /na-、达罗毗荼语 nā́n、汉藏语 ŋa、巴斯克语 ni、闪米特语 ʔanā 等等。

这一模式广泛到很可能已经超出了纯粹偶然的范畴。

历史语言学家对在极深时间尺度上将这些代词音段联系起来持怀疑态度，因为语言变化很快，然而代词似乎异常稳定——在 Joseph Greenberg 的“美洲语系”（Amerind）假说中，第一人称单数 的 n 和 第二人称单数 的 m 在约 12,000 年的分化中在所有分支中都得以保留。

有研究者提出，如今我们所见的代词在“走出非洲”时尚未出现，而是在更新世末期（约 10–15 千年前）某个时段通过模因式扩散才形成并传播开来。

换言之，这一**“原初代词假设”（primordial pronoun postulate）**认为，自我意识（以及对“我”这类词的需求）是相对较晚才出现或扩散的。

下文将考察两个被提出用以解释普遍存在的 N‑型第一人称代词的推测性假说——一个侧重语义创新（“知者 = 自身”），一个侧重语音演变（更古老的 gn- 辅音丛的弱化）。
二者都试图通过史前晚期的扩散来解释代词形式惊人的全球相似性，同时二者都面临重大的证据挑战。

假说一：语义动因——“知者 = 自身”#

该假说认为，一个史前言语共同体从 “认识自己” 这一概念中创造了一个新的反身代词。

本质上，“我”（或“自身”）这个词可能最初是一个动词或动名词，意为 “那个知道（自己）的人”，反映了一种内省自我意识的突破。

这一想法与这样的观念相呼应：真正的第一人称指称——作为一个自主自我的概念——是在人的自我意识觉醒之后，必须通过语言“发明”出来的。

在一个刚刚开始处理主观意识的文化中，“认识自己”或“自我知者”这样的短语，很可能被重新分析为一个名词 = “我自己”，最终语法化为说话人的代词。

跨语言的类比#

虽然在有记录的语言中，我们没有直接见到“我 = 知者”这样的词源，但确有代词和反身形式源自具体名词和反身短语的先例。

语言类型学显示，反身代词常常通过转喻从身体部位词演变而来。

例如，巴斯克语在反身结构中使用 buru “头”（字面为“某人的头”来表示“自己”），而世界上超过一半的语言用诸如 身体、头、皮肤、灵魂 等词来构造反身形式。

这表明，抽象的代词意义（自我、本身）经常从与自我相关的具体概念中产生。

类比之下，从“知道”这一动词派生代词并非全然不可思议：这将是从一个抽象的内省来源而非具体身体部位出发，但仍然契合自我指涉这一主题（认识自己预设了一个可被认识的自我）。

如果“我”是一个新概念，那么将其塑造为“知者”就提供了一种语义透明的自我指涉：我就是那个（认识自己的）知者。

扩散与音变的要求#

若要用“知者 = 自身”来解释全球性的 N‑模式，这一创新很可能只发生过一次（或极少数几次），然后在约 12–15 千年前以借译或流行语（Wanderwort）的形式跨越多个语系扩散。

在巴布亚语中有一定先例：Malcolm Ross 指出，大约公元前 8000 年，一个 na‑型第一人称单数代词以模因式方式（并非通过大规模迁徙）席卷新几内亚——数十个互不相关的语系在这一影响下替换了自己的代词。

这种区域性的代词借用虽罕见，但显然在区域尺度上是可能的。若要在全球或泛欧亚范围内扩散，则更为非同寻常，这意味着史前存在一个跨群体交流极为密集的时期，或存在一个具有普遍吸引力的概念（或许与某种宗教崇拜或认知革命相关，如部分学者所推测）。

然而，这里会出现巨大的规则性难题。

如果某个祖语创造了一个源自“认识自己”动词的代词，我们就需要通过规则音变将这一形式追溯到各语系中已见的代词。

例如，一个假设的欧亚祖语形式 gna（“知者/自身”）可能演变为汉藏语 ŋa、达罗毗荼语 nā、亚非语 ʔan(a)、印欧语 egʷ‑（如果起初的软腭鼻音变为浊塞音）等等。

这一情景要求在平行谱系中出现一条极为特定的音系演变链——本质上是在标准比较法之外重建一个“我”的原始词。

关键在于，我们缺乏任何已见的中间形式或古代铭文来显示从“知道”到“我”的过渡。

这一设想完全是推理性的。

正如 Bancel 和 Matthey de l’Etang 在其关于代词起源的研究中指出，这类深层假说不可避免地遭遇材料断层：人们必须假定一个 “准代词阶段”（pronominoid stage）——介于普通词汇项与代词之间的中间形式——然而没有任何这类阶段的直接证据得以保存。

评估

“知者 = 自身”假说在将语言变化与认知演化联系起来方面颇具启发性。

它契合这样一个叙事：自我意识在冰期晚期扩散，从而促成了一项语言创新，以表达内省自我的新概念。

它也与跨语言的倾向相一致，即从已有的“自我”或“身体”词汇中创造代词。

然而，它依然是高度推测性的。

它依赖一连串难以证实的事件：一个史前言语共同体先拥有“认识自己”的反身结构，然后将其语法化为代词，再之后这一形式（在语音上类似 na/ŋa）以某种方式跨越大陆扩散。

我们没有任何已知的同源词组或古文本来支持这一路径，而代词本身极短且极为古老，使得常规的比较重建在数千年以上的时间尺度上几乎失效。

简言之，这一语义假说是对代词谜题的一个富有创造性的解答，但目前仍缺乏具体证据支撑。

假说二：Ǵn-（如 ǵneh₃ “知道”）的语音弱化为 N‑#

第二个假说更多地关注代词的形式而非其意义。

它认为，普遍存在的第一人称代词中的 [n] 源自更早的 */gn/ 辅音丛（背部音 + 鼻音组合），其首辅音随时间推移而丢失。

在实际操作层面，这意味着一个类似“我知道（……）”的祖语短语或套语被重新分析，其中的 gn- 部分在背部音弱化后最终被理解为代词本身。

原始印欧语（PIE）提供了一个参照点：动词词根 ǵneh₃- 的含义是“知道、认识”（参见拉丁语 gnōscō、希腊语 gignṓskō、梵语 jñā-）。

该词根以腭化的 g（ǵ，一种背部辅音）起首，后接 n。

如果设想史前存在类似“（我）知道 [X]”这样的语句，频繁用于自我肯定或自我认同，那么起首的音段 [ǵn…] 随时间推移可能被误解为一个独立的第一人称标记。

本质上，gn- > n- 通过语音磨蚀（丢失类似 g 的音）就会产生一个 “n-”代词。

这可以很好地解释为何在世界各地，“我 = na/ŋa/等”：代词会是一个更早 gnV- 词的化石。

它也为神秘的背部辅音丢失（“背部音脱落”）提供了一个解释——这在某些语境中是已知的音变——并将其特定应用于一个曾经的 gn- 代词。

例如，有人推测，原始印欧语 (e)g “我”（如 ego）可能源自更早的 */ŋ/ 或 /ɣ/ 音，这可能与类似 [gʲn] 的辅音丛有关，该辅音丛平滑为 [ŋ] 或 [n]。

在这一情景下，以 [ŋ] 表示“我”的语言（如部分汉语方言 ŋo、缅语 ŋa）保留了带有背部特征的鼻音，而以普通 [n] 表示“我”的语言（如阿拉伯语 anaa、盖丘亚语附着形式中的 ño-）则完全丢失了背部成分。

语音弱化假说将全球代词的相似性描绘为一种源自共同音段 gn- 的平行音律结果。

证据审视#

若要使这一假说站得住脚，我们应当在各相关语言或语系中发现其他 gn- > n- 的起首音变反射。

音变具有规则性：一个在 /n/ 前丢失起首 /g/ 的语言，应当在其整个词汇中都表现出这一现象。

我们是否能在无关词汇中发现古老 gn 辅音丛变为 n 的例子？总体而言，并没有。

例如，在印欧语中，gn- 辅音丛并未被系统性地丢失——拉丁语、希腊语、梵语等都保留了 g（拉丁语 gnātus “出生的”、gnōscere “知道”，[gn] 仍在；希腊语 gnósis；梵语 jñā- 带有 [gʲ] 或类似音）。

只有在更晚的某些后代语言中，这一辅音丛才被简化（法语 naître < 拉丁语 gnāscor，或英语 kn- 中的静音 k，这是特定的日耳曼语音变）。

在原始印欧语中没有证据表明存在早期的“gn > n”剪裁，可由此产生 na 自 gna。

其他语系亦然：我们没有看到在诸如“膝盖”这类常见概念的词中出现任意的 g- 脱落（PIE ǵenu- > 拉丁语 genu、梵语 jánu-），如果存在普遍的音变规则，这些词理应变为以 n 起首。

简言之，背部辅音的删除看起来是特设的——仅为解决代词难题而引入，而非在这些原始语言中得到普遍见证的音系规则。

这大大削弱了该假说的说服力。

这表明，即便 gn → n 曾经发生，它也不是一个语系范围内的规则音变，而更像是一个特定于代词语境的一次性重分析。

然而，代词由动词重分析而来本身就不寻常——通常，代词来自更古老的代词或指示词，而非动词词干。

正如语言学家 Lyle Campbell 所指出的，代词是最稳定的核心词汇之一，在正常的语言变化中往往不会被整体替换或重新创造。

提出整个大陆的代词源自一个被错误切分的动词短语，的确超出了我们对语法演化的常规理解。

全球传播问题#

即便我们设想某一语言（例如一个冰期晚期的欧亚祖语）中，“我知道”这样的短语 [ə ǵnə…] 被简化为 nə = “我”，那么这一形式又是如何传播到全球的呢？

我们再次面临扩散问题：要么这一祖语拥有众多后代（宏语系情景），要么这一形式在不相关的群体间被借用。

谱系路线（一个“原始世界语”或至少原始诺斯特拉语中 ŋa = “我”）争议极大——从事长距离比较的学者确实注意到，欧亚或诺斯特拉语系重建的代词中往往包含 n 或 m，并有人提出这些代词最终源自原初的亲属称谓，如 na-na “母亲/父母”。

然而，即便是这些理论（将印欧语 egʰom、乌拉尔语 minä、阿尔泰语 bi/na、达罗毗荼语 nā́n 等视为遥远同源词）也并不特别要求一个“知道”动词的来源——相反，它们通常诉诸早期的亲属或指示词根（mama、nana 等）作为来源。

相比之下，gn‑弱化假说并非这些长距离词源学中的标准组成部分；它更像是为了解释音对应（即如何从假定的 gn 原型得到现今仅含 n 的形式）而提出的特设解释。

如果 gna/ŋa 这一“我”的形式确实是原始智人的或极为古老的词，那么它在那个阶段很可能已经是一个代词或代词性小品词——而非明确与“知道”这一意义相连。

换言之，要在全球范围内接受语音弱化，人们几乎不得不假定一个共同祖先代词 ŋa（其中 ŋ 或可被视为更早 gn 辅音丛的反射）。

但如前所述，在已知的变化速率下，要在数万年间保持一个代词不变极为困难——除非这一代词在后期通过扩散被重新引入或不断强化。

gn 假说的另一项预期是：如果弱化并不完全，那么某些语言中应当保留带有完整 gn- 的代词形式。

我们是否见到以 g 或 k + 鼻音起首的第一人称代词，可被视为这一过程的化石？在少数情形下，似乎有一些例子：例如爱斯基摩–阿留申语祖语中“我”为 ŋa-（软腭鼻音），而部分亚非语祖语重建中第一人称单数为 *ʔanaku ~ (ʔ)anak（其中 anak 或可被切分为 an- 加后缀）。

埃及语 ink “我”带有一个软腭辅音 k。

但这些联系都颇具推测性——没有任何形式清楚地源自这些语言中“知道/认识”的词根。

它们同样可以被解释为内部发展或附加成分（例如，埃及语 ink 中的 k 通常被解释为系词成分，而非代词词干的一部分）。

归根结底，在不同语系中缺乏任何**“知道”同源词链**（汉藏语中“知道”的词根完全不同，亚非语中“知道”的词根也不同，等等），这表明如果“我知道”这一套语曾是来源，它并未留下其他语言痕迹。

只有代词本身幸存下来，剥离了原有的动词意义——如同一个游走于世界诸语言中的 gnō- 幽灵。

这使得语音弱化假说相当难以证伪（我们总可以说“这一变化发生了，并抹去了所有其他证据”），但对语言学家而言也不太有说服力，他们更倾向于让某一变化得到更广泛模式的支持。

正如 Bancel 等人略带讽刺地指出，要为一种前所未见的变化（如亲属称谓或动词变为代词）提供正常的类型学证据几乎是*“不可能满足的要求”*，因为在可观察的时间尺度上，代词几乎从未以这种方式发生变化。

评估

ǵn > n 弱化假说巧妙地解释了谜题的一部分——为何如此多的第一人称代词都只剩一个裸露的鼻音。

它诉诸一个具体的语音机制，可以从更复杂的形式产生这一结果。

然而，该假说在经验层面上并不充分。

它与已知的规则音变并不吻合（在代词之外，我们看不到全球范围内“背部音 + 鼻音”组合中背部音脱落的模式），并且它要求一种语法重分析的飞跃（动词 → 代词），而这在已记录的语言史中几乎前所未见。

在缺乏独立证据（例如多个语系中“知道”同源词演变为代词，或古文本中保留 gn- 代词化石）的情况下，我们必须将其视为一个有趣的事后构想，而非一个已被证实的解释。

即便是支持长距离代词同源性的学者，也并未特别主张“我知道”这一来源；他们更倾向于将原初来源归于古老的亲属呼语（mama、nana）或指示性声音。

总之，语音弱化设想或许可以在假定存在 gn‑ 原型的前提下解释背部音的丢失，但它难以解释这一形式最初为何存在，以及它如何传播到世界各地。

它同样最终依赖于晚期扩散或极其古老的继承这一前提，而主流语言学对此持保留态度。

结语#

“知者 = 自身”和“gn‑弱化”这两个假说，都在推测的边缘地带徘徊，试图解决被称为*“代词阴谋”（the pronoun conspiracy）*的问题：全球范围内惊人相似的代词词干。

语义假说侧重文化–进化力量，设想一个新观念（作为知觉主体的自我）在冰期晚期催生了一个新代词，并随人类自我意识一同传播。

语音假说则侧重语言内部机制，提出不同语言之所以在第一人称上趋同于 n，是因为一个共同的音段序列（gn）在相同语境（“我知道”）中磨蚀所致。

值得一提的是，第三条研究路径（虽未在此被明确询问）是**“亲属称谓假说”**，其中代词中普遍出现的 m, n, t 可能最终源自原初的亲属称谓，如 mama（母亲）、nana（祖辈）、tata（父亲），这些词后来被重新用作人物标记。

该假说同样承认缺乏中间证据（没有清晰阶段表明“mama”曾明确表示“我”），但指出亲属称谓在语用上与代词具有某些独特的共性（其指称会随说话人而变化）。

在所有这些情形中，我们都能看到代词谜题的非同寻常：解释它可能需要非同寻常的情景——无论是激进的语法化，还是人类史前的一次大规模模因事件。

主流历史语言学家倾向于将全球代词相似性归因于偶然、音象征以及生理约束的某种组合（例如 [m] 和 [n] 是人类，尤其是婴儿，最容易、最稳定发出的辅音之一）。

他们提醒说，诉诸一个约 15,000 年前的单一祖先，或后期的全球扩散，超出了比较法的证据极限。

事实上，要认真考虑近期的全球扩散，人们要么必须相信我们的祖先在走出非洲时并没有代词，后来才重新发明它们；要么必须接受代词可以在数万年间抵抗替换——无论哪一种立场都颇具争议。

本文讨论的两个假说试图在不公然违反语言“规律”的前提下理解这些数据：假说一认为人类直到某次文化火花点燃之前都没有第一人称代词（因此无需假定极深层的保留），而假说二则认为代词确实存在，但形式不同（通过规则变化解决语音不匹配）。

二者都没有直接证实——它们仍是大胆的猜想，激发着关于代词能告诉我们多少人类过去信息的进一步研究（与争论）。

目前，N‑代词之谜依然存在，邀请我们想象一个时代：也许，一个新词——“我”这个词——曾是人类最伟大的发明。

常见问题#

问 1：是否有任何有记录的语言，其“我”在词源上确实等同于“知者”？
**答：**目前没有任何有记录的语言显示 “我” 直接源自 “知道”；这一设想完全是推测性的，且缺乏中间阶段或同源链条的支持。

问 2：语言会借用人称代词吗？
**答：**极少见，但巴布亚语的证据显示，第一人称单数 na 在区域内被借用，这表明在强烈接触条件下，代词形式的模因式传播是可能的。

问 3：为什么这么多代词使用 m 和 n？
**答：**这些鼻音是人类最早习得、最稳定的音位之一，在低音量下声学上也很易区分，并且可能源自婴儿对亲属的呼唤，如 mama/nana。

脚注#

参考文献#

务必多引用来源！广泛引用学术论文、专著、新闻文章、网站和一手资料。如有可用，请附上超链接。

Cutler, Andrew. The Unreasonable Effectiveness of Pronouns. Vectors of Mind, 2023.
Bancel, Pierre & Matthey de l’Etang, Alain. “Where Do Personal Pronouns Come From?” Journal of Language Relationship 3 (2010).
Ross, Malcolm. “Pronouns as a Preliminary Diagnostic for Grouping Papuan Languages.” Papers in Papuan Linguistics 2 (1996).
Campbell, Lyle. “American Indian Personal Pronouns: One More Time.” International Journal of American Linguistics 52 (1986): 359-390.
Haspelmath, Martin et al. (eds.). The World Atlas of Language Structures Online (WALS), 2005.
Pagel, Mark et al. “Ultraconserved Words Point to Deep Language Ancestry across Eurasia.” PNAS 110.21 (2013): 8471-76.
Watkins, Calvert. The American Heritage Dictionary of Indo-European Roots. Houghton Mifflin, 2011.
König, Ekkehard & Volker Gast. Reciprocal and Reflexive Constructions. De Gruyter, 2008.
Greenberg, Joseph H. Language in the Americas. Stanford UP, 1987.
Ruhlen, Merritt. On the Origin of Languages. Stanford UP, 1994.
Bowern, Claire. “Limits of the Comparative Method.” Annual Review of Linguistics 4 (2018): 157-178.
Beekes, Robert S.P. Comparative Indo-European Linguistics: An Introduction. John Benjamins, 2011.
Campbell, Lyle & William J. Poser. Language Classification: History and Method. Cambridge UP, 2008.
Substack thread. “Was PIE eg Originally ŋa?” Comments, Vectors of Mind, 2024.
LIV2 (Lexikon der indogermanischen Verben, 2nd ed.). Eds. Helmut Rix et al., 2001.
Bancel, Pierre et al. “Kin Terms as Proto-Pronouns.” Diachronica 37.4 (2020): 537-575.
Wierzbicka, Anna. Semantics, Culture, and Cognition. Oxford UP, 1992.
Schrijver, Peter. “The Reflexes of the Proto-Indo-European First Person Pronoun.” Historische Sprachforschung 110 (1997): 297-314.