TL;DR

  • 代名詞はゆっくり年をとる。 一人称・二人称の形はしばしば 1 万年以上存続し、借用されることはまれである。
  • アフリカ: 広く見られる 鼻音の「I」/唇音の「you」 パターンは、単一のマクロ語族というより、古い拡散の反映である可能性が高い。
  • ユーラシア vs アメリカ大陸: ユーラシアには m- / t- 帯があり、太平洋側アメリカには n- / m- 帯がある。どちらのクラスターも、偶然にしては地理的まとまりが良すぎる。
  • 超保存語彙 は深い親縁関係を示唆する魅力的な手がかりだが、それ単独では世界共通の祖語を証明することはできない。

Introduction#

世界を旅してみると、不思議なパターンに気づくかもしれない。多くの言語で、「私」や「わたし」を表す語が驚くほどよく似ており、しばしば mn で始まるのである。たとえば英語の me、フランス語の moi、ヨルバ語の emi、ズールー語の mina などだ。これは単なる偶然なのか、それとも、広大な距離で隔てられた言語同士が深い歴史的つながりを共有していることを示す手がかりなのだろうか。言語学者たちは昔から、代名詞(I, you, we のような語)や語彙の中の他の小さな語が、しばしば何千年ものあいだ変わらずに残ることを観察してきた1。実際、こうした 閉クラス語 ― 代名詞、小さい数詞、基本的な副詞 ― は非常に保守的である。これらは「平原に立つ硬い岩のように、他のほとんどの語が押し流された後も長く侵食に耐え続ける」1。派手な名詞や動詞が隣接言語から置き換えられたり借用されたりしがちなのとは対照的に、基本的な代名詞や数詞は、原則として借用されない傾向がある2。そのため、これらは 系統信号 の金鉱 ― 言語が互いに容易に認識できないほど分岐してしまった後でも残りうる、古い言語的親子関係の手がかり ― となる。

本稿では、代名詞とごく少数の超安定語が、世界の諸言語の間に隠れたつながりをどのように示唆しているかを探る。焦点を当てるのは興味深い事例、すなわち サハラ以南アフリカ の諸言語である。ここには主要な語族として アフロ・アジア語族ニジェール・コンゴ語族ナイル・サハラ語族、そしていわゆる「コイサン」諸語(実際には複数の孤立言語・小語族である)3 が含まれる。これらの言語が通常の意味で互いに関係していることは証明されていない。実際、アフリカにおける大規模な「マクロ語族」区分は、依然として仮説的かつ論争的である4。それにもかかわらず、これらは代名詞体系において顕著な類似性を示す。たとえば「I」に鼻音を用い、「you」にしばしば唇音(唇で作る音)を用いるといった具合だ。また、視野を世界規模に広げてみよう。なぜ ユーラシア の言語(フランス語からヒンディー語まで)はしばしば I/youm/t を用いる一方で、多くの アメリカ先住民諸語I/youn/m を用いるのだろうか。これらのパターンは、古い継承(共通祖先)によるものなのか、それとも地域的拡散(言語同士が互いに影響し合うこと)によるものなのか。本稿では、これらの概念を平易な言葉で整理し、なぜ一部の言語学者が、代名詞や他の機能語が 先史の深層 ― おそらく数万年前 ― にまでさかのぼる可能性があると考えるのかを見ていく。ただし、現時点では人類の全言語に共通する完全な系統樹を再構築できているわけではない。

(本題に入る前に、「マクロ語族」について一言しておこう。この用語は、複数の確立した語族を結びつける仮説上の超語族を指す。例として、ジョゼフ・グリーンバーグが提案した Amerind(アメリカ大陸)や、インド・ヨーロッパ語族、ウラル語族などを結びつける Eurasiatic がある。これらの提案の大半は未証明であり、議論の的となっている4 が、超保存語について語る際の文脈を与えてくれる。)

Pronouns: Tiny Words with Big History#

代名詞は小さいが、そこには 大きな歴史 が詰まっている。「I」や「you」と口にするたびに、記録史をはるかに超えた過去へとさかのぼる語を使っている可能性があると考えてみてほしい。言語学の研究によれば、一人称・二人称代名詞(“I” と “you”)は、どの言語の基本語彙においても 最も安定した語 の一つであることがわかっている1。1960年代、モリス・スワデシュら言語学者は、基本語彙リストを言語間で比較し、語がどのくらいの速さで置き換わるかを推定し始めた。その結果、「I」や「you」のような語は長く残る傾向があることが判明した。ある研究では、一人称単数代名詞の 「半減期」が約 16万6千年 と推定された ― つまり、その期間のうちに、その言語から分岐した系統の半分でこの語が置き換えられる、という意味である1。(この数字は外挿によるもので、文字通りに受け取るべきではないが、代名詞の極端な長寿性を強調している。)別の研究者セルゲイ・ドルゴポリスキーは、比較分析において Iyou を最も長く存続する意味領域の第 1 位と第 3 位に位置づけた1

では、なぜ代名詞は他の語が消えていく中で生き残るのか。その理由の一つは、代名詞が 絶えず使用される からである。私たちは一日に何百回も代名詞を口にしており、それが変化に対する「予防接種」のように働いているようだ5。もう一つの理由は、言語が外国語から代名詞を借用することがほとんどないからである2。スペイン語話者が weekend のような英語の語を借用したり、日本語話者が computer のような英語語彙を取り入れたりすることはあっても、「I」や「you」に相当する語を借用することはない。言語学者ジョゼフ・グリーンバーグが指摘したように、「一人称・二人称代名詞の借用が確実に立証された事例は、あったとしてもごくわずかである」2。これらの小さな語は文法とアイデンティティに深く織り込まれており、外部からの影響で簡単に置き換えられることはない。そのため、言語の 系譜 を示す信頼できる道標となる。

現代の計算的研究は、一部の基本語がいかに 超保存的 でありうるかを改めて裏づけている。2013年、マーク・ペイジルらによる統計分析は、7 つの主要語族(インド・ヨーロッパ語族、ウラル語族、アルタイ諸語、ドラヴィダ諸語などを含む)の再構を調べ、4 語族以上に同根語が見られる語を約 23 語特定した。これは偶然に期待される数を大きく上回る6。この超安定語の中には、代名詞(I, you, we)、数詞(one, two, three)、notwho のような副詞が含まれていた6。研究者たちは、こうした語が、意味と音形をある程度保ったまま 1万5千年以上 にわたって保持されてきた可能性があると主張している。これはちょうど最終氷期の終わりにあたる時期だ。この主張は物議を醸している(後で懐疑論に触れる)が、非常に興味深い。I が「どこでも同じことを意味する」ように見えるのは、多くの現代語が 同じ古代の源 からそれを受け継いだからかもしれない、ということになるからだ。ペイジルらの論文では、今日のユーラシア諸語の祖先が、氷河の後退期である約 1万5千年前に話されていた一つの言語にさかのぼる可能性すら示唆されている6

もちろん、誰もが納得しているわけではない。そのような遠い過去の語彙を再構するのは極めて難しい。言語は変化が激しく、1万年以上前の語は現代の子孫言語では判別不能なほど変わってしまう。批判者たちは、偶然の類似にだまされやすいと指摘する。言語学者サリー・トマソンは、比較方法では扱えないほど古い系統間で、似た音形の語の集合を見つけることは、「比較方法には届かないほど遠い」 時代における語を探すことは、炎の中に顔を見出す ようなものだと皮肉った7。意味のあるパターンがあると自分に言い聞かせることはできるが、それは単なる偶然の揺らぎかもしれないのである。トマソンはペイジルらのデータを検証し、いくつかの方法論的問題を指摘した(たとえば、データセットには複数の可能な祖語形が含まれており、著者たちはどれを比較対象とするかを主観的に選ばざるをえなかった)7。彼女や多くの歴史言語学者は、こうした超安定語だけで世界語族を証明できるとは依然として懐疑的である7。しかし、懐疑派であっても、ここに 一粒の真実 があることは認めている。特定の種類の語は、平均的に見て他よりもはるかにゆっくり変化するという点だ。その筆頭が代名詞である。

まとめると、代名詞は言語的な家宝のようなものであり、数えきれない世代の話者を通じて忠実に受け継がれてきた。代名詞は 言語的祖先の指紋 として機能する。二つの言語が非常によく似た代名詞を共有している場合、それはそれらが共通の祖先からそれを受け継いだという強い(ただし決定的ではない)示唆となる。では、これが世界の一地域 ― サハラ以南アフリカ ― でどのように現れているのか、もう少し詳しく見てみよう。

An African Case Study: Nasal I, Labial You?#

サハラ以南アフリカは、いくつかの大きな語族(「門」)に属する言語のタペストリーであり、主流の学説が証明できる限りでは、これらは 別個の起源 を持つ。ここには アフロ・アジア語族(例: ハウサ語、アムハラ語、ソマリ語)、ニジェール・コンゴ語族(例: スワヒリ語、ヨルバ語、ズールー語、ウォロフ語)、ナイル・サハラ語族(例: ルオ語、マサイ語、カヌリ語)、そしていわゆる コイサン 諸群 ― 南部アフリカのクリック子音を持つ言語で、!Xóõ、サンダウェ、ハッザなどがあり、これは一つの単位ではなく 孤立言語または小語族 から成る3 ― が含まれる。表面的には、これらの言語は語彙も文法も大きく異なる。ハウサ語の文はズールー語の文とは見た目も音もほとんど似ておらず、クリック音を含む !Xóõ の語はアムハラ語のどの語ともまったく似ていない。そのため、これらの語族を一つの巨大な「アフリカ超語族」にまとめようとする提案は、せいぜい仮説的なものにとどまっている。しかし興味深いことに、代名詞(およびいくつかの他の基本語)に注目してみると、アフリカの系統をまたいで共通する糸が見え始める。

目につくパターンの一つは、多くのアフリカ諸語が「I」を表す語に 鼻音子音m, n, ŋ など)を用い、「you」(単数)を表す語にしばしば 唇音子音m, b, w など、唇で作る音)を用いることである。いくつかの例を見てみよう。

LanguageFamily“I” (1st person sing.)“You” (2nd person sing.)
Swahili (Tanzania)Niger-Congo (Bantu)mími (I)5 (also as prefix ni-)wéwe (you)
Zulu (South Africa)Niger-Congo (Bantu)mina (I)wena (you)
Yorùbá (Nigeria)Niger-Congo (Yoruboid)èmi (I)ìwọ (you) (pronounced with w)
Akan (Ghana)Niger-Congo (Kwa)me (I)wo (you)
Hausa (Nigeria)Afroasiatic (Chadic)ni (I, enclitic pronoun)káĩ (you masc.) / (you fem.)
Amharic (Ethiopia)Afroasiatic (Semitic)ənē (እኔ, I)anta (አንተ, you masc.) / anchi (you fem.)
Luo (Kenya)Nilo-Saharan (Nilotic)aná (I)ín (you)
Hadza (Tanzania)Isolate (“Khoisan”)tiʔe (I) 8baʔe (you) 8 (approximate forms)

(発音は大まかな転写であり、声調や母音長の違いは簡略化している。)

これらを見ると、一人称 形がしばしば m または n 音 を含む傾向があることに気づく。スワヒリ語、ズールー語、ヨルバ語、アカン語などのニジェール・コンゴ諸語では、「I」を表す語が m- で始まる(スワヒリ語 mimi、ズールー語 mina、アカン語 me)。アフロ・アジア語族のハウサ語は n-ni)を用い、ルオ語も ana の中に n を含む。アフロ・アジア語族セム諸語の一員であるアムハラ語も、短い母音で始まるが語末に -n 音を持つ ənē を用いる(興味深いことに、古いゲエズ語では ʾaná という形で n を含んでいた)。これを 二人称 形と比べてみよう。ヨルバ語 iwọ とズールー語 wena は「you」に w(唇音の半母音)を用いる。アカン語 wo も同じ子音だ。スワヒリ語 wewe は w の重複である。ハウサ語の ka はこのパターンには合致しないが、多くの関連チャド諸語では二人称代名詞に bw が現れる。クリック音で知られる孤立言語ハッザ語は、「you」に baʔe(b で始まる)を用いる8。このように、系統的には無関係なアフリカ諸語において、「I」に鼻音(m/n)、「you」に唇音(m/b/w)という組み合わせがしばしば見られる。言語学者たちはこれを 深層のシグネチャー の可能性として注目してきた。おそらく、これらの言語は非常に古い祖語から特定の代名詞音を保持しているか、あるいは遠い過去の接触を通じて互いに影響し合ったのかもしれない。

もちろん、すべてのアフリカ諸語がこのパターンに完全に従うわけではなく、変異も存在する。アムハラ語では「you」は anta(t 音)であり、アフロ・アジア語族セム諸語に典型的な二人称 t パターンに従っている。カヌリ語のような一部のナイル・サハラ諸語では、代名詞はかなり異なっている(カヌリ語の「I」は ŋaye、「you」は nyin で、どちらも鼻音であり唇音はない)。しかし、「I」に m ~ n を用いるという再帰的なパターンは、十分に広く見られるため注目に値する。ニジェール・コンゴ語族については、原ニジェール・コンゴ語(この語族全体の仮説上の祖語)が、一人称単数代名詞として mV…(m + 母音)、二人称としても mV… だが異なる母音を持っていたと再構されている5。言語学者トム・ギュルデマンによる権威ある再構では、原ニジェール・コンゴ語の一人称単数は *mì/(m + 前舌母音)、二人称単数は *mù/(m + 後舌母音)とされる5。つまり、何百ものニジェール・コンゴ諸語は、「I = m-」という形をこの共通の源から受け継いだ可能性が高い。ズールー語話者が mina と言い、フラニ語話者が mi と言い、アカン語話者が me と言うとき、それらはすべて、農耕や製鉄、私たちが知るどの文明よりもはるか以前にアフリカで用いられていた代名詞を反映しているのだと考えると、実に驚くべきことである。

では、「クリック」諸語(コイサン)はどうだろうか。これらの言語はかつてグリーンバーグによって一つの群にまとめられていたが、今日の言語学では、少なくとも 3 つの別個の語族(Khoe-Kwadi、Tuu、Kx’a)と、いくつかの孤立言語(ハッザ、サンダウェ)が存在し、たまたまクリック音を共有しているにすぎないと考えられている3。これらの間に見られる類似は、接触によるものか、単に共通の傾向によるものかもしれない。しかしここでも、代名詞はいくつかの魅力的なつながりの手がかりを提供してきた。たとえば、ナマ/ダマラ語などを含む Khoe 語族の祖語である原 Khoe 語は、「I」に *mi、「you」に *ni(あるいはその逆)といった代名詞を持っていたと再構されており、研究者たちはタンザニアの孤立言語サンダウェが非常に似た代名詞形を持つことを指摘している8。ある研究では、原 Khoe 語の代名詞体系とサンダウェの代名詞との構造的な平行性が示され、両者が遠い親縁関係にある可能性が示唆された8。これは決定的な証拠にはほど遠いが、もしアフリカのこれらの系統が深いところで共通の源から派生したのだとすれば、大陸全体に断片的に残る古代の代名詞パラダイムの名残として、まさにこの種の手がかりが期待されるところである。

では、アフリカ諸語に共通するこれらの代名詞は、ニジェール・コンゴ語族、ナイル・サハラ語族、アフロ・アジア語族、コイサン諸語がすべて一つの「Africon」大語族のメンバーであることを意味するのだろうか。多くの言語学者は、結論を急ぎすぎだ と言うだろう。いくつかの類似は 偶然 による可能性もある(m, n, w のような単純な音の組み合わせは限られている)。また、地域的拡散 による可能性もある。長期にわたる接触地帯で言語同士が互いに影響し合った結果かもしれない。たとえば西アフリカでは、ニジェール・コンゴ諸語とアフロ・アジア語族チャド諸語が何千年も共存しており、「一人称に m- を用いる」という地域的な好みが両者の間で広まった可能性もある。しかし、代名詞は他の語彙に比べて借用されにくいため、拡散による説明は難しい面もある。別の可能性として、こうした基本的な代名詞音がある種の意味で 「自然」 であるという考え方もある。つまり、人間には自分自身を指すのに [m] 音を用いる先天的な傾向があるのかもしれない(赤ん坊は早い段階で mama のような語を発する)。音象徴 や発音のしやすさに関する仮説もある。[m] や [n] は乳児にとって最も発音しやすい子音の一つであり、そのため多くの言語で代名詞のような基本語に現れても不思議ではない9。しかし、説明すべきなのは一つの言語ではなく、地域全体にわたるパターンである。次の節で見るように、これらの代名詞パターンは 地理的にクラスターをなしており、普遍的ではない。これは、人間の生物学だけでなく、歴史が関与していることを示唆する。長距離比較を支持する言語学者は、最も単純な説明は 継承 であると主張するだろう。すなわち、これらの言語が同じ古代の言語から派生したために代名詞を共有しているのだ9

アフリカを離れる前に、代名詞に焦点を当てることが深い関係を探る唯一の角度ではないことにも触れておこう。他の閉クラス要素も安定性を示す。たとえば基本的な数詞である。ニジェール・コンゴ語族全体で、「二」を表す語はしばしば ba, ɓa, va のような形をとる(原ニジェール・コンゴ語では「2」は *ba-di と再構されている)。「三」を表す語はしばしば ta-t_ のような形で(ヨルバ語の tààtà「三」や原ニジェール・コンゴ語の *tat など)5。アフロ・アジア語族では、「一」を表す語が諸枝にわたってよく似ていることがよく知られている(例: アラビア語 waḥid、ヘブライ語 _ אחד_ eḥád、チャド諸語のハウサ語 daya ― 音形は一見似ていないが、アフロ・アジア語族内部で根をたどることができる)。こうした小さい数詞は、数えるという機能があまりに基本的であるため、置き換えにくい。人は「一、二、三」をそう簡単には入れ替えないのである。実際、「二」と「五」は、ユーラシアにおける超保存語の初期リストに挙がっていた。(奇妙なことに、ペイジルの 2013 年の研究では、数詞 は最終的な 23 語の超保存セットには含まれなかった6 が、これはデータの複雑さによる可能性がある。数詞は依然として一般に非常に保守的であり、インド・ヨーロッパ諸語における two, duo, dvi, bi- がすべて同じ古い語根を反映していることからも明らかである。)

アフリカの事例研究は、系統的なつながりが合意されていない言語同士が、小さな核心語を共有しているというパズルの一端を示してくれる。では、ここから視野をさらに広げて、世界規模 の代名詞パターンを眺め、そのうえで大きな問い ― 継承か拡散か ― に取り組んでみよう。

Global Pronoun Patterns: Coincidence or Ancient Kinship?#

アフリカの例では、一つの地域的パターン(鼻音の「I」、唇音の「you」)を見た。実は、言語学者たちは世界規模で少なくとも 2 つの主要な言語横断的代名詞パターン を特定しており、それぞれが広大な地理的範囲にわたって多くの語族をまたいでいる。これらは 1 世紀以上前にすでに指摘され、その後詳細にマッピングされてきた9。それが次の 2 つである。

  • ユーラシアにおける m–T パターン: ヨーロッパからアジアにかけての言語では、一人称代名詞に m(あるいは n のような別の鼻音)を、二人称代名詞に t(あるいは s のような別の歯茎音)を持つことが一般的である。ここではこれを 「M-T 代名詞帯」 と呼ぶことにする。古典的な例として、ラテン語では「I」を ego と言ったが、斜格形の me(me)は m- を持ち、「you」は tu で t- を持っていた。インド・ヨーロッパ諸語はこれを保持している。スペイン語 me, 、ロシア語 menya(「me」)、ty(「you」)、ヒンディー語 mujhe(「me」)、(「you」)。英語では me / you であり、you は現在 t を持たないが、古英語では þū(th 音)であり、フランス語 tu に由来する te が “attire” のような語に残っている ― つまり、英語は「you」に関してやや例外的である。インド・ヨーロッパ語族以外でも、ウラル語族は一人称に m を持つ(フィンランド語 minä、ハンガリー語 én ― ハンガリー語は m を失ったが、フィンランド語は保持している)一方で、「you」にしばしば ts を用いる(フィンランド語 sinä、ハンガリー語 te)。多くのアルタイ/テュルク諸語もこれに従う。たとえばトルコ語では「I」は ben(歴史的には men)、「you」は sen である。シベリアやコーカサスの一部の言語も同様だ。世界言語地図(WALS)は、一人称における m が「ほぼ全ユーラシア的」であることを見出した9。ヨーロッパから北アジア全域にかけて広く分布し、東南アジアの一部を除けばほぼ普遍的である。二人称の t もこの地域で非常に一般的であり、「I = m, you = t」というパラダイムは、近縁関係のない多くの語族に見られる9。ヨハンナ・ニコルズのような言語学者は、この m–T 帯が歴史的な 「大シルクロード」 地域 ― 古代の移動と接触が起こった広大な範囲 ― とおおよそ重なることを指摘している9。ここにはインド・ヨーロッパ語族、ウラル語族、アルタイ諸語、カルトヴェリ語族などが含まれる。これは古い Eurasiatic マクロ語族の手がかりかもしれない。すなわち、これら多様な言語は、氷期ユーラシアで話されていた(おそらく 1万2千~1万5千年前の)祖語から派生し、その祖語が m- と t- の代名詞を用いていた可能性がある6。そうであれば、m–T パターンは継承によるものだ。あるいは、これは 地域的特徴 かもしれない。代名詞音が先史時代の言語接触を通じて、他の文化的交流とともに広まった可能性もある。いずれにせよ、これは偶然ではない。ニコルズが指摘するように、このパターンの分布は地理的に一貫しており、普遍的な幼児語などでは説明できない ― 何らかの歴史的原因が必要なのである9

  • (太平洋側)アメリカ大陸における n–m パターン: 北米と南米の大部分、とくに太平洋岸からアマゾンにかけての広い地域では、別の代名詞パラダイムが見られる。すなわち 一人称 n-二人称 m- である。これは二人称に関してユーラシアのパターンを逆転させたものだ。言語学者はこれを 「n-m パターン」 と呼ぶ。たとえばペルーの多くのパノ諸語では、「I」は noo、「you」は moa である。アメリカ南西部からメキシコにかけてのユト・アステカ語族では、典型的な代名詞接頭辞が「I」に ni-、「you」に mi- である言語もあれば、「I」に ni-、「you」に ti- を用いる言語もある(ナワトル語は「I」に ni-、「you」に ti- を用い、これは実際には n–t だが、その近縁言語ホピ語は nuu vs mum を持つ)。チマクアン語族や他の太平洋岸北西部の言語でも類似のパターンが見られる。20 世紀初頭、アルフレッド・トロンベッティ(1905)やエドワード・サピア(1910 年代)のような言語学者は、この広範な n 対 m の区別に注目し、すべてのアメリカ・インディアン諸語が最終的には互いに関係している 可能性を示唆した10。ジョゼフ・グリーンバーグは、論争の的となった Amerind 仮説においてこの n/m 代名詞パターンを重要な証拠として用いた。彼は、(イヌイットとナ・デネ語族を除く)アメリカ大陸には一つのマクロ語族(「Amerind」)が存在し、その祖語が「I」に n、「you」に m を用い、このパターンが遠く離れた多数の子孫語族に残っていると主張した10。彼の主な論拠は概ね次のようなものだった。「これほど多くのアメリカ諸語が n/m 代名詞を共有しているのは偶然とは考えにくく、多くの集団は互いにほとんど接触していなかったため借用も考えにくい。したがって、共通祖先からの継承が最もよい説明である」。批判者たちは、このパターンはアメリカ大陸全体で普遍的というわけではなく、西部では強いが東部では弱いか欠如していること、そしてこれは大規模な 地域的拡散 や単なる偶然の類似にすぎない可能性があると反論した109。結局のところ、数十の語族と、m, n, t, k など限られた数の代名詞音がある以上、ある程度の重なりは必然である。今日の専門家のコンセンサスは、グリーンバーグの Amerind 語族は 証明されておらず、おそらく誤った仮説 であるというものだ。それでも、n–m 代名詞帯は依然として魅力的な現象である。少なくとも地域的なスケールでは、代名詞が古い関係を保持していることを示唆している。たとえば、太平洋岸北西部のいくつかの語族が、共有する代名詞に部分的に示されるように、より大きなグループを形成している可能性があると考える研究者もいる。最低限でも、これは古い 接触 を示唆している。おそらくアメリカ大陸の最初の人々は共通の代名詞慣習を共有しており、それが多様化の過程で広がったり残存したりしたのかもしれない。

これら 2 つの世界的パターンを視覚化するために、言語の世界地図を思い浮かべてみよう。旧世界(ヨーロッパ、北部/中央アジア)には、「me」/「I」を表す語がしばしば m を持ち、「you」がしばしば t を持つ広い帯が見えるだろう。そして 新世界 では、とくにアラスカからアンデスにかけての太平洋岸沿いに、多くの言語が「I」に n、「you」に m を用いる。オーストラリアやニューギニアのような他の地域は、どちらのパターンにも特に従っていない(オーストラリアには「I」に m を用いる言語がまったくないことは注目に値する9)。アフリカは前述のように、「I」に m を用いる言語が(とくに南部と西部で)多いが、「you」に m を用いる言語は散発的である9。これらのパターンは地理的にあまりに集中しているため、純粋な偶然や普遍的な好みだけでは説明しにくい。歴史 ― すなわち深い系統的つながりか、古い拡散圏 ― が原因であるように見える。

言語が似た代名詞を持つに至る仮想的なシナリオを 2 つ考えてみると、この違いがより明確になる。

  • 共通継承(系統): はるか昔、一つの祖語が特定の音形の代名詞(たとえば「I」 = mi、「you」 = ti)を持っていた。その言語が娘言語に分かれ、さらに枝分かれしていく。各娘言語は代名詞を(音変化を多少伴いつつ)保持する。何千年も後になって、私たちは一つの語族 ― さらには語族の語族 ― を目にすることになるが、その中で「I」と「you」は依然として miti に似ている。この関係は、ラテン語がフランス語、スペイン語、イタリア語などに分かれ、それらすべてが「me」を表す語に m 音を保持している(フランス語 moi、スペイン語 me、イタリア語 mi)のと同じである。この類似は 共通祖先 によるものであり、言語は祖母の代名詞を保持したいとこのような「いとこ同士」なのである。これを簡単な系統樹で示すと次のようになる。

Proto-language tree diagram

(図: 祖語が A と B に分岐し、両者が一人称代名詞 “mi” の形を保持している。)

  • 地域的拡散(借用または収斂): もともとは無関係(あるいは非常に遠い関係)にあった2つの言語が、たまたま地理的に隣り合っている場合がある。何世紀にもわたる交易、通婚、二言語使用などを通じて、一方の言語が他方から代名詞を借用したり、互いに影響し合って似た音の代名詞を採用するようになったりすることがある。たとえば、仮に言語Xはもともと「私」に ga を使い、言語Yは「私」に na を使っていたとする。しかしどちらか一方が優勢であったり権威ある言語であったりしたために、最終的には両方とも一人称に na を使うようになった、というようなことが起こりうる。これは珍しい(繰り返すが、代名詞が借用されることはまれだが、強度の接触状況やクレオール形成では起こりうる)。もう一つの可能性は、偶然の保持である。つまり、XとYがそれぞれ非常に遠い昔(別系統)に「私」を表す m を継承しており、その後たまたま再び出会った、というような場合である。いずれにせよ、その類似は接触または偶然によるものであり、最近の共通起源によるものではない。借用を図示すると、次のようになるだろう:

Areal borrowing diagram

(図:もともと異なっていた言語XとYが接触によって収斂し、両方とも一人称に na を用いるようになる。)

現実には、これらのシナリオを区別するのは極めて難しい。言語学者は1語や2語だけに頼るのではなく、遺伝的な関係を立証するために、数十の基本語彙項目にわたる体系的な音対応を探す。代名詞だけではマクロファミリーを証明できないが、強力な示唆を与えることはできる。代名詞を道標のようなものだと考えるとよい。もし離れた諸言語に同じ奇妙なパターンが繰り返し現れるなら、それはさらに調査すべき方向を指し示している。

ユーラシア語族(Eurasiatic)(インド・ヨーロッパ語族、ウラル語族、アルタイ諸語などを含む仮説上の語族)の場合、代名詞の証拠(m–T パターン)は、グリーンバーグやイリチ=スヴィチのノストラティック仮説のような提案を後押しした要因の一つであった。実際、詳細な集計によれば、インド・ヨーロッパ語族では「私/私を」に対応する m と「あなた」に対応する t という音が、ほとんど失われることなく残存している。インド・ヨーロッパ系のおよそ500の言語・方言を対象としたある調査では、一・二人称に m-t- をもつ祖語形が、その98%以上で保持されていたことが判明した1。このような強靭さは、単なる偶然ではないことを示唆する――これらの音が系統の中に深く埋め込まれていたのである。ウラル諸語も同様に、「私/私を」に m- を用いる(原ウラル語は一人称に *me または *mi をもっていた)。したがって、インド・ヨーロッパ語族とウラル語族がこの特徴を共有しているなら、両語族が遠い親類である可能性を補強する、と主張する言語学者もいる(完全に無関係な二つの語族が、偶然にも同一の代名詞パラダイムをもち、かつ他にも多くの対応候補を共有するとは考えにくいためである)。

**アメリンド(Amerind)**の構想においては、n–m パターンが証拠の要となっていたが、残念ながら他の証拠はそれほど堅固ではなく、時間的な深さ(最初のアメリカ先住民からおそらく1万3千年以上)があまりに大きいため、確認が難しい。多くの言語学者は単一のアメリンド語族を認めてはいないが、中間的なグルーピングについての研究は現在も続いている。代名詞は依然として重要な役割を果たしており、たとえば遠縁の関係が提案されているいくつかのアメリカ先住民語族では、類似した代名詞接辞が見られ、それがそうした提案に重みを与えている。

要点をまとめると、代名詞や、疑問詞what/qui/que など)、指示詞this/that など)のような文法的な「機能語」は、一般語彙よりもはるかに長く残存することがある。これらは言語における化石のようなものであり、太古の移動や接触の痕跡を保存している。古生物学者が小さな化石によって地層の年代を測るように、言語学者も、なかなか消えない「私」を表す小さな m から、失われた祖語を垣間見ることができる。

継承か拡散か:適切なバランスを見つける#

では、こうした深層の代名詞類似は、一つの巨大な世界語族の証拠なのだろうか。それとも、異なる場所にいる人類が似た解決策を思いついた結果(そして多少の借用もあったかもしれない)にすぎないのだろうか。正直なところ、答えはまだはっきりしておらず、現在も議論が続いている問題である。ただし、**言語系統(linguistic phylogeny)地域的拡散(areal diffusion)**を簡単に区別しておくと、この問題をよりよく理解できる。

  • 言語系統(linguistic phylogeny)とは、言語の家系図のようなものである。二つの言語が系統的な関係にあるとは、一方が他方から派生したか、あるいは両者が共通の祖先から派生したことを意味する。たとえば、スペイン語とイタリア語はラテン語から生じたため、系統的な関係にある。両者は多くの継承語彙を共有している(「母」を表す madremadre、「二」を表す dosdue など)。厳密な系統シナリオでは、言語間の類似は継承によるものであり、規則的な音変化を経て世代を超えて受け継がれてきたものとされる。

  • 地域的拡散(areal diffusion)とは、言語が接触を通じて互いに影響し合うことを意味する。日本語と現代英語のように無関係な言語であっても、共存していれば、一方が他方から語彙や文法的特徴を借用することがある。たとえば、英語はフランス語から数百語もの語彙(table, government など)を借用しているが、これは英語とフランス語が最近の共通祖先をもつからではない(両者の共通祖先はインド・ヨーロッパ語族のはるか昔であり、これらの語が存在する以前である)。ノルマン・フランス語話者がイングランドを支配し、両言語が混じり合ったためである。地域的拡散では、類似は借用、収斂、あるいは言語圏(Sprachbund)における並行発達によって生じる。

通常、多くの基本語にわたって体系的なパターンが見られる場合、第一の容疑者は系統関係である。借用は通常、代名詞や小さい数詞のような中核語彙ではなく、技術用語や文化的項目のような非中核語彙に影響するからである。だからこそ、代名詞の証拠は深層の関係を論じる際に重視される――それは借用によって生じにくい種類のデータだからである。たとえば、言語Aと言語Bがともに「私」に mana、「あなた」に wena という代名詞をもち、しかも両者が強い接触をもっていないことがわかっているなら、言語学者はAとBが共通の祖語にさかのぼり、そこに *mana/*wena が存在したのではないかと仮説を立てるだろう。さらに、mother, two, eye, name のような他の安定語彙にも対応が見つかれば、その語族仮説の構築が始まる。

しかし、極めて古い比較では慎重でなければならない。およそ5,000~7,000年も経てば、規則的な音変化によって語の起源は完全に覆い隠されうる。たとえば、中国語(標準中国語)で「私」を表す は、“I” や “me” や “yo” とは全く似ていないし、実際、中国語はインド・ヨーロッパ語族とは無関係である。しかし興味深いことに、中国語の (上古漢語では *ŋaʔ または *nga と再建される)を、チベット語の nga のような代名詞、さらにはインド・ヨーロッパ祖語の *egō と比較し、マクロファミリーを提案する者もいる。こうした連関は非常に投機的であり、これほど長い時間が経てば、実在しないパターンを見てしまう危険が大きい。

また、いくつかの類似は、単一の「プロト・ワールド(Proto-World)」母語ではなく、古代の移住の波や接触にさかのぼる可能性も考慮すべきである。たとえば、5万年以上前にアフリカを出た最初の現生人類が、すでに「私」を表す ma のような語をもっており、今日のすべての言語がその語の変形を反映している、という可能性である。これはプロト・ワールド仮説(すべての言語が究極的には一つの起源を共有する)に相当する。しかし別の見方もある。人類が拡散する過程で、話し手を示すのに m 音を用いるといった、いくつかの「もっともらしい」革新が独立に生じたり、容易に広まったりしたのかもしれない、という見方である。マクロファミリー論者の中にはメリット・ルーレンのように、世界中に見られる代名詞パターン(および tik「指/一」を表す語のようなもの)が単一起源を示すと主張する者もいる4。しかし、現在の証拠では多くの言語学者はこれを説得的とはみなしていない。より保守的な立場は、言語は複数の系統で出現し、ときおり基本語を交換したり、偶然に共有したりしたと考えることである。

たとえばアフリカでは、ニジェール・コンゴ語族とナイル・サハラ語族が真の兄弟関係にある可能性がある(「ニジェール・サハラ語族」を提案する者もいる)。もしそれが立証されれば、代名詞の類似は確かに継承によるものとなる。あるいは、両者はもともと別系統だったが、1万年以上前のサヘル地帯での早期接触によって相互に影響し合い、一方の集団が代名詞を借用したり、代名詞の音形に影響を与えたりした(非常に長期的な接触効果)可能性もある。これに似た現象はバルカン半島でも見られ、無関係な言語(アルバニア語、ルーマニア語、ブルガリア語など)が、何世紀にもわたって隣接していた結果、特定の文法特徴を共有するようになった。代名詞はこれに巻き込まれにくいが、不可能ではない。

一部の研究者が用いる巧妙なアプローチに、統計的類型論(statistical typology)がある。これは「m 対 n」といった質的な観察にとどまらず、大規模な言語データベースを収集し、代名詞特徴の共起が偶然を超えるかどうかを検定する手法である。ニコルズは m–T パターンと n–m パターンについてこれを行い、それらがそれぞれの地域で有意に集中していることを示した9。つまり、ランダムに散らばっているわけではなく、何らかの歴史的出来事があったことを示している。そして、そのクラスターが提案されているマクロファミリー(m–T についてはユーラシア語族、n–m については仮説上の「アメリンド」グループ)とかなりよく対応しているため、解釈は純粋な拡散よりも深層の遺伝的シグナルの方向へと傾く。

結局のところ、慎重な立場はこうである。代名詞は深層の関係を示唆するが、それだけで決定的な証拠にはならない。代名詞は診断的マーカーとして価値がある。二つの言語が非常に似た代名詞体系をもっているなら、他の中核語彙も一致するかどうかを調べるべきである。たとえば、インド・ヨーロッパ語族とウラル語族は m-/t- 代名詞を共有するだけでなく、(IE mater = mother, PU *mata = father など)いくつかの基本語彙や構造的特徴にも類似が見られるため、ノストラティック仮説について長年にわたり議論が続いている4。これに対し、「私」に m を用いるという一点だけを共有し、それ以外には何の共通点もない言語同士は、単に同じ解決策に独立に到達しただけだと考えるのが妥当だろう。

誰もが一致して認めているのは、代名詞や小さな機能語が、ほとんどの語彙よりも変化が遅いという点である16。それらは、絶えず変化する言語の海における錨のような役割を果たす。このため、英語の I, we, two, three, who といった語が、約6,000年前に話されていたインド・ヨーロッパ祖語から直接継承されている、という面白い事実が成り立つ。形は多少変化したが、認識不能なほどではない(サンスクリットの aham = I, dvé = two, trí = three, kʷo = who と比較せよ)。これらの語の一部はさらに遡る可能性さえある。2013年に提案された「超保存語(ultraconserved words)」のリストには、Iyou だけでなく、mother, not, what, man のような語も含まれていた6。もしこれが正しければ、1万5千年前の部族と出会ったとしても、彼らの言葉のいくつかをかすかに聞き取れるかもしれない。なぜなら、あなたが今日使っている語が、そのときすでに存在していた語の進化形だからである。これは驚くべき考え方であり、言語が氷期にまでさかのぼる連続した鎖であることを示唆している。

結論#

代名詞は見過ごされがちである。短く、多くは1音節にすぎず、私たちはほとんど意識せずに使っている。しかし見てきたように、これらの小さな語は、言語史に関して重い含意をもっている。mama, me, mi といった語が大陸を越えて響き合っているのは偶然ではなく、一つの手がかりである。それが最終的に単一の世界語族を証明するのか、あるいは単に太古の交通路を描き出すにとどまるのかは別として、ささやかな代名詞は先史を解き明かす鍵なのである。

このレベルの言語探偵仕事は困難であり、しばしば論争を呼ぶ。私たちは、わずかな音の一致から至るところに遺伝的関係を見てしまう性急さと、あらゆる類似を偶然として退けてしまう過度の懐疑との間をうまく航行しなければならない。代名詞、数詞、その他の超安定語は、系統樹の境界をさらに過去へ押し広げるための、わずかながらも貴重な手がかりを与えてくれる。それらは生き残りであり、現代語の中に響く祖先の声のささやきである。

次にあなたが “I” と口にするとき、それが本当に時を超えた何かを発しているのかもしれない、と考えてみてほしい。ある意味で、I はどこでも同じことを意味しており、そして長いあいだ同じことを意味し続けてきた。その連続性は、計り知れない世代を経て舌から舌へと受け渡されてきたものであり、人間の言語の驚異の一つである。それは、世界中のバベルのごとき諸言語にもかかわらず、子どものころに誰もが学ぶ最も単純な語の中に、諸言語を結びつける統一の糸が存在することをほのめかしている。その糸こそ、言語学者がこれからも、語から語へ、代名詞から代名詞へとたどり続け、私たちの言語――そして私たち自身――がどこから来たのかを、より深く理解しようとするための手がかりなのである。

FAQ#

Q 1. 共有された代名詞は、世界語族の証拠になりますか。
A. いいえ。それらは示唆的な手がかりではありますが、数百の規則的な同根語セットと音法則がなければ、遺伝的な連関を確立することはできません。

Q 2. なぜ代名詞はそれほど借用されにくいのですか。
A. 代名詞は文法とアイデンティティに深く織り込まれており、それを置き換えることは文の中核的な統語構造を乱すからです。そのため、強度の接触があっても、代名詞が入れ替わることはまれです。

Q 3. 代名詞パターンの類似を生み出しうる他の要因は何ですか。
A. 古代の地域的拡散圏や、普遍的な音声的傾向が、共通祖先なしに収斂的な形態を生み出すことがあります。


出典#



  1. Bancel, Pierre J. & de l’Etang, Alain M. (2010). “Where do personal pronouns come from?” Journal of Language Relationship 3: 127–152. The authors note the stunning preservation of 1st/2nd person pronouns in language families, calling them “hard rocks…resisting erosion long after most other ancestral words have been swept away.” They cite Dolgopolsky (1964) finding 1sg and 2sg pronouns to be among the longest-lasting meanings, and Pagel (2000) estimating a half-life of ~166,000 years for the 1sg pronoun. They also observe that in Indo-European, the m- and t- initial pronoun stems have survived in over 98% of languages, reflecting 8,000+ years of continuity. Pronouns likely emerged only with complex syntax (~100k years ago), which may explain why the same few pronoun stems recur globally. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. Greenberg, Joseph H. (1987). Language in the Americas. (As summarized in a review: Pronouns are notably stable, and “there are few if any authenticated cases of the borrowing of a first- or second-person pronoun.” Greenberg used this stability as a premise in proposing deep genetic links among American languages.) ↩︎ ↩︎ ↩︎

  3. Example African pronouns for click-language isolates (Hadza, Sandawe) and Khoe family: Hadza independent pronouns include tiʔe “I” and baʔe “you” (data from Sands 1998, via personal communication) – showing a nasal/plosive vs labial distinction similar to neighboring Bantu languages. Sandawe has ŋú “I” and “you” (according to older sources), again ŋ (nasal) vs b (labial). Proto-Khoe pronouns reconstructed by Vossen (1997) include *mi “I” and *ma “you” for one branch, and *ti “I”, *di “you” for another – a bit inconsistent, but suggestive overlaps with Sandawe8. These examples illustrate how even areally distant languages can end up with analogous pronoun forms. Whether due to ancient inheritance or diffusion, it strengthens the impression of a continent-wide pattern (nasal 1st, labial 2nd) as discussed in the main text. (Sources: Sands, Bonny. Eastern and Southern African Khoisan, 1998; Vossen, Rainer. The Khoisan Languages, 1997.) ↩︎ ↩︎ ↩︎

  4. Greenberg, Joseph (1963). The Languages of Africa. In this influential work, Greenberg classified African languages into four families and coined “Khoisan” for the click languages. Modern research, as summarized by Güldemann (2014), has shown that “Khoisan” is not a valid genetic group – it’s a cover term for at least three independent families plus isolates. The shared clicks are an areal feature, not proof of common origin. This is a cautionary tale: languages can share distinctive traits (like clicks or pronouns) without being closely related. For our discussion, we treat Khoisan languages separately (Khoe, Tuu, Kx’a, Hadza, Sandawe). Interestingly, Greenberg’s African classification did not unite Niger-Congo with Nilo-Saharan or others – he treated them as separate. Some later linguists have speculated about deeper connections (e.g. linking Nilo-Saharan and Niger-Congo), but these remain hypothetical. Pronoun resemblances are part of that speculative evidence. Essentially, African macrofamily theories are still unproven, though pronoun patterns provide intriguing data points. ↩︎ ↩︎ ↩︎ ↩︎

  5. Güldemann, Tom (2018). The Languages and Linguistics of Africa – Proto-Niger-Congo pronouns. According to reconstructions cited by Güldemann, Proto-Niger-Congo (the ancestral language of the vast Niger-Congo phylum) had first and second person pronouns both starting with m. Specifically, 1sg is given as mV́ (with a front vowel) and 2sg as mV́ (with a back vowel). This means many modern Niger-Congo languages preserved the m- for “I” (e.g. mí- or mɛ́-) and also an m- or related labial for “you” (though often differentiated by the vowel or tone). Babaev (2013) provides a detailed survey supporting these reconstructions. Such stability points to inheritance from the proto-language. (Note: some branches later shifted the 2sg to w or b, which are still labial consonants.) ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  6. Pagel, Mark; Atkinson, Q. D.; Calude, A. S.; Meade, A. (2013). “Ultraconserved words point to deep language ancestry across Eurasia.” PNAS 110(21): 8471–8476. This study found that a set of common words – especially pronouns, numerals, and adverbs – have significantly slower replacement rates, with estimated “half-lives” of 10,000–20,000 years. By comparing proto-word reconstructions in seven Eurasian families, the authors identified 23 meaning items with potential cognates in four or more families – far above random expectation. These ultraconserved words included I, you, we, who, what, man, not, two, five, bark, ashes, etc. Pronouns were strongly over-represented in this set. The team’s phylogenetic modeling yielded an estimated age of around ~15,000 years for a common ancestor (“Eurasiatic”), consistent with the end of the Ice Age. They argue that high-frequency usage lends these words great stability, allowing traces of deep kinship to be detectable beyond the normal 5–8,000 year limit of the comparative method. Many historical linguists are skeptical of these conclusions (see footnote 7), but the paper provides quantitative support for the idea that pronouns and other core words can preserve deep phylogenetic signals↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  7. Wikipedia: “Eurasiatic languages.” Eurasiatic is a proposed macrofamily including Indo-European, Uralic-Yukaghir, Altaic (Turkic, Mongolic, Tungusic, sometimes Koreanic and Japonic), Chukchi-Kamchatkan, Eskimo-Aleut, and perhaps others. Greenberg and others in the 1990s suggested that these families share a common origin. One piece of evidence has been similarities in pronoun paradigms and basic vocabulary. In 2013, Pagel et al. claimed statistical support for Eurasiatic, dating it to ~15k years BP. However, the concept is widely rejected by specialists. The Wikipedia page notes that the idea of an Eurasiatic superfamily is controversial and not generally accepted. This reflects the broader situation with macrofamilies: proposals like Eurasiatic or Nostratic are intriguing (and often use pronoun evidence), but remain unproven in the eyes of mainstream historical linguistics. ↩︎ ↩︎ ↩︎

  8. Güldemann, Tom & Elderkin, Edward (2010). Discussion in “Khoisan linguistic classification today” (in Brenzinger & König eds., 2014) on pronoun similarities between Khoe and Sandawe. Table 8 in the source compares Proto-Khoe-Kwadi pronouns with Sandawe pronouns and finds affinities that could indicate a remote relationship. For example, Proto-Khoe first person may be reconstructed as *mi, second person *u, etc., and Sandawe has similar forms (e.g. *ti for “I”, *ba for “you” in some contexts). The authors call this evidence “promising though not conclusive” for a deep link. This suggests that even Africa’s click languages (once lumped as “Khoisan”) show pronoun resemblances across supposed family boundaries. It’s a hint that some of these isolates might share ancient ancestry or long-term contact influence. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  9. Nichols, Johanna (2013). WALS Online – Chapter 137: “N–M Pronouns” (and Chapter 136: “M–T Pronouns”). Nichols maps two big areal clusters of pronoun paradigms: an m–T cluster in northern Eurasia and an n–m cluster in the Americas. She notes m in 1st person is “nearly pan-Eurasian” (ubiquitous across the Greater Silk Road area) and also common in Africa, while m in 2nd person is essentially absent in Eurasia but frequent along the Pacific Rim of the Americas. Crucially, these distributions are not worldwide universals but geographically constrained, suggesting historical (genealogical or contact) causes rather than innate tendencies. Nichols discusses that neither sound symbolism (children learning nasals first) nor pure chance can explain the clustered patterns – instead, deep historical origin is implied. She also points out that while pronoun resemblances hint at deep lineages, on their own they are insufficient proof; the languages in each area belong to multiple families, so additional evidence is needed to demonstrate common descent. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  10. Wikipedia: “Amerind languages.” Greenberg’s Amerind hypothesis (1987) proposed that most Indigenous languages of the Americas belong to one macrofamily. A key piece of evidence was a widespread first person n-, second person m- pronoun pattern across many American languages. This pattern was first noted by Alfredo Trombetti in 1905, and Sapir found it “suggestive” of a common origin. However, the pattern isn’t universal (mainly in North and Meso-America), and the Amerind grouping is not accepted by most linguists. ↩︎ ↩︎ ↩︎