TL;DR
- Местоимения стареют благородно. Формы 1‑го и 2‑го лица часто сохраняются >10 тыс. лет и почти не заимствуются.
- Африка: широко распространённый тип носовое-я / губное-ты скорее отражает древнюю диффузию, чем одну макросемью.
- Евразия vs Америки: в Евразии наблюдается пояс m- / t-; в тихоокеанских районах Америк — n- / m-. Оба кластера слишком географически цельные, чтобы быть случайностью.
- Ультраконсервативная лексика даёт заманчивые намёки на глубокое родство, но сама по себе не может доказать существование глобального протоязыка.
Введение#
Путешествуя по миру, вы можете заметить любопытный узор: во многих языках слово «я» или «меня» звучит удивительно похоже — часто начинается с m или n. Например, me в английском, moi во французском, emi в йоруба, mina в зулу. Это просто совпадение или же подсказка, что языки, разделённые огромными расстояниями, имеют глубокую историческую связь? Лингвисты давно заметили, что местоимения (слова вроде я, ты, мы) и другие «маленькие» слова в словаре часто остаются неизменными на протяжении тысячелетий1. На самом деле эти слова закрытого класса — местоимения, малые числительные, базовые наречия — невероятно консервативны. Они сопротивляются изменениям «как твёрдые скалы посреди равнины, которые остаются после того, как большую часть других слов смыло эрозией»1. В отличие от броских существительных и глаголов, которые легко заменяются или заимствуются у соседей, базовые местоимения и числительные, как правило, не заимствуются вовсе2. Это делает их золотой жилой филогенетических сигналов — подсказок о древнем языковом родстве, которые могут сохраняться даже тогда, когда языки разошлись настолько, что их сходство уже трудно распознать.
В этой статье мы рассмотрим, как местоимения и небольшая группа ультраустойчивых слов намекают на скрытые связи между языками мира. Мы сосредоточимся на интригующем случае: языках Тропической Африки, включая крупные семьи афразийскую, нигеро-конголезскую, нило-сахарскую и так называемые «койсанские» языки с щёлкающими согласными (на деле это несколько изолятов)3. Эти языки не доказаны как родственные в каком-либо общепринятом смысле — напротив, крупные «макросемейные» объединения в Африке остаются гипотетическими и спорными4. Тем не менее, в их местоименных системах бросаются в глаза поразительные сходства — например, использование носового звука для «я» и часто губного (губного согласного) для «ты». Мы также отдалимся до глобального масштаба: почему в евразийских языках — от французского до хинди — так часто встречается пара m/t для я/ты, тогда как во многих коренных языках Америки — n/m для я/ты? Являются ли эти узоры результатом древнего наследования (общего происхождения) или это ареальная диффузия (языки «натираются» друг о друга)? Мы разберём эти понятия простым языком и увидим, почему некоторые лингвисты считают, что местоимения и другие служебные слова могут восходить к глубокой доистории — возможно, десяткам тысяч лет — даже если мы пока не можем (ещё) реконструировать полное семейное древо для всех человеческих языков.
(Прежде чем продолжить, короткое замечание о «макросемьях»: этот термин обозначает гипотетические сверхсемьи, объединяющие несколько уже установленных языковых семей. Примеры — предложенные Джозефом Гринбергом Amerind (для Америки) и Eurasiatic (связывающая индоевропейские, уральские и др.). Большинство таких гипотез не доказаны и оспариваются4, но они дают контекст для обсуждения ультраконсервативной лексики.)
Местоимения: крошечные слова с большой историей#
Местоимения малы, но за ними стоит большая история. Каждый раз, когда вы говорите «я» или «ты», вы, возможно, используете слово, которое уходит корнями во времена, намного более древние, чем письменная история. Исследования показывают, что личные местоимения 1‑го и 2‑го лица («я» и «ты») относятся к числу самых устойчивых слов в базовом словаре любого языка1. В 1960‑е годы лингвист Моррис Сводеш и другие начали сравнивать списки базовой лексики в разных языках, чтобы оценить скорость замены слов. Они обнаружили, что такие слова, как I и you, имеют тенденцию сохраняться. В одном исследовании было оценено, что местоимение 1‑го лица ед. числа имеет «период полураспада» около 166 000 лет — то есть потребуется столько времени, чтобы половина дочерних ветвей языка его заменила1! (Это число — экстраполяция и не должно пониматься буквально, но оно подчёркивает исключительную долговечность местоимений.) Другой исследователь, Сергей Долгопольский, обнаружил, что I и you занимают соответственно 1‑е и 3‑е места среди самых долгоживущих значений в сравнительных анализах1.
Почему местоимения сохраняются, тогда как другие слова исчезают? Одна из причин в том, что они используются постоянно — мы произносим их сотни раз в день, и это, по‑видимому, «прививает» им устойчивость к изменениям5. Другая причина — языки почти никогда не заимствуют чужие местоимения2. Носитель испанского может заимствовать английское weekend, носитель японского — английское computer, но никто не заимствует чужое слово для я или ты. Как отмечал лингвист Джозеф Гринберг, «существует мало, если вообще существуют, достоверно засвидетельствованных случаев заимствования местоимений первого или второго лица»2. Эти маленькие слова тесно вплетены в грамматику и идентичность; они неохотно заменяются внешними влияниями. Это делает их надёжными указателями генеалогии языка.
Современные вычислительные исследования подтвердили, насколько ультраконсервативными могут быть некоторые базовые слова. В статистическом анализе 2013 года Марк Пейджел с коллегами рассмотрели реконструкции из семи крупных семей (включая индоевропейскую, уральскую, алтайскую, дравидийскую и др.) и выделили около 23 слов, у которых, по‑видимому, есть когнаты в четырёх и более из этих семей — намного больше, чем можно было бы ожидать случайно6. Среди этих ультраустойчивых слов были местоимения (я, ты, мы), числительные (один, два, три) и наречия вроде not и who6. Исследователи утверждают, что такие слова могли сохраняться с близкими звучанием и значением на протяжении, возможно, 15 000 лет и более, охватывая конец последнего ледникового периода. Это утверждение спорно (о скепсисе мы поговорим чуть позже), но оно завораживает: оно предполагает глубокую языковую линию, в которой I действительно может «значить одно и то же повсюду» — потому что многие современные языки унаследовали его из одного и того же древнего источника. В своей статье команда Пейджела даже выдвигает предположение, что предки современных евразийских языков могут восходить к языку, на котором говорили около 15 000 лет назад, во время отступления ледников6.
Разумеется, убеждены не все. Реконструировать лексику на такую глубину чрезвычайно трудно — языки меняются настолько, что слова 10 000+‑летней давности становятся неузнаваемыми в современных потомках. Критики указывают, что легко обмануться случайными сходствами. Как метко заметила лингвист Салли Томасон, поиск набора похожих по звучанию слов в линиях, уходящих «слишком далеко для сравнительного метода», подобен тому, как если бы вы видели лица в огне7 — можно убедить себя, что там есть осмысленный узор, но это могут быть просто случайные всполохи. Томасон проанализировала данные Пейджела и соавторов и нашла ряд методологических проблем (например, в наборе данных допускалось несколько возможных протослов, и авторам приходилось субъективно выбирать, какие из них сравнивать)7. Она и многие исторические лингвисты остаются скептичными относительно того, что с помощью одних только ультраустойчивых слов можно доказать существование глобальной языковой семьи7. Однако даже скептики признают здесь зерно истины: определённые типы слов в среднем действительно меняются гораздо медленнее. И местоимения — на первом месте среди них.
Подводя итог, можно сказать, что местоимения — это своего рода языковые реликвии, которые с поразительной точностью передаются через бесчисленные поколения говорящих. Они служат отпечатками пальцев языкового родства: если два языка имеют очень похожие местоимения, это сильный намёк (хотя и не доказательство), что они унаследовали их от общего предка. Теперь посмотрим, как это проявляется в одном регионе мира — в Тропической Африке.
Африканский пример: носовое я, губное ты?#
Тропическая Африка — это мозаика языков, принадлежащих к нескольким крупным семьям («филам»), которые, насколько может доказать мейнстримная наука, имеют разные истоки. Среди них афразийская (напр. хауса, амхарский, сомали), нигеро-конголезская (напр. суахили, йоруба, зулу, волоф), нило-сахарская (напр. луо, масаи, канури) и так называемые койсанские группы — языки юга Африки со щёлкающими согласными, такие как !Xóõ, сандаве и хадза, которые являются изолятами или малыми семьями, а не одной единицей3. На первый взгляд, у этих языков очень разная лексика и грамматика. Предложение на хауса мало похоже на предложение на зулу, а слово с щёлкающими согласными в !Xóõ совершенно не похоже ни на что в амхарском. Поэтому попытки связать эти семьи в единую «африканскую суперсемью» остаются в лучшем случае спекулятивными. И всё же, если мы приблизим взгляд к местоимениям (и нескольким другим базовым словам), начинают проступать общие нити, пересекающие африканские линии.
Один заметный узор состоит в том, что во многих африканских языках для слова «я» используются носовые согласные (типа m, n, ŋ), а для слова «ты» (ед. число) часто — губной согласный (звук, образуемый губами, вроде m, b или w). Посмотрим на несколько примеров:
| Язык | Семья | «Я» (1‑е лицо ед. ч.) | «Ты» (2‑е лицо ед. ч.) |
|---|---|---|---|
| суахили (Танзания) | нигеро-конголезская (банту) | mími (я)5 (также как префикс ni-) | wéwe (ты) |
| зулу (ЮАР) | нигеро-конголезская (банту) | mina (я) | wena (ты) |
| йоруба (Нигерия) | нигеро-конголезская (йорубоидная) | èmi (я) | ìwọ (ты) (произносится с w) |
| акан (Гана) | нигеро-конголезская (ква) | me (я) | wo (ты) |
| хауса (Нигерия) | афразийская (чадская) | ni (я, энклитическое местоимение) | káĩ (ты, муж.) / kī (ты, жен.) |
| амхарский (Эфиопия) | афразийская (семитская) | ənē (እኔ, я) | anta (አንተ, ты, муж.) / anchi (ты, жен.) |
| луо (Кения) | нило-сахарская (нилотская) | aná (я) | ín (ты) |
| хадза (Танзания) | изолят («койсанский») | tiʔe (я) 8 | baʔe (ты) 8 (приблизительные формы) |
(Произношения даны приблизительно; различия по тону и долготе гласных опущены для простоты.)
Если посмотреть на эти данные, заметна тенденция: формы 1‑го лица часто содержат m или n. В нигеро-конголезских языках, таких как суахили, зулу, йоруба и акан, слово «я» начинается на m- (суахили mimi, зулу mina, акан me). Хауса (афразийская семья) использует n- (ni), и луо тоже (ana с n в середине). Даже амхарский, относящийся к семитской ветви афразийской семьи, имеет ənē, которое начинается с краткого гласного, но оканчивается на -n (и, что любопытно, более древняя форма в геэз была ʾaná — с n). Теперь сравните формы 2‑го лица: йоруба iwọ и зулу wena используют w (губной аппроксимант) для «ты». Аканское wo — тот же согласный. Суахили wewe — двойное w. Хауса ka сюда не вписывается (там k), но во многих других чадских языках, родственных хауса, местоимение 2‑го лица действительно имеет b или w. Хадза, языковой изолят, известный своими щёлкающими согласными, использует baʔe для «ты» (с начальным b)8. Таким образом, в неродственных африканских языках мы часто видим такую пару: «я» с носовым (m/n) и «ты» с губным (m/b/w). Лингвисты отмечали это как возможный глубинный след — возможно, все эти языки сохранили определённые местоименные звуки от очень древнего протоязыка, или же они повлияли друг на друга через контакт в глубокой древности.
Нужно, однако, подчеркнуть, что не все африканские языки идеально следуют этому узору — есть вариации. В амхарском «ты» — anta (с t), что соответствует семитскому афразийскому типу t для 2‑го лица. В некоторых нило-сахарских языках, таких как канури, местоимения сильно отличаются (канури «я» — ŋaye, «ты» — nyin — оба носовые, без губного). Но повторяющееся m ~ n для я настолько широко распространено, что это бросается в глаза. Для нигеро-конголезской семьи даже реконструировано, что прото-нигеро-конголезский язык (гипотетический предок всей семьи) имел местоимение 1‑го лица ед. числа вида mV… (m + гласный) и 2‑го лица mV… тоже, но с другим гласным5. В одной авторитетной реконструкции лингвиста Тома Гюльдеманна для прото-нигеро-конголезского 1sg даётся *mì/ (m + передний гласный), а 2sg — *mù/ (m + задний гласный)5. Это означает, что сотни нигеро-конголезских языков, вероятно, унаследовали своё «я = m-» из этого общего источника. Довольно поразительно думать, что когда говорящий на зулу произносит mina, говорящий на фула — mi, а говорящий на акан — me, все они отражают местоимение, которым пользовались в Африке тысячи лет назад — задолго до земледелия, железа и каких‑либо известных нам цивилизаций.
А как насчёт «щёлкающих» языков (койсанских)? Эти языки когда‑то были объединены Гринбергом в одну группу, но сегодня лингвисты считают, что существует как минимум три отдельные семьи (Khoe-Kwadi, Tuu и Kx’a) плюс несколько изолятов (хадза, сандаве), которые просто все имеют щёлкающие согласные3. Любые сходства между ними могут объясняться контактом или общими тенденциями. Однако и здесь местоимения дают заманчивые намёки на связь. Например, для прото-khoe (семья, включающая нама/дамара в Намибии) реконструируются местоимения вроде *mi для «я» и *ni для «ты» (или наоборот), и исследователи отмечали, что в сандаве (языковой изолят в Танзании) есть очень похожие местоименные формы8. В одном исследовании были показаны структурные параллели между местоименной системой прото-khoe и местоимениями сандаве, что позволяет предположить, что они могут быть отдалённо родственными8. Это не является убедительным доказательством — далеко нет, — но это именно тот тип подсказки, который мы ожидали бы увидеть, если бы все эти африканские линии, в глубине, происходили от общего источника: осколки древней местоименной парадигмы, сохранившиеся в разных уголках континента.
Так означают ли эти общие африканские местоимения, что нигеро-конголезская, нило-сахарская, афразийская и койсанские семьи — члены одной большой «африконской» языковой семьи? Большинство лингвистов ответили бы: не спешите. Возможно, часть этих сходств объясняется случаем (существует не так много простых звуков вроде m, n, w, которые можно использовать). Некоторые могут быть результатом ареальной диффузии — длительного взаимовлияния языков в зонах контакта. Например, в Западной Африке нигеро-конголезские и афразийские (чадские) языки сосуществуют тысячелетиями; возможно, ареальное предпочтение m- для первого лица распространилось между ними. Однако местоимения менее склонны к заимствованию, чем другие части языка, так что диффузия — непростое объяснение. Другая возможность — что эти базовые местоименные звуки в некотором смысле «естественны»: то есть, может быть, у людей есть врождённая склонность использовать звук [m] для обозначения себя (младенцы рано говорят мама и т. п.). Некоторые выдвигали гипотезы о звукосимволизме или лёгкости артикуляции: [m] и [n] — одни из самых простых для младенцев согласных, так что неудивительно, что они появляются в фундаментальных словах вроде местоимений во многих языках9. Но нам нужно объяснить не один язык, а целые региональные узоры. Как мы увидим в следующем разделе, эти местоименные паттерны географически кластеризованы, а не универсальны. Это намекает на то, что в деле замешана история, а не только человеческая биология. Лингвисты, склонные к признанию дальнего родства, сказали бы, что самое простое объяснение — наследование: языки разделяют эти местоимения, потому что в конечном счёте происходят от одного и того же древнего языка, в котором эти местоимения изначально существовали9.
Прежде чем покинуть Африку, стоит отметить, что местоимения — не единственный путь к глубоким связям. Другие элементы закрытого класса тоже демонстрируют устойчивость: например, базовые числительные. В нигеро-конголезских языках слово для «два» часто звучит как ba, ɓa или va (для прото-нигеро-конголезского реконструируется *ba-di для «2»). Слово для «три» часто имеет вид ta-t_ (например, йоруба tààtà «три» и прото-NC *tat)5. В афразийской семье слово для «один» знаменито своей похожестью в разных ветвях (напр. араб. waḥid, ивр. _ אחד_ eḥád, хауса (чадская ветвь) daya — на слух не слишком похожи, но афразийские корни можно проследить). Эти малые числительные склонны сопротивляться замене, потому что счёт — базовая функция; вы не так просто меняете «один, два, три». Фактически, «два» и «пять» фигурировали в некоторых ранних списках ультраконсервативных слов в Евразии. (Любопытно, что в исследовании Пейджела 2013 года числительные не попали в итоговый набор из 23 ультраконсервативных слов6, но это может объясняться сложностями данных — числительные всё равно в целом очень консервативны внутри семей, как видно хотя бы по индоевропейским two, duo, dvi, bi- — все они отражают один и тот же древний корень.)
Африканский пример даёт нам представление о головоломке: языки без общепризнанной генеалогической связи всё же разделяют крошечные базовые слова. Теперь отойдём на шаг и посмотрим на глобальную картину местоименных узоров, а затем перейдём к большому вопросу: наследование или диффузия?
Глобальные местоименные узоры: совпадение или древнее родство?#
Наши африканские примеры показали один региональный узор (носовое «я», губное «ты»). Оказывается, лингвисты выделили как минимум два крупных межъязыковых местоименных паттерна в глобальном масштабе, каждый из которых охватывает множество языковых семей на обширной территории. Они были замечены ещё более века назад и с тех пор подробно картированы9. Это:
Паттерн m–T в Евразии. Языки по всей Европе и Азии часто имеют местоимение 1‑го лица с m (или другим носовым, вроде n) и местоимение 2‑го лица с t (или другим корональным звуком, вроде s). Назовём это «местоименным поясом M–T». Классический пример: в латинском ego означало «я», но косвенная форма me («меня») имела m-, а tu означало «ты» с t-. Индоевропейские языки это сохранили: исп. me, tú; рус. меня, ты; хинди mujhe («меня»), tū («ты»); англ. me / you (у you сейчас нет t, но в древнеанглийском было þū с межзубным согласным, а след t мы видим, например, во французском tu и производных; впрочем, английский здесь немного выбивается). За пределами индоевропейской семьи уральские языки тоже имеют m для «я» (фин. minä, венг. én — венгерский m утратил, но финский сохранил) и часто t или s для «ты» (фин. sinä, венг. te). Многие алтайские/тюркские языки следуют тому же: напр. тур. ben («я», исторически men) и sen («ты»). Подобные системы встречаются и в ряде сибирских и кавказских языков. Всемирный атлас языковых структур (WALS) показал, что m в 1‑м лице «почти паневразийско» распространено9 — оно повсеместно от Европы до северной Азии, за исключением некоторых карманов в Юго‑Восточной Азии. А t во 2‑м лице также очень часто встречается в этой зоне (парадигма «я = m, ты = t» наблюдается во множестве семей, не находящихся в близком родстве9). Лингвисты, такие как Йоханна Николс, отмечали, что этот пояс m–T примерно совпадает с исторической зоной «Большого Шёлкового пути» — огромным пространством, где происходили древние миграции и контакты9. Он включает индоевропейские, уральские, алтайские, картвельские и другие языки. Это может быть подсказкой в пользу древней евразиатской макросемьи: возможно, все эти разнородные языки происходят от протоязыка (на котором говорили, скажем, 12–15 000 лет назад в ледниковой Евразии), где использовались местоимения с m- и t-6. В таком случае паттерн m–T был бы наследованием. Альтернативно, это может быть ареальная черта: возможно, местоименные звуки распространились через языковой контакт в доисторические времена вместе с другими культурными элементами. В любом случае это не случайность. Как отмечает Николс, распределение этого паттерна географически цельно и не объясняется универсальным «детским лепетом» или чем‑то подобным — у него должна быть историческая причина9.
Паттерн n–m в (тихоокеанских районах) Америки. Во многих коренных языках Северной и Южной Америки, особенно вдоль тихоокеанского побережья и в Амазонии, мы находим другую местоименную парадигму: 1‑е лицо n-, 2‑е лицо m-. Это по сути обратное евразийскому распределение для 2‑го лица. Лингвисты называют это «паттерном n–m». Например, во многих пануанских языках Перу «я» — noo, а «ты» — moa. В семье юто-ацтекских языков (юго‑запад США и Мексика) классические местоименные префиксы — ni- для «я» и mi- для «ты» в некоторых языках, или ni- и ti- в других (в науатле ni- для «я» и ti- для «ты», то есть n–t, но родственный хопи имеет nuu vs mum). В чимакуанских и других языках тихоокеанского северо‑запада наблюдаются похожие узоры. Ещё в начале XX века лингвисты Альфред Тромбетти (1905) и Эдвард Сапир (1910‑е) заметили это широко распространённое противопоставление n и m и предположили, что все индейские языки Америки в конечном счёте могут быть родственными10. Джозеф Гринберг использовал это в своей спорной гипотезе Amerind, рассматривая паттерн n/m в местоимениях как ключевое доказательство. Он утверждал, что в Америке (за исключением эскимосско-алеутских и на-дене языков) существует одна макросемья («Amerind»), протоязык которой использовал n для я и m для ты, и что этот узор сохранился во множестве удалённых друг от друга дочерних семей10. Основной аргумент был примерно таков: маловероятно, что столь многие американские языки разделяют местоимения n/m случайно; заимствование можно исключить (большинство этих групп мало контактировали); следовательно, наследование от общего предка — лучшее объяснение. Критики возразили, что паттерн не является по‑настоящему универсальным в Америке — он силён на западе, но слаб или отсутствует в восточной части континента, — и что мы можем иметь дело с крупной ареальной диффузией или даже случайными совпадениями109. В конце концов, при десятках семей и небольшом наборе возможных местоименных звуков (m, n, t, k и т. д.) некоторая степень совпадения неизбежна. Консенсус специалистов сегодня таков, что макросемья Amerind Гринберга не доказана и, вероятно, ошибочна. Тем не менее, местоименный пояс n–m остаётся интригующим феноменом. Он предполагает, что по крайней мере в региональном масштабе местоимения действительно сохранили более древние связи — возможно, объединяя семьи в промежуточные макрогруппы (например, некоторые исследователи считают, что несколько семей тихоокеанского северо‑запада могут образовывать более крупное объединение, отчасти на основании общих местоимений). Как минимум, он намекает на древние контакты: возможно, первые народы Америки разделяли общую местоименную конвенцию, которая затем распространилась или сохранилась по мере их диверсификации.
Чтобы визуализировать эти два глобальных паттерна, представьте карту языков мира. Вы увидите широкий пояс Старого Света (Европа, северная/центральная Азия), где слова типа «me»/«я» часто имеют m, а «ты» — часто t. Затем в Новом Свете, особенно вдоль тихоокеанского побережья от Аляски до Анд, многие языки показывают n для «я» и m для «ты». Другие регионы, такие как Австралия и Новая Гвинея, не следуют ни одному из этих узоров (в Австралии, в частности, вообще нет m для «я»9). Африка, как мы видели, демонстрирует множество m для «я» (особенно на юге и западе), но не так много m для «ты», за исключением отдельных случаев9. Эти узоры настолько географически сфокусированы, что трудно приписать их чистой случайности или универсальным предпочтениям. История здесь, по‑видимому, играет ключевую роль — будь то глубокие генеалогические связи или древние зоны диффузии.
Чтобы чётко различить возможные объяснения, рассмотрим две гипотетические ситуации, в которых языки могут прийти к похожим местоимениям:
- Общее наследование (филогения). Давным-давно один протоязык имел местоимения, звучавшие определённым образом (скажем, «я» = mi, «ты» = ti). Этот язык распадается на дочерние, которые затем дробятся дальше, как ветви дерева. Каждая дочерняя ветвь сохраняет местоимения (возможно, с небольшими звуковыми изменениями). Тысячи лет спустя у нас есть целая семья языков — и даже семьи семей, — в которых «я» и «ты» всё ещё напоминают mi и ti. Это похоже на то, как латинский распался на французский, испанский, итальянский и др., и во всех них в словах для «меня» сохранился звук m (фр. moi, исп. me, ит. mi). Сходство объясняется общим происхождением — языки являются «кузенами», сохранившими бабушкины местоимения. Это можно изобразить в виде простого древа:
(Диаграмма: протоязык распадается на A и B; оба сохраняют форму «mi» для местоимения 1‑го лица.)
- Ареальная диффузия (заимствование или конвергенция): Два языка, которые изначально не были родственны (или были очень дальними родственниками), оказываются соседями. За столетия торговли, смешанных браков или двуязычия один язык может заимствовать местоимение у другого, или они могут повлиять друг на друга так, что оба примут похожее по звучанию местоимение. Например, предположим, что язык X изначально использовал «ga» для «я», а язык Y — «na» для «я». Но один из них был доминирующим или престижным, и в итоге оба стали говорить «na» для первого лица. Это необычно (снова: местоимения редко заимствуются, но это возможно при интенсивном языковом контакте или при формировании креольских языков). Другая возможность — случайное сохранение: возможно, X и Y оба унаследовали m для «я» из очень далёкого прошлого (из разных линий), а затем случайно «встретились» снова. В любом случае, сходство объясняется контактом или совпадением, а не недавним общим происхождением. Заимствование можно визуализировать так:
(Диаграмма: языки X и Y, изначально разные, сходятся так, что оба в итоге получают «na» для «я» через контакт.)
На практике различить эти сценарии чрезвычайно сложно. Лингвисты опираются не на одно-два слова — они ищут систематические звуковые соответствия в десятках единиц базовой лексики, чтобы установить генетическое родство. Одни только местоимения не могут доказать макросемью; но они могут дать сильную подсказку. Можно думать о них как о ориентирах: если вы видите один и тот же странный паттерн, повторяющийся в отдалённых языках, это указывает направление для дальнейшего исследования.
В случае евразиатской (гипотетической семьи, включающей индоевропейские, уральские, алтайские и др.) местоименные данные (m–T) были одним из факторов, вдохновивших такие предложения, как ностратическая гипотеза Гринберга и Иллич-Свитыча. Действительно, детальные подсчёты показывают, что в индоевропейских языках звуки m (для «я/меня») и t (для «ты») сохранились с минимальными потерями. Одно исследование почти 500 индоевропейских языков и диалектов показало, что праформы с m- и t- для первого и второго лица сохранились в более чем 98% из них1! Такая устойчивость предполагает, что это не случайность — эти звуки были глубоко укоренены в линии. Уральские языки аналогично используют m- для «я/меня» (в прауральском было *me или *mi для 1-го лица). Поэтому, если индоевропейские и уральские языки разделяют этот признак, некоторые лингвисты считают, что это усиливает аргумент о возможном далёком родстве этих семей (так как маловероятно, чтобы две совершенно неродственные семьи случайно имели идентичные парадигмы местоимений и столь много других предполагаемых соответствий).
Для идеи америндской макросемьи паттерн n–m был краеугольным камнем доказательств, но, к сожалению, другие данные были менее надёжными, а колоссальная глубина времени (возможно, более 13 000 лет с момента первых заселений Америки) затрудняет подтверждение. Хотя большинство лингвистов не признают единую семью «Америнд», продолжаются исследования промежуточных группировок. Местоимения продолжают играть роль — например, для некоторых семей коренных языков Америки, для которых предлагаются дальние связи, обнаруживаются сходные местоименные аффиксы, что придаёт вес таким гипотезам.
Вывод: местоимения и подобные грамматические «служебные слова» (такие как вопросительные слова what/qui/que, указательные this/that и т. п.) иногда могут сохраняться гораздо дольше, чем обычные слова. Они становятся своего рода ископаемыми в языке, сохраняя следы древних миграций и контактов. Подобно тому как палеонтолог может датировать слои породы по маленькому ископаемому, лингвист иногда может уловить черты утраченного праязыка по этому маленькому m для «меня», которое отказывается исчезать.
Наследование vs диффузия: поиск правильного баланса#
Так являются ли эти глубокие сходства в местоимениях признаком одной большой глобальной языковой семьи? Или это просто результат того, что люди в разных местах приходят к похожим решениям (и, возможно, немного заимствуют друг у друга)? Честный ответ: мы не до конца уверены — это предмет продолжающихся дискуссий. Но мы можем лучше понять проблему, прояснив в простых терминах различие между языковой филогенией и ареальной диффузией:
Языковая филогения — это просто родословное древо языков. Если два языка находятся в филогенетическом отношении, это значит, что один произошёл от другого или оба произошли от общего предка. Например, испанский и итальянский филогенетически связаны, потому что оба происходят от латыни. Они разделяют множество унаследованных слов (madre и madre для «мать», dos и due для «два» и т. д.). В строго филогенетическом сценарии сходства между языками объясняются наследованием — передачей через поколения с регулярными звуковыми изменениями.
Ареальная диффузия означает, что языки влияют друг на друга через контакт. Они могут быть неродственными (как японский и английский сегодня), но если они сосуществуют, один может заимствовать слова или даже грамматические черты у другого. Например, английский заимствовал сотни слов из французского (такие как table, government) — не потому, что английский и французский имеют недавнего общего предка (нет; их общий предок — глубоко в индоевропейской семье, задолго до появления этих слов), а потому, что носители нормандского французского правили Англией, и языки смешивались. При ареальной диффузии сходства объясняются заимствованием, конвергенцией или параллельным развитием в языковом союзе (Sprachbund).
Обычно, когда мы видим систематический паттерн во многих базовых словах, первым подозреваемым является филогения. Заимствование обычно затрагивает некорневую лексику (термины технологий, культурные реалии), а не базовые местоимения или малые числительные. Поэтому местоименные данные воспринимаются всерьёз при обсуждении глубоких родств — это именно тот тип данных, который менее вероятно объяснить заимствованием. Например, если язык A и язык B оба имеют местоимение «mana» для «я» и «wena» для «ты», и мы знаем, что у них не было интенсивного контакта, лингвист выдвинет гипотезу, что A и B восходят к общему праязыку, где существовали *mana/*wena. Если удаётся найти больше корреляций (в других устойчивых словах, таких как мать, два, глаз, имя и т. д.), начинают выстраивать аргументацию в пользу языковой семьи.
Однако в чрезвычайно древних сопоставлениях нужно быть осторожными. За ~5 000–7 000 лет регулярные звуковые изменения могут полностью скрыть происхождение слова. Слово для «я» в мандаринском китайском — wǒ, которое совсем не похоже на «I» или «me» или «yo» — и действительно, китайский не родствен индоевропейским языкам. Но любопытно, что некоторые сравнивали китайское wǒ (древнекитайское *ŋaʔ или *nga) с местоимениями вроде тибетского nga и даже с индоевропейским *egō (через предполагаемую макросемью). Это весьма спекулятивные связи; по прошествии стольких лет легко увидеть паттерны, которые могут быть нереальными.
Нужно также учитывать, что некоторые сходства могут восходить не к одному «праязыку мира», а к волнам древних миграций и контактов. Например, возможно, что у первых современных людей, вышедших из Африки более 50 000 лет назад, уже было слово типа ma для «я» — и все современные языки отражают это исходное слово в модифицированном виде. Это была бы гипотеза праязыка мира (Proto-World) — все языки в конечном счёте родственны. Но есть и другой взгляд: возможно, по мере расселения людей возникло несколько «здравых» по смыслу инноваций (например, использование звука m для обозначения говорящего, который мог возникать независимо или легко распространяться). Некоторые сторонники макросемей, такие как Мерритт Рулен, утверждали, что глобальные местоименные паттерны (и слова типа tik для «палец/один* по всему миру) указывают на единое происхождение4. Большинство лингвистов считают это неубедительным при нынешних данных. Более консервативно предположить, что языки могли возникать в нескольких линиях и изредка обмениваться или случайно разделять базовые термины.
В Африке, например, возможно, что нигер-конго и нило-сахарские языки действительно являются «сиблингами» (некоторые предлагали семью «нигер-сахарская»). Если бы это было доказано, местоименные сходства действительно были бы наследованием. Или же они могли быть изначально разными, но ранний контакт (более 10 000 лет назад) в зоне Сахеля привёл к взаимному влиянию — возможно, одна группа заимствовала местоимения или просто повлияла на звуковой облик местоимений (очень медленный эффект контакта). Мы видим нечто подобное на Балканах, где неродственные языки (албанский, румынский, болгарский) пришли к общим грамматическим чертам, будучи соседями веками. Местоимения менее склонны к такому влиянию, но это не невозможно.
Один из изящных подходов, который используют некоторые исследователи, — статистическая типология: вместо того чтобы просто качественно отмечать «m против n», они собирают большие базы данных языков и проверяют, превышает ли совместная встречаемость местоименных признаков уровень случайности. Николс сделала это для паттернов m–T и n–m и обнаружила, что они значимо сконцентрированы в соответствующих ареалах9. Иными словами, это не случайное рассеяние — произошло нечто историческое. И поскольку эти кластеры довольно хорошо соответствуют предлагаемым макросемьям (евразиатской для m–T и гипотетической «америндской» для n–m), это склоняет интерпретацию в сторону глубокого генетического сигнала, а не чистой диффузии.
В конечном счёте разумная позиция такова: местоимения намекают на глубокие родства, но сами по себе не дают окончательного доказательства. Они ценны как диагностические маркеры. Если два языка имеют очень похожие системы местоимений, нужно проверить, совпадают ли и другие элементы базовой лексики. Например, индоевропейские и уральские языки не только имеют местоимения с m-/t-; у них есть и некоторые похожие базовые слова (ИЕ mater = мать, ПУ *mata = отец и т. п.) и структурные черты, что породило давние спекуляции о ностратике4. Напротив, языки, которые просто случайно разделяют m для «я», но больше ничем не похожи, скорее всего, просто независимо пришли к одному и тому же решению.
Все согласны в одном: местоимения и небольшие служебные слова меняются медленнее, чем большая часть лексики16. Они действуют как якоря в вечно меняющемся море языка. Поэтому возможны такие любопытные факты, как то, что английские слова I, we, two, three, who непосредственно унаследованы от праиндоевропейских слов, произносившихся, возможно, 6 000 лет назад, — их формы немного изменились, но не до неузнаваемости (ср. санскр. aham = я, dvé = два, trí = три, kʷo = кто). Некоторые из них могут восходить ещё дальше: список «ультраконсервативных» слов, предложенный в 2013 году, включал не только I и you, но и слова вроде mother, not, what, man6. Если эти исследователи правы, это означает, что если бы вы встретили племя 15 000 лет назад, вы могли бы смутно узнать несколько их слов, потому что сегодня используете эволюционировавшие формы тех же самых! Это поразительная мысль — язык как непрерывная цепь, тянущаяся в Ледниковый период.
Заключение#
Местоимения легко недооценить — они короткие, часто состоят из одного слога, и мы используем их, не задумываясь. Но, как мы видели, эти маленькие слова несут серьёзные импликации для истории языков. Тот факт, что mama, me и mi отзываются эхом на разных континентах, не является случайностью; это подсказка. Приведёт ли она в итоге к доказательству единой глобальной языковой семьи или лишь очертит древние линии коммуникации — скромное местоимение остаётся ключом к разгадке доистории.
Лингвистическое расследование на такой глубине сложно и часто спорно. Нужно лавировать между чрезмерной готовностью (видеть генетические связи повсюду на основании пары звуков) и чрезмерным скепсисом (списывать любое сходство на случайность. Местоимения, числительные и другие ультраустойчивые слова дают нам шанс продвинуть границы языкового древа дальше в прошлое. Они — выжившие, шёпот речи наших предков в современных словах.
Так что в следующий раз, когда вы говорите «я», подумайте, что, возможно, вы произносите нечто по-настоящему вне-временное. В некотором смысле I и правда значит одно и то же везде — и значит одно и то же уже очень давно. Эта преемственность, передаваемая от языка к языку через немыслимое число поколений, — одно из чудес человеческого языка. Она намекает, что, несмотря на вавилонское многоязычие мира, существуют нити единства, соединяющие их, — нити, заключённые в самых простых словах, которые мы все учим в детстве. Эти нити — подсказки, за которыми лингвисты будут продолжать следовать, слово за словом, местоимение за местоимением, к более глубокому пониманию того, откуда происходят наши языки — и мы сами.
FAQ#
В 1. Являются ли общие местоимения доказательством глобальной языковой семьи?
О. Нет. Это наводящие подсказки, но без сотен регулярных наборов когнатов и звуковых законов они не могут установить генетическую связь.
В 2. Почему местоимения так редко заимствуются?
О. Потому что они вплетены в грамматику и идентичность; их замена нарушила бы ядро синтаксиса, поэтому даже интенсивный контакт редко приводит к их обмену.
В 3. Что ещё может создавать похожие местоименные паттерны?
О. Древние зоны ареальной диффузии и универсальные фонетические тенденции могут приводить к конвергентным формам без общего происхождения.
Источники#
Bancel, Pierre J. & de l’Etang, Alain M. (2010). “Where do personal pronouns come from?” Journal of Language Relationship 3: 127–152. The authors note the stunning preservation of 1st/2nd person pronouns in language families, calling them “hard rocks…resisting erosion long after most other ancestral words have been swept away.” They cite Dolgopolsky (1964) finding 1sg and 2sg pronouns to be among the longest-lasting meanings, and Pagel (2000) estimating a half-life of ~166,000 years for the 1sg pronoun. They also observe that in Indo-European, the m- and t- initial pronoun stems have survived in over 98% of languages, reflecting 8,000+ years of continuity. Pronouns likely emerged only with complex syntax (~100k years ago), which may explain why the same few pronoun stems recur globally. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Greenberg, Joseph H. (1987). Language in the Americas. (As summarized in a review: Pronouns are notably stable, and “there are few if any authenticated cases of the borrowing of a first- or second-person pronoun.” Greenberg used this stability as a premise in proposing deep genetic links among American languages.) ↩︎ ↩︎ ↩︎
Example African pronouns for click-language isolates (Hadza, Sandawe) and Khoe family: Hadza independent pronouns include tiʔe “I” and baʔe “you” (data from Sands 1998, via personal communication) – showing a nasal/plosive vs labial distinction similar to neighboring Bantu languages. Sandawe has ŋú “I” and bé “you” (according to older sources), again ŋ (nasal) vs b (labial). Proto-Khoe pronouns reconstructed by Vossen (1997) include *mi “I” and *ma “you” for one branch, and *ti “I”, *di “you” for another – a bit inconsistent, but suggestive overlaps with Sandawe8. These examples illustrate how even areally distant languages can end up with analogous pronoun forms. Whether due to ancient inheritance or diffusion, it strengthens the impression of a continent-wide pattern (nasal 1st, labial 2nd) as discussed in the main text. (Sources: Sands, Bonny. Eastern and Southern African Khoisan, 1998; Vossen, Rainer. The Khoisan Languages, 1997.) ↩︎ ↩︎ ↩︎
Greenberg, Joseph (1963). The Languages of Africa. In this influential work, Greenberg classified African languages into four families and coined “Khoisan” for the click languages. Modern research, as summarized by Güldemann (2014), has shown that “Khoisan” is not a valid genetic group – it’s a cover term for at least three independent families plus isolates. The shared clicks are an areal feature, not proof of common origin. This is a cautionary tale: languages can share distinctive traits (like clicks or pronouns) without being closely related. For our discussion, we treat Khoisan languages separately (Khoe, Tuu, Kx’a, Hadza, Sandawe). Interestingly, Greenberg’s African classification did not unite Niger-Congo with Nilo-Saharan or others – he treated them as separate. Some later linguists have speculated about deeper connections (e.g. linking Nilo-Saharan and Niger-Congo), but these remain hypothetical. Pronoun resemblances are part of that speculative evidence. Essentially, African macrofamily theories are still unproven, though pronoun patterns provide intriguing data points. ↩︎ ↩︎ ↩︎ ↩︎
Güldemann, Tom (2018). The Languages and Linguistics of Africa – Proto-Niger-Congo pronouns. According to reconstructions cited by Güldemann, Proto-Niger-Congo (the ancestral language of the vast Niger-Congo phylum) had first and second person pronouns both starting with m. Specifically, 1sg is given as mV́ (with a front vowel) and 2sg as mV́ (with a back vowel). This means many modern Niger-Congo languages preserved the m- for “I” (e.g. mí- or mɛ́-) and also an m- or related labial for “you” (though often differentiated by the vowel or tone). Babaev (2013) provides a detailed survey supporting these reconstructions. Such stability points to inheritance from the proto-language. (Note: some branches later shifted the 2sg to w or b, which are still labial consonants.) ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Pagel, Mark; Atkinson, Q. D.; Calude, A. S.; Meade, A. (2013). “Ultraconserved words point to deep language ancestry across Eurasia.” PNAS 110(21): 8471–8476. This study found that a set of common words – especially pronouns, numerals, and adverbs – have significantly slower replacement rates, with estimated “half-lives” of 10,000–20,000 years. By comparing proto-word reconstructions in seven Eurasian families, the authors identified 23 meaning items with potential cognates in four or more families – far above random expectation. These ultraconserved words included I, you, we, who, what, man, not, two, five, bark, ashes, etc. Pronouns were strongly over-represented in this set. The team’s phylogenetic modeling yielded an estimated age of around ~15,000 years for a common ancestor (“Eurasiatic”), consistent with the end of the Ice Age. They argue that high-frequency usage lends these words great stability, allowing traces of deep kinship to be detectable beyond the normal 5–8,000 year limit of the comparative method. Many historical linguists are skeptical of these conclusions (see footnote 7), but the paper provides quantitative support for the idea that pronouns and other core words can preserve deep phylogenetic signals. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Wikipedia: “Eurasiatic languages.” Eurasiatic is a proposed macrofamily including Indo-European, Uralic-Yukaghir, Altaic (Turkic, Mongolic, Tungusic, sometimes Koreanic and Japonic), Chukchi-Kamchatkan, Eskimo-Aleut, and perhaps others. Greenberg and others in the 1990s suggested that these families share a common origin. One piece of evidence has been similarities in pronoun paradigms and basic vocabulary. In 2013, Pagel et al. claimed statistical support for Eurasiatic, dating it to ~15k years BP. However, the concept is widely rejected by specialists. The Wikipedia page notes that the idea of an Eurasiatic superfamily is controversial and not generally accepted. This reflects the broader situation with macrofamilies: proposals like Eurasiatic or Nostratic are intriguing (and often use pronoun evidence), but remain unproven in the eyes of mainstream historical linguistics. ↩︎ ↩︎ ↩︎
Güldemann, Tom & Elderkin, Edward (2010). Discussion in “Khoisan linguistic classification today” (in Brenzinger & König eds., 2014) on pronoun similarities between Khoe and Sandawe. Table 8 in the source compares Proto-Khoe-Kwadi pronouns with Sandawe pronouns and finds affinities that could indicate a remote relationship. For example, Proto-Khoe first person may be reconstructed as *mi, second person *u, etc., and Sandawe has similar forms (e.g. *ti for “I”, *ba for “you” in some contexts). The authors call this evidence “promising though not conclusive” for a deep link. This suggests that even Africa’s click languages (once lumped as “Khoisan”) show pronoun resemblances across supposed family boundaries. It’s a hint that some of these isolates might share ancient ancestry or long-term contact influence. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Nichols, Johanna (2013). WALS Online – Chapter 137: “N–M Pronouns” (and Chapter 136: “M–T Pronouns”). Nichols maps two big areal clusters of pronoun paradigms: an m–T cluster in northern Eurasia and an n–m cluster in the Americas. She notes m in 1st person is “nearly pan-Eurasian” (ubiquitous across the Greater Silk Road area) and also common in Africa, while m in 2nd person is essentially absent in Eurasia but frequent along the Pacific Rim of the Americas. Crucially, these distributions are not worldwide universals but geographically constrained, suggesting historical (genealogical or contact) causes rather than innate tendencies. Nichols discusses that neither sound symbolism (children learning nasals first) nor pure chance can explain the clustered patterns – instead, deep historical origin is implied. She also points out that while pronoun resemblances hint at deep lineages, on their own they are insufficient proof; the languages in each area belong to multiple families, so additional evidence is needed to demonstrate common descent. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Wikipedia: “Amerind languages.” Greenberg’s Amerind hypothesis (1987) proposed that most Indigenous languages of the Americas belong to one macrofamily. A key piece of evidence was a widespread first person n-, second person m- pronoun pattern across many American languages. This pattern was first noted by Alfredo Trombetti in 1905, and Sapir found it “suggestive” of a common origin. However, the pattern isn’t universal (mainly in North and Meso-America), and the Amerind grouping is not accepted by most linguists. ↩︎ ↩︎ ↩︎