TL;DR
- Les pronoms vieillissent bien. Les formes de première et de deuxième personne persistent souvent plus de 10 000 ans et sont rarement empruntées.
- Afrique : Le schéma largement répandu nasale-je / labiale-tu reflète vraisemblablement une diffusion ancienne plutôt qu’une seule macro-famille.
- Eurasie vs Amériques : L’Eurasie montre une zone m- / t- ; les Amériques pacifiques, n- / m-. Les deux ensembles sont trop cohérents géographiquement pour être purement fortuits.
- Le vocabulaire ultraconservé offre des indices fascinants de parentés profondes mais, à lui seul, ne peut pas prouver une proto-langue globale.
Introduction#
Si vous parcourez le monde, vous remarquerez peut-être un curieux motif : dans de nombreuses langues, le mot pour « je » ou « moi » sonne remarquablement similaire – commençant souvent par un son m ou n. Par exemple, me en anglais, moi en français, emi en yoruba, mina en zoulou. Est-ce une simple coïncidence, ou bien cela pourrait-il être l’indice que des langues séparées par de vastes distances partagent une connexion historique profonde ? Les linguistes ont depuis longtemps observé que les pronoms (des mots comme je, tu, nous) et d’autres petits mots de notre vocabulaire restent souvent stables sur des millénaires[^1]. En fait, ces mots de classe fermée – pronoms, petits nombres, adverbes de base – sont incroyablement conservateurs. Ils résistent au changement « comme des rochers durs se dressant dans une plaine, résistant à l’érosion longtemps après que la plupart des autres mots ont été emportés »[^1]. Contrairement aux noms ou verbes voyants qui sont remplacés ou empruntés aux voisins, les pronoms et numéraux de base ont tendance à ne pas être empruntés du tout[^2]. Cela en fait des mines d’or de signaux phylogénétiques – des indices d’ascendance linguistique ancienne qui peuvent persister même lorsque les langues ont divergé au point de devenir difficilement reconnaissables.
Dans cet article, nous allons explorer comment les pronoms et une poignée de mots ultra-stables suggèrent des liens cachés entre les langues du monde. Nous nous concentrerons sur un cas intrigant : les langues de l’Afrique subsaharienne, incluant les grandes familles afroasiatique, niger-congo, nilo-saharienne, et les langues à clic dites « khoïsan » (qui sont en réalité plusieurs isolats)[^11]. Ces langues ne sont pas prouvées comme apparentées dans un sens conventionnel – en fait, les groupements de « macro-familles » à grande échelle en Afrique restent spéculatifs et controversés[^10]. Pourtant, elles montrent des similitudes frappantes dans leurs systèmes pronominaux, comme l’usage d’un son nasal pour « je » et souvent d’une labiale (son des lèvres) pour « tu ». Nous élargirons ensuite la perspective à l’échelle globale : pourquoi les langues d’Eurasie, du français au hindi, utilisent-elles souvent m/t pour je/tu, alors que de nombreuses langues amérindiennes utilisent n/m pour je/tu ? Ces motifs résultent-ils d’un héritage ancien (ascendance commune) ou d’une diffusion aréale (des langues qui se « déteignent » les unes sur les autres) ? Nous clarifierons ces concepts en termes simples et verrons pourquoi certains linguistes pensent que les pronoms et autres mots grammaticaux pourraient remonter à la préhistoire profonde – potentiellement des dizaines de milliers d’années – même si nous ne pouvons pas (encore) reconstruire un arbre généalogique complet pour toutes les langues humaines.
(Avant d’entrer dans le vif du sujet, une note rapide sur les « macro-familles » : ce terme désigne des super-familles hypothétiques reliant plusieurs familles linguistiques établies. Des exemples incluent l’Amerind proposé par Joseph Greenberg (pour les Amériques) et l’Eurasiatic (liant indo-européen, ouralien, etc.). La plupart de ces propositions ne sont pas prouvées et sont contestées[^10], mais elles fournissent un contexte pour discuter des mots ultraconservés.)
Pronoms : de petits mots avec une grande histoire#
Les pronoms sont peut-être petits, mais ils portent une grande histoire. Songez qu’à chaque fois que vous dites « je » ou « tu », vous utilisez un mot qui se rattache peut-être à un passé bien antérieur à l’histoire écrite. Des études linguistiques ont montré que les pronoms de première et de deuxième personne (« je » et « tu ») comptent parmi les mots les plus stables du vocabulaire de base d’une langue[^1]. Dans les années 1960, le linguiste Morris Swadesh et d’autres ont commencé à comparer des listes de mots de base à travers les langues pour estimer la vitesse à laquelle les mots sont remplacés. Ils ont découvert que des mots comme je et tu ont tendance à perdurer. Dans une étude, on a estimé que le pronom de première personne du singulier avait une « demi-vie » d’environ 166 000 ans – c’est-à-dire qu’il faudrait ce laps de temps pour que la moitié des lignées filles d’une langue le remplacent[^1] ! (Ce chiffre est une extrapolation et ne doit pas être pris au pied de la lettre, mais il souligne l’extrême longévité des pronoms.) Un autre chercheur, Sergei Dolgopolsky, a trouvé que je et tu occupaient respectivement les 1re et 3e places des significations les plus durables dans ses analyses comparatives[^1].
Pourquoi les pronoms perdurent-ils alors que d’autres mots s’effacent ? Une raison est qu’ils sont utilisés constamment – nous les prononçons des centaines de fois par jour – ce qui semble les immuniser contre le changement[^5]. Une autre est que les langues n’empruntent presque jamais de pronoms étrangers[^2]. Un hispanophone peut emprunter à l’anglais le mot weekend ou un locuteur japonais peut adopter le mot anglais computer, mais personne n’emprunte le mot pour je ou tu. Comme l’a noté le linguiste Joseph Greenberg, « il existe peu, voire aucun cas authentifié d’emprunt d’un pronom de première ou de deuxième personne »[^2]. Ces petits mots sont intimement tissés dans la grammaire et l’identité ; ils ne se laissent pas facilement remplacer par des influences extérieures. Cela en fait des jalons fiables de la généalogie d’une langue.
Les études computationnelles modernes ont renforcé l’idée que certains mots de base sont ultraconservés. Une analyse statistique de 2013 menée par Mark Pagel et ses collègues a examiné des reconstructions issues de sept grandes familles (dont indo-européen, ouralien, altaïque, dravidien, etc.) et identifié environ 23 mots qui semblent avoir des cognats dans au moins quatre de ces familles – bien plus que ce à quoi on s’attendrait par hasard[^8]. Parmi ces mots ultra-stables figuraient des pronoms (je, tu, nous), des nombres (un, deux, trois) et des adverbes comme ne… pas et qui[^8]. Ces chercheurs soutiennent que de tels mots ont été conservés avec des sons et des sens similaires pendant peut-être 15 000 ans ou plus, couvrant la fin de la dernière glaciation. Cette affirmation est controversée (nous aborderons bientôt le scepticisme), mais elle est fascinante : elle suggère une lignée linguistique profonde où je pourrait vraiment « vouloir dire la même chose partout » – parce que de nombreuses langues modernes l’auraient hérité de la même source ancienne. Dans leur article, l’équipe de Pagel avance même que les ancêtres des langues eurasiatiques actuelles pourraient toutes remonter à une langue parlée il y a environ 15 000 ans, au retrait des glaciers[^8].
Tout le monde n’est pas convaincu, bien sûr. Reconstruire un vocabulaire aussi lointain est extrêmement difficile – les langues changent tellement que les mots d’il y a plus de 10 000 ans sont méconnaissables dans leurs descendants modernes. Les critiques soulignent qu’il est facile de se laisser tromper par des ressemblances fortuites. Comme l’a lancé la linguiste Sally Thomason, trouver un ensemble de mots de sonorité similaire à travers des lignées « trop anciennes pour la méthode comparative » revient à voir des visages dans le feu[^9] – on peut se persuader qu’il y a un motif significatif, mais il pourrait ne s’agir que de lueurs aléatoires. Thomason a examiné les données de Pagel et al. et relevé certains problèmes méthodologiques (par exemple, le jeu de données autorisait plusieurs proto-mots possibles et les auteurs devaient choisir subjectivement lesquels comparer)[^9]. Elle et de nombreux linguistes historiques restent sceptiques quant à la possibilité de prouver une famille linguistique globale à partir de ces seuls mots ultra-stables[^9]. Cependant, même les sceptiques reconnaissent un noyau de vérité : certains types de mots changent en moyenne beaucoup plus lentement. Les pronoms en sont le meilleur exemple.
En résumé, les pronoms sont comme des héritages linguistiques – transmis fidèlement à travers d’innombrables générations de locuteurs. Ils servent de empreintes digitales de l’ascendance linguistique : si deux langues partagent des pronoms très similaires, c’est un indice fort (bien que non décisif) qu’elles les ont hérités d’un ancêtre commun. Voyons maintenant de plus près comment cela se manifeste dans une région du monde : l’Afrique subsaharienne.
Une étude de cas africaine : nasale je, labiale tu ?#
L’Afrique subsaharienne est une mosaïque de langues appartenant à plusieurs grandes familles (« phyla ») qui, pour autant que la recherche dominante puisse l’établir, ont des origines distinctes. Celles-ci incluent l’afroasiatique (par ex. haoussa, amharique, somali), le niger-congo (par ex. swahili, yoruba, zoulou, wolof), le nilo-saharien (par ex. luo, massaï, kanouri), et les groupes dits khoïsan – les langues à clic d’Afrique australe comme !Xóõ, sandawe et hadza, qui sont des isolats ou de petites familles plutôt qu’un ensemble unitaire[^11]. En surface, ces langues ont des vocabulaires et des grammaires très différents. Une phrase en haoussa ne ressemble guère à une phrase en zoulou, et un mot !Xóõ avec des clics n’a rien de commun avec quoi que ce soit en amharique. Pour cette raison, les propositions visant à relier ces familles en une grande « super-famille africaine » restent au mieux spéculatives. Pourtant, de manière intrigante, lorsque l’on zoome sur les pronoms (et quelques autres mots de base), on commence à voir des fils conducteurs qui traversent les lignées africaines.
Un motif notable est que de nombreuses langues africaines utilisent des consonnes nasales (comme m, n, ŋ) dans leur mot pour « je », et souvent une consonne labiale (un son produit avec les lèvres, comme m, b ou w) dans leur mot pour « tu » (singulier). Regardons quelques exemples :
| Langue | Famille | « Je » (1re pers. sing.) | « Tu » (2e pers. sing.) |
|---|---|---|---|
| Swahili (Tanzanie) | Niger-congo (bantou) | mími (je)[^5] (aussi comme préfixe ni-) | wéwe (tu) |
| Zoulou (Afrique du Sud) | Niger-congo (bantou) | mina (je) | wena (tu) |
| Yorùbá (Nigeria) | Niger-congo (yoruboïde) | èmi (je) | ìwọ (tu) (prononcé avec w) |
| Akan (Ghana) | Niger-congo (kwa) | me (je) | wo (tu) |
| Haoussa (Nigeria) | Afroasiatique (tchadique) | ni (je, pronom enclitique) | káĩ (tu masc.) / kī (tu fém.) |
| Amharique (Éthiopie) | Afroasiatique (sémitique) | ənē (እኔ, je) | anta (አንተ, tu masc.) / anchi (tu fém.) |
| Luo (Kenya) | Nilo-saharien (nilotique) | aná (je) | ín (tu) |
| Hadza (Tanzanie) | Isolat (« khoïsan ») | tiʔe (je) [^6] | baʔe (tu) [^6] (formes approximatives) |
(Les prononciations sont des transcriptions approximatives ; les différences de ton et de longueur vocalique sont omises pour simplifier.)
En observant ces formes, on remarque une tendance : les formes de 1re personne comportent fréquemment un son m ou n. Dans les langues niger-congo comme le swahili, le zoulou, le yoruba et l’akan, le mot pour « je » commence par m- (swahili mimi, zoulou mina, akan me). Le haoussa (afroasiatique) utilise n- (ni), tout comme le luo (ana avec un n médian). Même l’amharique, dans la branche sémitique de l’afroasiatique, a ənē qui commence par une voyelle brève mais se termine par un son -n (et, fait intéressant, la forme plus ancienne en guèze était ʾaná – contenant un n). Comparez maintenant les formes de 2e personne : le yoruba iwọ et le zoulou wena utilisent w (une semi-voyelle labiale) pour « tu ». L’akan wo a la même consonne. Le swahili wewe est un double w. Le ka du haoussa ne correspond pas (c’est un k), mais dans de nombreuses autres langues tchadiques apparentées au haoussa, le pronom de 2e personne comporte bien un b ou un w. Le hadza, une langue isolée célèbre pour ses clics, utilise baʔe pour « tu » (commençant par b)[^6]. Ainsi, à travers des langues africaines non apparentées, on trouve souvent ce couplage : « je » avec une nasale (m/n), et « tu » avec une labiale (m/b/w). Les linguistes y ont vu une possible signature profonde – peut-être que toutes ces langues ont conservé certains sons pronominaux d’une proto-langue très ancienne, ou peut-être se sont-elles influencées mutuellement par contact dans un passé lointain.
Pour être clair, toutes les langues africaines ne suivent pas parfaitement ce schéma – il existe de la variation. En amharique, « tu » est anta (avec un t), suivant le motif sémitique afroasiatique de t pour la 2e personne. Dans certaines langues nilo-sahariennes comme le kanouri, les pronoms sont assez différents (kanouri « je » est ŋaye, « tu » nyin – tous deux nasaux, sans labiale). Mais la récurrence du m ~ n pour je est suffisamment répandue pour être frappante. Pour le niger-congo, on a même reconstruit que la langue proto-niger-congo (l’ancêtre hypothétique de toute la famille) possédait un pronom de première personne du singulier mV… (m + voyelle) et un pronom de deuxième personne mV… également, mais avec une voyelle différente[^5]. Une reconstruction faisant autorité, proposée par le linguiste Tom Güldemann, donne pour le proto-niger-congo la 1sg *mì/ (m + voyelle antérieure) et la 2sg *mù/ (m + voyelle postérieure)[^5]. Cela signifie que les centaines de langues niger-congo ont vraisemblablement hérité leur « je = m- » de cette source commune. Il est assez étonnant de penser que lorsqu’un locuteur zoulou dit mina, un locuteur peul dit mi et un locuteur akan dit me, ils reflètent tous un pronom utilisé en Afrique il y a des milliers d’années, bien avant l’agriculture, la métallurgie du fer ou toute civilisation connue.
Qu’en est-il des langues à clic (khoïsan) ? Ces langues ont autrefois été regroupées par Greenberg en un seul ensemble, mais aujourd’hui les linguistes estiment qu’il existe au moins trois familles distinctes (khoe-kwadi, tuu et kx’a) plus quelques isolats (hadza, sandawe) qui ont en commun de posséder des clics[^11]. Toute similarité entre elles pourrait être due au contact ou simplement à des tendances partagées. Pourtant, même ici, les pronoms ont fourni des indices alléchants de connexion. Par exemple, on a reconstruit pour le proto-khoe (la famille incluant le nama/damara en Namibie) des pronoms comme *mi pour « je » et *ni pour « tu » (ou l’inverse), et des chercheurs ont noté que le sandawe (un isolat de Tanzanie) possède des formes pronominales très similaires[^6]. Une étude a mis en évidence des parallèles structurels entre les systèmes pronominaux du proto-khoe et ceux du sandawe, suggérant qu’ils pourraient être lointainement apparentés[^6]. Ce n’est pas une preuve concluante – loin de là – mais c’est exactement le type d’indice auquel on s’attendrait si toutes ces lignées africaines, en profondeur, dérivaient d’une source commune : des vestiges d’un ancien paradigme pronominal qui auraient survécu en fragments à travers le continent.
Alors, ces pronoms africains partagés signifient-ils que le niger-congo, le nilo-saharien, l’afroasiatique et le khoïsan appartiennent tous à une grande et joyeuse famille « Africon » ? La plupart des linguistes diraient doucement. Il est possible que certaines de ces similarités soient dues au hasard (il n’y a qu’un nombre limité de sons simples comme m, n, w à répartir, après tout). D’autres pourraient résulter d’une diffusion aréale – des langues en zones de contact s’influençant mutuellement sur de longues périodes. Par exemple, en Afrique de l’Ouest, les langues niger-congo et afroasiatiques (tchadiques) coexistent depuis des millénaires ; peut-être une préférence aréale pour m- pour la première personne s’est-elle diffusée entre elles. Cependant, les pronoms sont moins susceptibles d’être empruntés que d’autres éléments de la langue, de sorte que la diffusion reste une explication délicate ici. Une autre possibilité est que ces sons pronominaux de base soient en un certain sens « naturels » – c’est-à-dire qu’il existe peut-être une tendance innée chez les humains à utiliser un son [m] pour se désigner soi-même (les bébés disent souvent mama très tôt, etc.). Certains ont évoqué le symbolisme sonore ou la facilité d’articulation : [m] et [n] comptent parmi les consonnes les plus faciles pour les nourrissons, il n’est donc peut-être pas surprenant qu’elles apparaissent dans des mots fondamentaux comme les pronoms dans de nombreuses langues[^4]. Mais il faut expliquer non pas une seule langue, mais des motifs entiers à l’échelle régionale. Comme nous le verrons dans la section suivante, ces schémas pronominaux sont regroupés géographiquement, et non universels. Cela laisse penser que l’histoire – et pas seulement la biologie humaine – est en jeu. Les linguistes favorables aux connexions à longue portée soutiendraient que l’explication la plus simple est l’héritage : les langues partagent ces pronoms parce qu’elles descendent en fin de compte de la même langue ancienne où ces pronoms existaient à l’origine[^4].
Avant de quitter l’Afrique, il convient de noter que notre focalisation sur les pronoms n’est pas le seul angle pour envisager des relations profondes. D’autres éléments de classe fermée montrent aussi une grande stabilité : par exemple, les numéraux de base. À travers le niger-congo, le mot pour « deux » est souvent quelque chose comme ba, ɓa ou va (on a reconstruit pour le proto-niger-congo *ba-di pour « 2 »). Le mot pour « trois » est souvent ta-t_ (comme le yoruba tààtà « trois » et le proto-NC *tat)[^5]. En afroasiatique, le mot pour « un » est notoirement similaire à travers les branches (par ex. arabe waḥid, hébreu _ אחד_ eḥád, haoussa (tchadique) daya – pas manifestement similaires en surface, mais les racines afroasiatiques peuvent être retracées). Ces petits numéraux résistent au remplacement parce que compter est une fonction si fondamentale ; on ne remplace pas aisément « un, deux, trois ». En fait, « deux » et « cinq » figuraient dans certaines listes antérieures de mots ultraconservés en Eurasie. (Fait curieux, l’étude de Pagel de 2013 n’a pas retenu les nombres dans son ensemble final de 23 mots ultraconservés[^8], mais cela pourrait tenir à des complexités de données – les nombres restent généralement très conservateurs au sein des familles, comme en témoigne n’importe quelle langue indo-européenne avec two, duo, dvi, bi- reflétant tous la même racine ancienne.)
L’étude de cas africaine donne un aperçu du casse-tête : des langues sans lien généalogique reconnu partagent de minuscules mots de base. Prenons maintenant du recul pour examiner le tableau global des schémas pronominaux, puis abordons la grande question : héritage ou diffusion ?
Schémas pronominaux globaux : coïncidence ou parenté ancienne ?#
Nos exemples africains ont montré un motif régional (nasale « je », labiale « tu »). Il se trouve que les linguistes ont identifié au moins deux grands schémas pronominaux translinguistiques à l’échelle mondiale, chacun couvrant de nombreuses familles linguistiques sur une vaste zone géographique. Ils ont été remarqués pour la première fois il y a plus d’un siècle et ont depuis été cartographiés en détail[^4]. Ce sont :
Le motif m–T en Eurasie : Les langues d’Europe et d’Asie ont fréquemment un pronom de première personne avec m (ou une autre nasale comme n) et un pronom de deuxième personne avec t (ou une autre coronale comme s). J’appellerai cela la « ceinture pronominale M-T ». Exemple classique : en latin, ego signifiait « je » mais la forme oblique me (moi) avait m-, et tu signifiait « tu » avec t-. Les langues indo-européennes ont conservé cela : espagnol me, tú ; russe menya (« me »), ty (« tu ») ; hindi mujhe (« me »), tū (« tu ») ; anglais me / you (you n’a plus t, mais l’anglais ancien avait þū avec un th, et nous disons encore te dans « attire » issu du français tu dans tu es attire – bon, l’anglais est un peu atypique pour « tu »). Au-delà de l’indo-européen, les langues ouraliennes ont aussi m pour « je » (finnois minä, hongrois én – le hongrois a perdu le m, mais le finnois l’a conservé) et souvent t ou s pour « tu » (finnois sinä, hongrois te). De nombreuses langues altaïques/turciques suivent le même schéma : par ex. turc ben (« je », historiquement men) et sen (« tu »). Même certaines langues de Sibérie et du Caucase s’y conforment. L’Atlas mondial des structures linguistiques (WALS) a constaté que m en première personne est « presque pan-eurasien »[^4] – il est omniprésent de l’Europe jusqu’au nord de l’Asie, sauf dans quelques poches d’Asie du Sud-Est. Et la t de deuxième personne est également très fréquente dans cette zone (le paradigme « je = m, tu = t » apparaît dans de nombreuses familles sans parenté étroite[^4]). Des linguistes comme Johanna Nichols ont souligné que cette ceinture m–T coïncide grossièrement avec l’ancienne zone de la « Grande Route de la Soie » – une vaste étendue où se sont produites des migrations et des contacts anciens[^4]. Elle inclut l’indo-européen, l’ouralien, l’altaïque, le kartvélien, et d’autres. Cela pourrait être l’indice d’une macro-famille eurasiatique ancienne : peut-être que ces diverses langues descendent toutes d’une proto-langue (parlée il y a peut-être 12–15 000 ans dans l’Eurasie glaciaire) qui utilisait des pronoms en m- et t-[^8]. Si c’est le cas, le motif m–T relèverait de l’héritage. Alternativement, il pourrait s’agir d’un trait aréal : peut-être que ces sons pronominaux se sont diffusés par contact linguistique à la préhistoire, en même temps que d’autres échanges culturels. Dans tous les cas, ce n’est pas aléatoire. Comme le note Nichols, la distribution de ce motif est géographiquement cohérente et ne s’explique pas par un « babillage » universel ou autre – elle doit avoir une cause historique[^4].
Le motif n–m dans les Amériques (pacifiques) : Dans une grande partie de l’Amérique du Nord et du Sud autochtone, en particulier le long de la côte pacifique et jusque dans l’Amazonie, on trouve un autre paradigme pronominal : première personne n-, deuxième personne m-. C’est en quelque sorte l’inverse du motif eurasien pour la 2e personne. Les linguistes appellent cela le « motif n-m ». Par exemple, dans de nombreuses langues panoanes du Pérou, « je » est noo et « tu » est moa. Dans la famille uto-aztèque (Sud-Ouest des États-Unis et Mexique), les préfixes pronominaux classiques sont ni- pour « je » et mi- pour « tu » dans certaines langues, ou ni- et ti- dans d’autres (le nahuatl utilise ni- pour « je » et ti- pour « tu », ce qui donne en fait n–t, mais sa cousine le hopi a nuu vs mum). Dans les langues chimakuanes et d’autres langues de la côte nord-ouest du Pacifique, des schémas similaires apparaissent. Au début du XXe siècle, des linguistes comme Alfred Trombetti (1905) et Edward Sapir (années 1910) ont remarqué cette distinction n vs m très répandue et ont émis l’hypothèse que toutes les langues amérindiennes pourraient en fin de compte être apparentées[^3]. Joseph Greenberg s’est emparé de cet argument dans son hypothèse controversée de l’Amerind, utilisant le motif pronominal n/m comme pièce maîtresse. Il a soutenu que les Amériques (à l’exception de l’inuit et du na-déné) formaient une seule macro-famille (« Amerind ») dont la proto-langue utilisait n pour je et m pour tu – et que ce motif avait persisté dans des dizaines de familles filles dispersées[^3]. L’argument principal était en substance : il est peu probable que ce soit une coïncidence si tant de langues amérindiennes partagent des pronoms n/m ; et l’emprunt peut être écarté (la plupart de ces groupes avaient peu de contacts) ; par conséquent, l’héritage d’un ancêtre commun est la meilleure explication. Les critiques ont rétorqué que le motif n’est pas vraiment universel dans les Amériques – il est fort à l’ouest mais faible ou absent dans l’est – et que l’on pourrait simplement observer une vaste diffusion aréale ou même des ressemblances fortuites[^3][^4]. Après tout, étant donné des dizaines de familles et un petit nombre de sons pronominaux possibles (m, n, t, k, etc.), un certain chevauchement est inévitable. Le consensus parmi les spécialistes aujourd’hui est que la famille Amerind de Greenberg n’est pas prouvée et probablement illusoire. Néanmoins, la ceinture pronominale n–m reste un phénomène fascinant. Elle suggère qu’au moins à l’échelle régionale, les pronoms ont préservé des relations plus anciennes – regroupant peut-être des familles en macro-groupes intermédiaires (par exemple, certains chercheurs pensent que plusieurs familles de la côte nord-ouest du Pacifique pourraient former un ensemble plus vaste, en partie indiqué par des pronoms partagés). À tout le moins, elle laisse entrevoir des contacts anciens : peut-être que les premiers peuples des Amériques partageaient une convention pronominale commune qui s’est ensuite diffusée ou maintenue à mesure qu’ils se diversifiaient.
Pour visualiser ces deux grands motifs, imaginez une carte du monde des langues. Vous verriez une large bande de l’Ancien Monde (Europe, Asie du Nord/Centre) où les mots pour « me »/« je » comportent souvent m, et « tu » comporte souvent t. Puis, dans le Nouveau Monde, en particulier près de la côte pacifique de l’Alaska jusqu’aux Andes, de nombreuses langues montrent n pour « je » et m pour « tu ». D’autres régions, comme l’Australie et la Nouvelle-Guinée, ne suivent particulièrement aucun de ces motifs (l’Australie, en particulier, n’a pas de m pour « je » du tout[^4]). L’Afrique, comme nous l’avons vu, a beaucoup de m pour « je » (surtout au sud et à l’ouest), mais peu de m pour « tu » sauf sporadiquement[^4]. Ces schémas sont si fortement concentrés géographiquement qu’il est difficile de les attribuer au simple hasard ou à une préférence universelle. L’histoire semble être en cause – soit des liens généalogiques profonds, soit d’anciens foyers de diffusion.
Pour bien distinguer les choses, considérons deux scénarios hypothétiques expliquant comment des langues peuvent se retrouver avec des pronoms similaires :
- Héritage commun (phylogénie) : Il y a très, très longtemps, une seule proto-langue possédait des pronoms d’une certaine forme (disons, « je » = mi, « tu » = ti). Cette langue se scinde en filles, qui se scindent à leur tour, comme les branches d’un arbre. Chaque fille conserve les pronoms (avec peut-être de légers changements phonétiques). Des milliers d’années plus tard, nous avons toute une famille de langues – voire des familles de familles – où « je » et « tu » ressemblent encore à mi et ti. C’est comme lorsque le latin s’est scindé en français, espagnol, italien, etc., et que toutes ces langues ont conservé un son m dans leurs mots pour « me » (français moi, espagnol me, italien mi). La ressemblance tient à l’ascendance commune – les langues sont des cousines qui ont gardé les pronoms de leur « grand-mère ». On peut illustrer cela par un arbre simple :
(Diagramme : une proto-langue se scinde en A et B ; toutes deux conservent la forme « mi » pour le pronom de première personne.)
- Diffusion aréale (emprunt ou convergence) : deux langues à l’origine non apparentées (ou très lointainement apparentées) se trouvent être voisines. Au fil des siècles de commerce, de mariages mixtes ou de bilinguisme, l’une peut emprunter un pronom à l’autre, ou bien elles peuvent s’influencer mutuellement jusqu’à adopter un pronom de forme similaire. Par exemple, peut‑être que la langue X utilisait à l’origine « ga » pour « je », et la langue Y « na » pour « je ». Mais l’une était dominante ou prestigieuse, et, à terme, toutes deux en sont venues à dire « na » pour la première personne. C’est inhabituel (là encore, les pronoms sont rarement empruntés, mais cela peut se produire dans des situations de contact intense ou lors de la formation de créoles). Une autre possibilité est la rétention fortuite : peut‑être que X et Y ont toutes deux hérité d’un m pour « je » d’un passé très lointain (lignées différentes) et se sont retrouvées par hasard. Dans les deux cas, la similarité est due au contact ou à la coïncidence, non à une origine commune récente. On peut visualiser l’emprunt comme ceci :
(Schéma : les langues X et Y, initialement différentes, convergent de sorte que toutes deux finissent par avoir « na » pour « je » grâce au contact.)
En réalité, démêler ces scénarios est extrêmement difficile. Les linguistes s’appuient sur bien plus qu’un ou deux mots : ils recherchent des correspondances phonétiques systématiques à travers des dizaines d’éléments de vocabulaire de base pour établir une parenté génétique. Les seuls pronoms ne peuvent pas prouver une macro‑famille ; mais ils peuvent fournir un indice solide. Pensez‑y comme à des panneaux indicateurs : si vous voyez le même motif étrange se répéter dans des langues disparates, cela vous indique une direction à explorer plus avant.
Dans le cas de l’eurasiatique (la famille hypothétique incluant l’indo‑européen, l’ouralien, l’altaïque, etc.), la preuve pronominale (m–T) a été l’un des facteurs qui ont encouragé des propositions comme l’hypothèse nostratique de Greenberg et Illič‑Svityč. En effet, des décomptes détaillés montrent qu’en indo‑européen, les sons m (pour « je/moi ») et t (pour « tu/toi ») ont survécu avec des pertes minimales. Une enquête portant sur près de 500 langues et dialectes indo‑européens a montré que les proto‑formes en m- et t- pour la première et la deuxième personne se sont maintenues dans plus de 98 % d’entre eux[^1] ! Une telle résilience suggère qu’il ne s’agit pas d’un hasard : ces sons étaient profondément ancrés dans la lignée. Les langues ouraliennes utilisent de même m‑ pour « je/moi » (le proto‑ouralien avait *me ou *mi pour la première personne). Ainsi, si l’indo‑européen et l’ouralien partagent ce trait, certains linguistes soutiennent que cela renforce l’idée que ces familles pourraient être lointainement apparentées (puisqu’il est peu probable que deux familles totalement non apparentées aient par hasard des paradigmes pronominaux identiques et tant d’autres correspondances supposées).
Pour l’idée d’Amerind, le motif n–m était une pièce maîtresse de l’argumentation, mais malheureusement les autres preuves étaient moins solides, et la profondeur temporelle énorme (peut‑être plus de 13 000 ans depuis les premiers Américains) rend la confirmation difficile. Bien que la plupart des linguistes n’acceptent pas une seule famille amérindienne, des recherches se poursuivent sur des groupements intermédiaires. Les pronoms continuent d’y jouer un rôle – par exemple, certaines familles amérindiennes dont on propose qu’elles aient des liens lointains présentent des affixes pronominaux similaires, ce qui donne du poids à ces propositions.
La morale : les pronoms et autres « mots grammaticaux » similaires (comme les mots interrogatifs what/qui/que, les démonstratifs this/that, etc.) peuvent parfois persister bien plus longtemps que les mots ordinaires. Ils deviennent analogues à des fossiles dans la langue, préservant des traces de migrations et de contacts anciens. Tout comme un paléontologue peut dater des couches rocheuses grâce à un petit fossile, un linguiste peut parfois entrevoir une protolangue perdue grâce à ce petit m pour « moi » qui refuse de disparaître.
Héritage vs diffusion : trouver le bon équilibre#
Alors, ces similitudes pronominales profondes sont‑elles le signe d’une grande famille linguistique mondiale ? Ou résultent‑elles simplement du fait que des humains en différents lieux ont trouvé des solutions similaires (et peut‑être emprunté un peu au passage) ? La réponse honnête est : nous n’en sommes pas tout à fait sûrs – c’est un sujet de débat permanent. Mais on peut mieux comprendre le problème en clarifiant, en termes simples, la différence entre phylogénie linguistique et diffusion aréale :
La phylogénie linguistique est exactement comme un arbre généalogique des langues. Si deux langues ont une relation phylogénétique, cela signifie que l’une descend de l’autre ou qu’elles descendent toutes deux d’un ancêtre commun. Par exemple, l’espagnol et l’italien ont une relation phylogénétique parce qu’ils viennent tous deux du latin. Ils partagent beaucoup de mots hérités (madre et madre pour « mère », dos et due pour « deux », etc.). Dans un scénario strictement phylogénétique, les similarités entre langues sont dues à l’héritage – transmis de génération en génération, avec des changements phonétiques réguliers.
La diffusion aréale signifie que les langues s’influencent mutuellement par le contact. Elles peuvent être non apparentées (comme le japonais et l’anglais aujourd’hui) mais, si elles coexistent, l’une peut emprunter des mots ou même des traits grammaticaux à l’autre. Par exemple, l’anglais a emprunté des centaines de mots au français (comme table, government) – non pas parce que l’anglais et le français partagent un ancêtre récent (ce n’est pas le cas ; leur ancêtre commun remonte à l’indo‑européen, bien avant l’existence de ces mots), mais parce que des locuteurs du français normand ont régné sur l’Angleterre et que les langues se sont mêlées. Dans la diffusion aréale, les similarités sont dues à l’emprunt, la convergence ou le développement parallèle dans un Sprachbund (aire linguistique).
En général, lorsque l’on observe un motif systématique à travers de nombreux mots de base, le premier suspect est la phylogénie. L’emprunt affecte habituellement le vocabulaire non central (comme les termes technologiques, les éléments culturels) plutôt que les pronoms de base ou les petits nombres. C’est pourquoi les preuves pronominales sont prises au sérieux pour les relations profondes – c’est précisément le type de données qui est moins susceptible de provenir d’emprunts. Par exemple, si la langue A et la langue B ont toutes deux un pronom « mana » pour « je » et « wena » pour « tu », et si l’on sait qu’elles n’ont pas eu de contact intense, un linguiste émettra l’hypothèse que A et B remontent peut‑être à une protolangue commune où *mana/*wena existaient. Si l’on peut trouver davantage de corrélations (dans d’autres mots stables comme mère, deux, œil, nom, etc.), on commence à bâtir un dossier en faveur d’une famille.
Cependant, dans les comparaisons extrêmement anciennes, il faut rester prudent. Sur ~5 000–7 000 ans, le changement phonétique régulier peut complètement obscurcir l’origine d’un mot. Le mot pour « je » en chinois mandarin est wǒ, qui ne ressemble en rien à « I » ou « me » ou « yo » – et en effet, le chinois n’est pas apparenté à l’indo‑européen. Mais, fait intéressant, certains ont comparé le chinois wǒ (chinois ancien *ŋaʔ ou *nga) à des pronoms comme le tibétain nga et même à l’indo‑européen *egō (via une macro‑famille proposée). Ce sont des liens très spéculatifs ; après tant de temps, il est facile de voir des motifs qui ne sont peut‑être pas réels.
Il faut aussi envisager que certaines similarités ne remontent pas à une seule langue‑mère « proto‑monde », mais à des vagues de migrations anciennes et de contacts. Par exemple, peut‑être que les premiers humains modernes sortis d’Afrique il y a plus de 50 000 ans avaient déjà un mot du type ma pour « je » – et que toutes les langues actuelles reflètent ce mot originel, modifié. Ce serait l’hypothèse du proto‑monde (toutes les langues seraient en fin de compte apparentées). Mais il existe une autre vision : peut‑être qu’au fur et à mesure de la dispersion humaine, il y a eu quelques innovations de bon sens (comme l’usage d’un son m pour indiquer le locuteur, qui pourrait apparaître indépendamment ou se diffuser facilement). Certains défenseurs de macro‑familles, comme Merritt Ruhlen, ont soutenu que les motifs pronominaux mondiaux (et des mots comme tik pour « doigt/un* » trouvés partout) indiquent une origine unique[^10]. La plupart des linguistes jugent cela non convaincant avec les preuves actuelles. Il est plus prudent de supposer que les langues ont pu émerger en plusieurs lignées et échanger occasionnellement, ou partager par hasard, des termes de base.
En Afrique, par exemple, il se peut que le niger‑congo et le nilo‑saharien soient réellement frères (certains ont proposé une famille « nigéro‑saharienne »). Si cela était démontré, les ressemblances pronominales relèveraient effectivement de l’héritage. Ou bien il se peut qu’ils aient été distincts, mais qu’un contact ancien (il y a plus de 10 000 ans) dans la ceinture sahélienne ait conduit à une influence mutuelle – peut‑être qu’un groupe a emprunté des pronoms ou simplement influencé le schéma sonore des pronoms (un effet de contact très lent). On observe quelque chose de ce genre dans les Balkans, où des langues non apparentées (albanais, roumain, bulgare) en sont venues à partager certains traits grammaticaux en étant voisines pendant des siècles. Les pronoms y sont peut‑être moins sujets, mais ce n’est pas impossible.
Une approche ingénieuse utilisée par certains chercheurs est la typologie statistique : au lieu de simplement noter qualitativement « m vs n », ils rassemblent de vastes bases de données de langues et testent si la cooccurrence de traits pronominaux dépasse le hasard. Nichols a fait cela pour les motifs m–T et n–m et a constaté qu’ils sont significativement concentrés dans leurs aires respectives[^4]. En d’autres termes, ce n’est pas une dispersion aléatoire – quelque chose d’historique s’est produit. Et puisque ces amas correspondent assez bien aux macro‑familles proposées (eurasiatique pour m–T, et un groupement « amérindien » hypothétique pour n–m), cela incline l’interprétation vers un signal génétique profond plutôt que vers une pure diffusion.
En fin de compte, la position prudente est : les pronoms suggèrent des relations profondes, mais à eux seuls ils ne suffisent pas à trancher. Ils sont précieux comme marqueurs diagnostiques. Si deux langues ont des ensembles pronominaux très similaires, on vérifie si d’autres mots de base s’alignent aussi. Par exemple, l’indo‑européen et l’ouralien n’ont pas seulement des pronoms en m‑/t‑ ; ils partagent aussi quelques mots de base d’aspect commun (IE mater = mère, PU *mata = père, etc.) et des traits structurels, ce qui a conduit à de longues spéculations sur le nostratique[^10]. En revanche, des langues qui se trouvent simplement partager un m pour « je » mais rien d’autre ont probablement trouvé la même solution indépendamment.
Tout le monde s’accorde sur le fait que les pronoms et les petits mots grammaticaux changent plus lentement que la plupart du vocabulaire[^1][^8]. Ils agissent comme des ancres dans la mer toujours changeante de la langue. C’est pourquoi l’on peut citer des faits amusants comme : les mots anglais I, we, two, three, who sont tous directement hérités de mots proto‑indo‑européens prononcés il y a peut‑être 6 000 ans – leurs formes ont un peu changé, mais pas au point d’être méconnaissables (comparez le sanskrit aham = je, dvé = deux, trí = trois, kʷo = qui). Certains de ces mots pourraient même remonter plus loin : une liste de mots « ultraconservés » proposée en 2013 incluait non seulement I et you, mais aussi des mots comme mother, not, what, man[^8]. Si ces chercheurs ont raison, cela signifie que si vous rencontriez une tribu il y a 15 000 ans, vous pourriez vaguement reconnaître quelques mots qu’ils prononcent, parce que vous utilisez aujourd’hui des formes évoluées des mêmes mots ! C’est une idée vertigineuse – la langue comme une chaîne continue s’étendant jusqu’à l’Âge glaciaire.
Conclusion#
Les pronoms sont faciles à négliger – ils sont courts, souvent d’une seule syllabe, et nous les utilisons sans y penser. Mais, comme nous l’avons vu, ces petits mots ont de lourdes implications pour l’histoire des langues. Le fait que mama, me et mi résonnent à travers les continents n’est pas un accident ; c’est un indice. Qu’il finisse par prouver une seule famille linguistique mondiale ou qu’il ne fasse que cartographier d’anciennes lignes de communication, le modeste pronom est une clé pour déverrouiller la préhistoire.
Le travail de détective linguistique à cette profondeur est difficile et souvent controversé. Il faut naviguer entre trop d’enthousiasme (voir des liens génétiques partout à partir de deux sons) et trop de scepticisme (rejeter toute similarité comme un hasard). Les pronoms, les numéraux et d’autres mots ultrastables nous donnent une chance réelle de repousser plus loin les limites de l’arbre généalogique. Ce sont des survivants – des chuchotements de la parole de nos ancêtres dans nos mots modernes.
La prochaine fois que vous dites « je », songez que vous pourriez prononcer quelque chose de véritablement intemporel. En un sens, I veut dire la même chose partout – et cela signifie la même chose depuis des âges. Cette continuité, transmise de langue en langue à travers des générations insondables, est l’une des merveilles du langage humain. Elle suggère que, malgré la tour de Babel des langues du monde, il existe des fils d’unité qui les relient, portés par les mots les plus simples que nous apprenons tous enfants. Ces fils sont les indices que les linguistes continueront de suivre, mot par mot, pronom par pronom, vers une compréhension plus profonde de l’origine de nos langues – et de la nôtre.
FAQ#
Q 1. Des pronoms partagés prouvent‑ils l’existence d’une famille linguistique mondiale ?
R. Non. Ils constituent des indices suggestifs, mais sans des centaines de séries de cognats réguliers et de lois phonétiques, ils ne peuvent pas établir une parenté génétique.
Q 2. Pourquoi les pronoms sont‑ils si rarement empruntés ?
R. Parce qu’ils sont tissés dans la grammaire et l’identité ; leur remplacement perturberait la syntaxe centrale, si bien que même un contact intense les remplace rarement.
Q 3. Qu’est‑ce qui pourrait encore créer des motifs pronominaux similaires ?
R. Des zones anciennes de diffusion aréale et des tendances phonétiques universelles peuvent produire des formes convergentes sans ascendance commune.
Sources#
[^1] : Bancel, Pierre J. & de l’Etang, Alain M. (2010). « Where do personal pronouns come from ? » Journal of Language Relationship 3 : 127–152. Les auteurs notent la préservation stupéfiante des pronoms de première et deuxième personne dans les familles de langues, les qualifiant de « roches dures…résistant à l’érosion longtemps après que la plupart des autres mots ancestraux ont été emportés ». Ils citent Dolgopolsky (1964), qui trouve que les pronoms de 1sg et 2sg comptent parmi les significations les plus durables, et Pagel (2000), qui estime à ~166 000 ans la demi‑vie du pronom de 1sg. Ils observent aussi qu’en indo‑européen, les radicaux pronominaux initiaux en m‑ et t‑ ont survécu dans plus de 98 % des langues, reflétant plus de 8 000 ans de continuité. Les pronoms ne seraient apparus qu’avec la syntaxe complexe (il y a ~100 000 ans), ce qui pourrait expliquer pourquoi les mêmes quelques radicaux pronominaux se répètent à l’échelle mondiale.
[^2] : Greenberg, Joseph H. (1987). Language in the Americas. (Comme le résume une recension : les pronoms sont remarquablement stables, et « il existe peu, voire aucun cas avéré d’emprunt d’un pronom de première ou de deuxième personne ». Greenberg a utilisé cette stabilité comme prémisse pour proposer des liens génétiques profonds entre les langues américaines.)
[^3] : Wikipedia : « Amerind languages. » L’hypothèse Amerind de Greenberg (1987) proposait que la plupart des langues autochtones des Amériques appartiennent à une seule macro‑famille. Un élément clé de la preuve était un motif pronominal première personne n‑, deuxième personne m‑ largement répandu dans de nombreuses langues américaines. Ce motif a été noté pour la première fois par Alfredo Trombetti en 1905, et Sapir l’a jugé « suggestif » d’une origine commune. Toutefois, le motif n’est pas universel (principalement en Amérique du Nord et méso‑américaine), et le groupement amérindien n’est pas accepté par la plupart des linguistes.
[^4] : Nichols, Johanna (2013). WALS Online – Chapitre 137 : « N–M Pronouns » (et Chapitre 136 : « M–T Pronouns »). Nichols cartographie deux grands amas aréaux de paradigmes pronominaux : un amas m–T en Eurasie du Nord et un amas n–m dans les Amériques. Elle note que m en première personne est « presque pan‑eurasien » (ubiquitaire dans la région de la Grande Route de la Soie) et aussi fréquent en Afrique, tandis que m en deuxième personne est pratiquement absent en Eurasie mais fréquent le long de la côte pacifique des Amériques. Fait crucial, ces distributions ne sont pas des universaux mondiaux mais sont géographiquement contraintes, ce qui suggère des causes historiques (généalogiques ou de contact) plutôt que des tendances innées. Nichols souligne qu’aucun symbolisme sonore (les enfants apprenant les nasales en premier) ni le simple hasard ne peuvent expliquer ces motifs en amas – au contraire, une origine historique profonde est impliquée. Elle souligne aussi que, si les ressemblances pronominales laissent entrevoir des lignées profondes, elles sont à elles seules une preuve insuffisante ; les langues de chaque aire appartiennent à plusieurs familles, de sorte qu’il faut des preuves supplémentaires pour démontrer une descendance commune.
[^5] : Güldemann, Tom (2018). The Languages and Linguistics of Africa – Pronoms du proto‑niger‑congo. Selon les reconstructions citées par Güldemann, le proto‑niger‑congo (la langue ancestrale du vaste phylum niger‑congo) avait des pronoms de première et deuxième personne commençant tous deux par m. Plus précisément, la 1sg est donnée comme mV́ (avec une voyelle antérieure) et la 2sg comme mV́ (avec une voyelle postérieure). Cela signifie que de nombreuses langues niger‑congo modernes ont conservé le m‑ pour « je » (par ex. mí- ou mɛ́-) et aussi un m‑ ou une labiale apparentée pour « tu » (bien que souvent différenciée par la voyelle ou le ton). Babaev (2013) fournit une enquête détaillée à l’appui de ces reconstructions. Une telle stabilité pointe vers un héritage depuis la protolangue. (Remarque : certaines branches ont ensuite déplacé la 2sg vers w ou b, qui restent des consonnes labiales.)
[^6] : Güldemann, Tom & Elderkin, Edward (2010). Discussion dans « Khoisan linguistic classification today » (dans Brenzinger & König éd., 2014) sur les similarités pronominales entre le khoe et le sandawe. Le tableau 8 de la source compare les pronoms du proto‑khoe‑kwadi avec ceux du sandawe et trouve des affinités qui pourraient indiquer une relation lointaine. Par exemple, on peut reconstruire le proto‑khoe à la première personne comme *mi, à la deuxième personne comme *u, etc., et le sandawe a des formes similaires (par ex. *ti pour « je », *ba pour « tu » dans certains contextes). Les auteurs qualifient cette preuve de « prometteuse mais non concluante » pour un lien profond. Cela suggère que même les langues à clics d’Afrique (autrefois regroupées sous « khoisan ») présentent des ressemblances pronominales au‑delà des frontières familiales supposées. C’est un indice que certains de ces isolats pourraient partager une ascendance ancienne ou une influence de contact de longue durée.
[^7] : Thomason, Sarah (2013). « Ultraconserved words ? Really ?? » – Language Log (8 mai 2013). Une réponse critique à Pagel et al. (2013). Thomason exprime son scepticisme quant aux affirmations sur un vocabulaire ultraconservé à travers l’Eurasie, soulignant des problèmes comme l’inclusion de familles controversées (altaïque) et la nécessité de sélectionner des proto‑formes dans les bases de données. Elle soutient qu’après 15 000 ans, même si un mot n’a pas été remplacé, les changements phonétiques réguliers rendraient les cognats méconnaissables. Par conséquent, des ressemblances apparentes (par ex. des mots de forme similaire pour you dans différentes familles) pourraient bien être accidentelles. Elle qualifie métaphoriquement les 23 mots ultraconservés de « visages dans le feu » – mettant en garde contre la tendance humaine à voir des motifs même là où il n’y en a pas. Cette note de bas de page illustre le point de vue prudent : bien que les pronoms soient stables, les utiliser pour sauter à des conclusions sur des macro‑familles peut être problématique sans méthodologie robuste.
[^8] : Pagel, Mark ; Atkinson, Q. D. ; Calude, A. S. ; Meade, A. (2013). « Ultraconserved words point to deep language ancestry across Eurasia. » PNAS 110(21) : 8471–8476. Cette étude a montré qu’un ensemble de mots courants – en particulier les pronoms, numéraux et adverbes – ont des taux de remplacement significativement plus lents, avec des « demi‑vies » estimées entre 10 000 et 20 000 ans. En comparant des reconstructions de proto‑mots dans sept familles eurasiatiques, les auteurs ont identifié 23 items de signification avec des cognats potentiels dans au moins quatre familles – bien au‑dessus de ce qu’on attendrait par hasard. Ces mots ultraconservés incluaient I, you, we, who, what, man, not, two, five, bark, ashes, etc. Les pronoms étaient fortement surreprésentés dans cet ensemble. La modélisation phylogénétique de l’équipe a donné un âge estimé d’environ ~15 000 ans pour un ancêtre commun (« eurasiatique »), cohérent avec la fin de l’Âge glaciaire. Ils soutiennent que la fréquence d’usage élevée confère à ces mots une grande stabilité, permettant de détecter des traces de parenté profonde au‑delà de la limite normale de 5–8 000 ans de la méthode comparative. De nombreux linguistes historiques restent sceptiques quant à ces conclusions (voir la note 7), mais l’article fournit un soutien quantitatif à l’idée que les pronoms et autres mots de base peuvent préserver des signaux phylogénétiques profonds.
[^9] : Wikipedia : « Eurasiatic languages. » L’eurasiatique est une macro‑famille proposée incluant l’indo‑européen, l’ouralo‑yukaghir, l’altaïque (turcique, mongolique, toungouse, parfois coréen et japonique), le tchouktche‑kamtchatkan, l’esquimo‑aléoute, et peut‑être d’autres. Greenberg et d’autres, dans les années 1990, ont suggéré que ces familles partagent une origine commune. L’un des éléments de preuve a été les similarités dans les paradigmes pronominaux et le vocabulaire de base. En 2013, Pagel et al. ont affirmé avoir des preuves statistiques en faveur de l’eurasiatique, le datant d’environ ~15 000 ans BP. Cependant, ce concept est largement rejeté par les spécialistes. La page Wikipedia note que l’idée d’une superfamille eurasiatique est controversée et n’est généralement pas acceptée. Cela reflète la situation plus large des macro‑familles : des propositions comme l’eurasiatique ou le nostratique sont intrigantes (et s’appuient souvent sur des preuves pronominales), mais restent non prouvées aux yeux de la linguistique historique dominante.
[^10] : Greenberg, Joseph (1963). The Languages of Africa. Dans cet ouvrage influent, Greenberg a classé les langues africaines en quatre familles et a forgé le terme « khoisan » pour les langues à clics. Des recherches modernes, résumées par Güldemann (2014), ont montré que « khoisan » n’est pas un groupe génétique valide – c’est un terme couvrant au moins trois familles indépendantes plus des isolats. Les clics partagés sont un trait aréal, non une preuve d’origine commune. C’est une mise en garde : des langues peuvent partager des traits distinctifs (comme les clics ou les pronoms) sans être étroitement apparentées. Pour notre discussion, nous traitons les langues khoisan séparément (khoe, tuu, kx’a, hadza, sandawe). Fait intéressant, la classification africaine de Greenberg n’unissait pas le niger‑congo avec le nilo‑saharien ou d’autres – il les traitait comme séparés. Certains linguistes ultérieurs ont spéculé sur des connexions plus profondes (par ex. reliant nilo‑saharien et niger‑congo), mais celles‑ci restent hypothétiques. Les ressemblances pronominales font partie de ces preuves spéculatives. Essentiellement, les théories de macro‑familles africaines sont encore non prouvées, bien que les motifs pronominaux fournissent des données intrigantes.
[^11] : Exemples de pronoms africains pour des isolats à clics (hadza, sandawe) et la famille khoe : les pronoms indépendants du hadza incluent tiʔe « je » et baʔe « tu » (données de Sands 1998, via communication personnelle) – montrant une distinction nasale/occlusive vs labiale similaire à celle des langues bantoues voisines. Le sandawe a ŋú « je » et bé « tu » (selon des sources anciennes), à nouveau ŋ (nasale) vs b (labiale). Les pronoms du proto‑khoe reconstruits par Vossen (1997) incluent *mi « je » et *ma « tu » pour une branche, et *ti « je », *di « tu » pour une autre – un peu incohérent, mais avec des recoupements suggestifs avec le sandawe[^6]. Ces exemples illustrent comment même des langues aréalement éloignées peuvent finir par avoir des formes pronominales analogues. Qu’il s’agisse d’héritage ancien ou de diffusion, cela renforce l’impression d’un motif à l’échelle du continent (nasale en 1re personne, labiale en 2e) comme discuté dans le texte principal. (Sources : Sands, Bonny. Eastern and Southern African Khoisan, 1998 ; Vossen, Rainer. The Khoisan Languages, 1997.)
[^12] : Ruhlen, Merritt (1994). On the Origin of Languages : Studies in Linguistic Taxonomy. Ruhlen, élève de Greenberg, a défendu l’hypothèse d’un proto‑monde – selon laquelle toutes les langues humaines partageraient en fin de compte une seule origine. Il a mis en avant des formes récurrentes à l’échelle mondiale comme ma pour « mère » et des pronoms avec des sons m/n comme preuves. Par exemple, Ruhlen a noté que les mots pour « personne » ou « humain » comportent souvent n ou m (par ex. *mi « je/moi » et *nu « tu » dans sa reconstruction du proto‑monde). Ces affirmations restent très controversées. La plupart des linguistes jugent les profondeurs temporelles trop grandes et les données trop circonstancielles. Néanmoins, l’idée de proto‑monde illustre l’extrême de l’argument pronominal : si les pronoms sont réellement ultra‑stables, ils pourraient remonter jusqu’à la première langue des humains modernes, il y a ~50–100 000 ans. C’est spéculatif – il n’existe actuellement aucun moyen de le vérifier – mais c’est un contexte stimulant pour comprendre pourquoi certains sons pronominaux semblent presque universels. (À utiliser comme note philosophique plutôt que comme preuve empirique.)