Le Soi sachant et les hypothèses d’érosion de Gn

TL;DR

Deux explications spéculatives pour le pronom mondial n-/ŋ- 1 sg : (1) connaisseur = soi (réflexif de « savoir ») et (2) érosion phonétique de ǵn- dans « je sais ».
Les deux nécessitent une diffusion du Pléistocène tardif ou un héritage ultra-profond.
Aucune ne trouve de soutien direct dans le changement sonore régulier ou les intermédiaires attestés.
La typologie montre que les pronoms dérivent rarement des verbes ; les réflexifs proviennent souvent de parties du corps.
Le mystère de la convergence mondiale des pronoms reste donc non résolu.

Contexte#

Dans les familles de langues du monde entier, le pronom de la première personne du singulier contient souvent un son n (nasal alvéolaire ou vélaire).
Les exemples incluent le proto-papou (PNG) na, le proto-algonquien ne‑ /na‑, le dravidien nā́n, le sino-tibétain ŋa, le basque ni, le sémitique ʔanā, etc.

Ce schéma est si répandu qu’il dépasse probablement le simple hasard.

Les linguistes historiques sont sceptiques quant à lier de tels sons pronominaux à travers le temps profond en raison du changement rapide des langues, mais les pronoms semblent inhabituellement stables – dans l’hypothèse amérindienne de Joseph Greenberg, 1sg n et 2sg m ont persisté dans toutes les branches sur ~12 000 ans.

Certains chercheurs proposent que les pronoms tels que nous les connaissons n’étaient pas présents au moment de la sortie d’Afrique, mais ont plutôt diffusé de manière mémétique vers la fin du Pléistocène (10–15 kya).

En d’autres termes, le « postulat du pronom primordial » postule que la conscience de soi (et le besoin de mots comme « je ») a émergé ou s’est répandue relativement récemment.

Nous examinons ci-dessous deux hypothèses spéculatives avancées pour expliquer le pronom de première personne basé sur N omniprésent – l’une se concentrant sur une innovation sémantique (« connaisseur = soi »), et l’autre sur un développement phonétique (érosion d’un ancien cluster gn‑).
Les deux tentent d’expliquer la similitude frappante des formes pronominales à l’échelle mondiale, possiblement via une diffusion préhistorique tardive, et les deux font face à des défis probants significatifs.

Hypothèse 1 : Motivation Sémantique – “Connaisseur = Soi”#

Cette hypothèse suggère qu’une communauté linguistique préhistorique a inventé un nouveau pronom réflexif à partir du concept « se connaître soi-même ».

En essence, le mot pour « je » (ou « soi ») pourrait avoir pris naissance comme un verbe ou un nom verbal signifiant « celui qui se connaît (lui-même) », reflétant une percée dans la conscience introspective de soi.

Cette idée résonne avec la notion que la véritable référence à la première personne — le concept d’un soi autonome — devait être inventée linguistiquement une fois que les humains sont devenus conscients d’eux-mêmes.

Dans une culture nouvellement confrontée à la conscience subjective, une phrase comme « me connaître » ou « connaisseur de soi » pourrait plausiblement être réanalysée comme un nom = « moi-même », se grammaticalisant finalement en un pronom pour le locuteur.

Parallèles translinguistiques#

Bien que nous n’ayons pas d’attestation directe d’une étymologie « je = connaisseur » dans les langues enregistrées, il existe un précédent pour les pronoms et les réflexifs provenant de noms concrets et de phrases réflexives.

La typologie linguistique montre que les pronoms réflexifs évoluent souvent à partir de termes désignant des parties du corps via la métonymie.

Par exemple, le basque utilise buru « tête » dans sa construction réflexive (littéralement « sa tête » pour « soi-même »), et plus de la moitié des langues du monde forment des réflexifs à partir de mots comme corps, tête, peau, âme, etc.

Cela démontre que les significations pronominales abstraites (soi, soi-même) surgissent régulièrement de concepts concrets liés au soi.

Par analogie, dériver un pronom d’un verbe de connaissance n’est pas entièrement farfelu : ce serait un saut vers une source abstraite et introspective plutôt qu’une partie du corps concrète, mais cela correspond au thème de l’auto-référence (se connaître implique un soi à connaître).

Si « je » était un concept nouveau, le modeler à partir de « connaisseur » offre une auto-référence sémantiquement transparente : je suis le connaisseur (de moi-même).

Exigences de diffusion et de changement sonore#

Pour que « connaisseur = soi » explique le modèle N mondial, cette innovation se serait probablement produite une fois (ou quelques fois) puis se serait répandue à travers de nombreuses familles de langues comme un calque ou un Wanderwort autour de 12–15 kya.

Il existe un précédent dans les langues papoues : Malcolm Ross note qu’un pronom 1sg de type na a balayé la Nouvelle-Guinée vers ~8 000 BC mémétiquement (sans migration de masse) – des dizaines de familles non apparentées ont remplacé leurs pronoms sous cette influence.

Un tel emprunt pronominal aréal est rare mais apparemment possible à l’échelle régionale. Une diffusion mondiale ou pan-eurasienne serait encore plus extraordinaire, impliquant une époque préhistorique de communication inter-groupe intense ou un concept universellement convaincant (peut-être lié à une révolution cultuelle ou cognitive, comme certains l’ont théorisé).

Cependant, d’énormes obstacles de régularité surgissent ici.

Si une langue ancestrale a créé un pronom à partir d’un verbe « se connaître », nous devrions tracer des changements sonores réguliers de cette forme dans le pronom attesté de chaque famille.

Par exemple, une forme hypothétique proto-eurasiatique comme gna (« connaisseur/soi ») pourrait donner le sino-tibétain ŋa, le dravidien nā, l’afroasiatique ʔan(a), l’indo-européen egʷ- (si la nasale vélaire initiale devenait une occlusive sonore) et ainsi de suite.

Ce scénario exige une chaîne très spécifique d’évolutions phonologiques dans des lignées parallèles – essentiellement reconstruire un proto-mot pour « je » en dehors de la méthode comparative standard.

Crucialement, nous manquons de toute forme intermédiaire attestée ou d’inscriptions anciennes montrant une transition de « savoir » à « je ».

L’idée reste entièrement inférentielle.

Comme le notent Bancel & Matthey de l’Etang dans leur étude sur les origines des pronoms, de telles propositions profondes souffrent inévitablement d’un écart dans le dossier : il faut postuler un « stade pronominoïde » – une forme intermédiaire entre un élément lexical normal et un pronom – pourtant aucune preuve directe de tels stades ne survit.

Évaluation

L’hypothèse connaisseur = soi est intrigante pour la façon dont elle lie le changement linguistique à l’évolution cognitive.

Elle s’inscrit dans un récit où la conscience de soi s’est répandue à la fin de l’ère glaciaire, incitant à une innovation linguistique pour exprimer le nouveau concept d’un soi introspectif.

Elle s’aligne également avec les tendances translinguistiques à créer des pronoms à partir de mots existants pour soi ou le corps.

Pourtant, elle reste hautement spéculative.

Elle repose sur une chaîne d’événements difficile à vérifier : une communauté linguistique préhistorique a d’abord eu une construction réflexive « se connaître », puis l’a grammaticalisée en un pronom, puis cette forme (phonologiquement similaire à na/ŋa) s’est diffusée à travers les continents.

Nous n’avons aucun ensemble de cognats connu ou de textes anciens pour soutenir cette voie, et les pronoms sont si courts et anciens que la reconstruction comparative normale échoue au-delà de quelques milliers d’années.

En bref, l’hypothèse sémantique est une solution créative à l’énigme des pronoms, mais elle reste actuellement sans preuve concrète.

Hypothèse 2 : **Érosion Phonétique de Ǵn‑ (comme dans ǵneh₃ « savoir ») en N‑**#

La deuxième hypothèse aborde la forme des pronoms plus que leur signification.

Elle postule que le [n] omniprésent dans les pronoms de première personne provient d’un ancien cluster */gn/ (une combinaison dorsale + nasale) qui a perdu sa consonne initiale au fil du temps.

En termes pratiques, cela suggère qu’une phrase ou une formule ancestrale comme « je sais (…) » a été réanalysée, la partie gn‑ étant finalement interprétée comme le pronom lui-même après l’érosion de l’élément dorsal.

Le proto-indo-européen (PIE) offre un point de référence : la racine verbale ǵneh₃‑ signifie « savoir, reconnaître » (cf. latin gnōscō, grec gignṓskō, sanskrit jñā-).

Cette racine commence par un g palatalisé (ǵ), qui est une consonne dorsale, suivie de n.

Si l’on imagine une expression préhistorique comme « (je) sais [X] » fréquemment utilisée en auto-affirmation ou identification, la séquence sonore initiale [ǵn…] pourrait, au fil du temps, avoir été mal interprétée comme un marqueur autonome pour la première personne.

Essentiellement, gn‑ > n‑ par attrition phonétique (abandon du son g‑like) donnerait un pronom “n‑”.

Cela expliquerait parfaitement pourquoi, partout dans le monde, je = na/ŋa/etc : le pronom serait un fossile d’un ancien mot gnV‑.

Il fournit également une explication pour la mystérieuse perte de la consonne dorsale (« chute dorsale ») – un changement sonore connu dans certains contextes – spécifiquement appliqué à un ancien pronom gn‑.

Par exemple, certains ont spéculé que le PIE (e)g « je » (comme dans ego) pourrait dériver d’un son */ŋ/ ou /ɣ/ encore plus ancien, qui pourrait être lié à un cluster comme [gʲn] se lissant en [ŋ] ou [n].

Dans ce scénario, les langues qui ont [ŋ] pour « je » (par exemple, le dialecte chinois ŋo, le birman ŋa) ont préservé une nasale avec une trace d’articulation dorsale, tandis que les langues avec un [n] simple (par exemple, l’arabe anaa, le quechua ño- dans les enclitiques) ont complètement perdu l’élément dorsal.

L’hypothèse de l’érosion phonétique peint la similitude pronominale mondiale comme une sorte de résultat de loi sonore parallèle enraciné dans une séquence phonétique commune gn‑.

Examen des preuves#

Pour que cette hypothèse tienne la route, nous devrions trouver d’autres réflexes d’un changement initial gn‑ > n‑ dans les langues ou familles respectives.

Les changements sonores sont réguliers : une langue qui supprime /g/ initial avant /n/ devrait le faire dans tout son lexique.

Trouvons-nous des mots non apparentés où un ancien cluster gn est devenu n ? Dans l’ensemble, nous ne le faisons pas.

Les langues indo-européennes, par exemple, ne perdent pas uniformément g dans les clusters gn‑ – le latin, le grec, le sanskrit, etc. ont conservé le g (latin gnātus « né », gnōscere « savoir » avec [gn] intact, grec gnósis, sanskrit jñā- avec [gʲ] ou similaire).

Ce n’est que bien plus tard que certaines langues filles ont simplifié le cluster (français naître < latin gnāscor, ou le k silencieux en anglais dans kn- qui est un changement germanique spécifique).

Il n’y a aucune preuve en proto-indo-européen d’une taille précoce « gn > n » qui aurait pu donner na à partir de gna.

Il en va de même pour d’autres familles : nous ne voyons pas de suppression aléatoire de g‑ dans des mots pour des concepts communs comme « genou » (PIE ǵenu- > latin genu, sanskrit jánu-), qui auraient dû devenir basés sur n si une loi sonore générale avait opéré.

En bref, la suppression de la consonne dorsale apparaît ad hoc – invoquée uniquement pour résoudre l’énigme du pronom, non attestée comme une règle phonologique générale dans ces protolangues.

Cela affaiblit considérablement l’hypothèse.

Cela suggère que si gn → n s’est produit, ce n’était pas un changement régulier à l’échelle de la famille mais plutôt une réanalyse unique spécifique au contexte pronominal.

Mais les pronoms réanalysés à partir de verbes sont eux-mêmes inhabituels – généralement, les pronoms proviennent de pronoms plus anciens ou peut-être de démonstratifs, pas de racines verbales.

Comme l’a observé le linguiste Lyle Campbell, les pronoms font partie des éléments de vocabulaire de base les plus stables et ont tendance à ne pas être remplacés ou créés de toutes pièces dans le changement linguistique normal.

Proposer que les pronoms de continents entiers proviennent d’une phrase verbale mal segmentée étire notre compréhension de l’évolution grammaticale.

Problèmes de propagation mondiale#

Même si nous imaginons une langue (disons, une protolangue eurasiatique tardiglaciaire) dans laquelle une phrase « je sais » comme [ə ǵnə…] a été réduite à nə = « je », comment cette forme s’est-elle répandue dans le monde entier ?

Nous faisons à nouveau face au problème de la diffusion : soit cette protolangue avait de nombreux descendants (un scénario de macro-famille), soit la forme a été empruntée à travers des groupes non apparentés.

La voie généalogique (un mot « Proto-Monde » ou au moins proto-nostratique ŋa = je) est vivement débattue – les comparatistes à longue portée notent que les pronoms reconstruits en eurasiatique ou nostratique contiennent souvent n ou m, et certains proposent que ces pronoms proviennent finalement d’appels de parenté primordiaux comme na‑na « mère/parent ».

Cependant, même ces théories (qui lient l’indo-européen egʰom, l’ouralien minä, l’altaïque bi/na, le dravidien nā́n comme cognats lointains) ne nécessitent pas spécifiquement une origine de verbe de connaissance – elles invoquent plutôt des racines de parenté ou déictiques anciennes (mama, nana, etc.) comme sources.

En revanche, l’hypothèse de l’érosion gn n’est pas une partie standard de ces étymologies à longue portée ; elle semble plus une explication ad hoc pour la correspondance sonore (comment une forme proto supposée avec gn pourrait donner les formes attestées avec juste n).

Si la forme gna/ŋa pour « je » était en effet proto-sapiens ou un mot très ancien, elle était probablement déjà un pronom ou une particule pronominale à ce stade – pas explicitement liée à la signification « savoir ».

En d’autres termes, pour accepter l’érosion phonétique à l’échelle mondiale, il faut presque supposer un pronom ancêtre commun ŋa (avec ŋ reflétant peut-être un ancien cluster gn).

Mais comme noté, maintenir un seul pronom sur des dizaines de millénaires est extrêmement difficile à concilier avec les taux de changement connus – à moins que ce pronom n’ait été réintroduit ou renforcé via une diffusion ultérieure.

Une autre attente de l’hypothèse gn serait que certaines langues pourraient préserver la forme complète gn‑ dans leur pronom si l’érosion était incomplète.

Voyons-nous un pronom de première personne commençant par un g ou k + nasale qui pourrait être un fossile ? Dans quelques cas, oui : par exemple, le proto-eskimo-aléoute avait ŋa‑ pour « je » (nasale vélaire), et certaines reconstructions du proto-afroasiatique suggèrent *ʔanaku ~ (ʔ)anak pour « je » (où anak pourrait concevablement être segmenté en an- plus un suffixe).

L’égyptien ink « je » a une consonne vélaire k ajoutée.

Mais ce sont des liens spéculatifs – aucune de ces formes ne dérive clairement d’une racine savoir dans ces langues.

Elles pourraient tout aussi bien être des développements internes ou des ajouts (par exemple, le k dans l’égyptien ink est généralement interprété comme un élément copule, pas comme partie de la tige pronominale).

En fin de compte, l’absence de toute piste de cognat « savoir » dans des familles disparates (les mots sino-tibétains pour « savoir » sont entièrement différents, les racines afroasiatiques « savoir » sont différentes, etc.) indique que si une formule « je sais » était la source, elle n’a laissé aucune autre trace linguistique.

Le pronom seul a survécu, dépouillé de sa signification verbale originale – un fantôme de gnō‑ errant dans les langues du monde.

Cela rend l’hypothèse de l’érosion phonétique plutôt non falsifiable (nous pouvons toujours dire « cela s’est produit et a effacé toutes les autres preuves »), mais aussi pas très convaincante pour les linguistes, qui préfèrent qu’un changement soit soutenu par des modèles plus larges.

Comme le notent Bancel et al. avec ironie, fournir des preuves typologiques normales pour un changement sans précédent (comme des termes de parenté ou des verbes devenant des pronoms) est « impossible à satisfaire » car les pronoms ne changent presque jamais de cette manière dans le temps observable.

Évaluation

L’hypothèse d’érosion ǵn > n aborde intelligemment une partie de l’énigme – pourquoi tant de pronoms de première personne partagent une consonne nasale nue.

Elle invoque un mécanisme phonétique concret qui pourrait produire ce résultat à partir d’une forme plus complexe.

Cependant, l’hypothèse échoue sur le plan empirique.

Elle ne s’aligne pas avec les changements sonores réguliers connus (pas de modèle mondial de chute des dorsales avant les nasales en dehors de ce contexte), et elle nécessite un saut de réanalyse grammaticale (verbe → pronom) qui est essentiellement sans précédent dans l’histoire linguistique documentée.

Sans preuve indépendante (comme des mots cognats « savoir » se transformant en pronoms dans plusieurs familles, ou des pronoms fossiles gn‑ dans des textes anciens), nous devons traiter cela comme une histoire intéressante post hoc plutôt qu’un compte rendu vérifié.

Même les partisans de la parenté pronominale à longue portée n’ont pas spécifiquement plaidé pour une origine « je sais » ; ils ont tendance à privilégier les appels de parenté anciens (mama, nana) ou les sons déictiques comme source primordiale.

En résumé, l’idée d’érosion phonétique pourrait expliquer la perte du g (dorsal) si l’on suppose une forme initiale gn‑form, mais elle a du mal à expliquer pourquoi cette forme était là au départ ou comment elle s’est propagée partout.

Elle repose également sur la notion d’une diffusion tardive ou d’un héritage extrêmement ancien d’une seule forme pronominale, que la linguistique dominante trouve difficile à accepter.

Réflexions Conclusives#

Les deux hypothèses – « connaisseur = soi » et érosion gn- – s’aventurent en territoire spéculatif pour résoudre ce qui a été appelé « la conspiration des pronoms » : les tiges pronominales étonnamment similaires trouvées dans le monde entier.

L’hypothèse sémantique s’appuie sur les forces d’évolution culturelle, imaginant qu’une nouvelle idée (le soi en tant que sujet connaissant) a donné naissance à un nouveau pronom qui s’est répandu avec la conscience de soi humaine à la fin de l’ère glaciaire.

L’hypothèse phonétique s’appuie sur les forces internes linguistiques, proposant que différentes langues ont convergé vers un pronom n en raison d’une séquence sonore partagée (gn) s’usant dans un contexte commun (« je sais »).

Il convient de noter qu’une troisième ligne d’enquête (non explicitement demandée ici) a été l’« hypothèse de la parenté », selon laquelle les m, n, t universels des pronoms pourraient finalement dériver de termes de parenté primordiaux comme mama (mère), nana (grand-parent), tata (père) qui ont ensuite été réutilisés comme marqueurs de personne.

Cette hypothèse reconnaît également un manque de preuves intermédiaires (pas de stade clair où « mama » signifiait explicitement « je »), mais souligne que les termes de parenté partagent de manière unique certaines propriétés pragmatiques avec les pronoms (référence changeante selon le locuteur).

Dans tous les cas, nous voyons à quel point l’énigme des pronoms est extraordinaire : l’expliquer peut nécessiter des scénarios extraordinaires – qu’il s’agisse d’une grammaticalisation radicale ou d’un événement mémétique majeur dans la préhistoire humaine.

Les linguistes historiques traditionnels ont tendance à attribuer les ressemblances pronominales mondiales à un mélange de hasard, symbolisme sonore et contraintes physiologiques (par exemple, [m] et [n] sont parmi les consonnes les plus faciles et les plus stables pour les humains, en particulier les nourrissons).

Ils mettent en garde contre l’invocation d’un seul ancêtre il y a ~15 000+ ans, ou d’une diffusion ultérieure, car cela dépasse les limites probantes de la méthode comparative.

En effet, pour envisager sérieusement une diffusion mondiale récente, il faut soit croire que nos ancêtres ont quitté l’Afrique sans pronoms et les ont inventés plus tard, soit accepter que les pronoms peuvent résister au remplacement pendant des dizaines de millénaires – chaque position est controversée.

Les hypothèses discutées ici tentent de donner un sens aux données sans violer les « lois » linguistiques de manière flagrante : l’Hypothèse 1 suggère que les humains n’avaient pas de pronoms de première personne jusqu’à ce qu’une étincelle culturelle les allume (donc pas besoin de préservation ultra-profonde), et l’Hypothèse 2 suggère que les pronoms existaient mais sous une forme différente (résolvant le décalage phonétique par un changement régulier).

Aucune des deux hypothèses n’a de confirmation directe – elles restent des conjectures audacieuses qui stimulent la recherche (et le débat) sur ce que les pronoms peuvent nous dire sur le passé humain.

Pour l’instant, le mystère du pronom N- perdure, nous invitant à imaginer une époque où peut-être un nouveau mot – le mot pour « je » – était la plus grande invention de toutes.

Notes de bas de page#

FAQ#

Q 1. Existe-t-il une langue documentée où « je » s’étymologise littéralement en « connaisseur » ?
R. Aucune langue attestée ne montre une dérivation directe de je à partir de savoir ; la proposition reste entièrement spéculative et n’est pas étayée par des stades intermédiaires ou des chaînes de cognats.

Q 2. Les langues empruntent-elles parfois des pronoms personnels ?
R. Rarement, mais des preuves papoues montrent un emprunt régional du 1sg na, impliquant que la diffusion mémétique des formes pronominales peut se produire sous un contact intense.

Q 3. Pourquoi tant de pronoms utilisent-ils m et n de toute façon ?
R. Ces nasales sont des phonèmes acquis tôt, hautement stables, acoustiquement distincts à faible volume, et peuvent provenir d’appels de parenté infantile comme mama/nana.

Sources#

Soyez riche en sources ! Citez abondamment des sources diverses, y compris des articles académiques, des livres, des articles de presse, des sites Web et des sources primaires. Incluez des hyperliens lorsque disponibles.

Cutler, Andrew. The Unreasonable Effectiveness of Pronouns. Vectors of Mind, 2023.
Bancel, Pierre & Matthey de l’Etang, Alain. “Where Do Personal Pronouns Come From?” Journal of Language Relationship 3 (2010).
Ross, Malcolm. “Pronouns as a Preliminary Diagnostic for Grouping Papuan Languages.” Papers in Papuan Linguistics 2 (1996).
Campbell, Lyle. “American Indian Personal Pronouns: One More Time.” International Journal of American Linguistics 52 (1986): 359-390.
Haspelmath, Martin et al. (eds.). The World Atlas of Language Structures Online (WALS), 2005.
Pagel, Mark et al. “Ultraconserved Words Point to Deep Language Ancestry across Eurasia.” PNAS 110.21 (2013): 8471-76.
Watkins, Calvert. The American Heritage Dictionary of Indo-European Roots. Houghton Mifflin, 2011.
König, Ekkehard & Volker Gast. Reciprocal and Reflexive Constructions. De Gruyter, 2008.
Greenberg, Joseph H. Language in the Americas. Stanford UP, 1987.
Ruhlen, Merritt. On the Origin of Languages. Stanford UP, 1994.
Bowern, Claire. “Limits of the Comparative Method.” Annual Review of Linguistics 4 (2018): 157-178.
Beekes, Robert S.P. Comparative Indo-European Linguistics: An Introduction. John Benjamins, 2011.
Campbell, Lyle & William J. Poser. Language Classification: History and Method. Cambridge UP, 2008.
Substack thread. “Was PIE eg Originally ŋa?” Comments, Vectors of Mind, 2024.
LIV2 (Lexikon der indogermanischen Verben, 2nd ed.). Eds. Helmut Rix et al., 2001.
Bancel, Pierre et al. “Kin Terms as Proto-Pronouns.” Diachronica 37.4 (2020): 537-575.
Wierzbicka, Anna. Semantics, Culture, and Cognition. Oxford UP, 1992.
Schrijver, Peter. “The Reflexes of the Proto-Indo-European First Person Pronoun.” Historische Sprachforschung 110 (1997): 297-314.