Quatre cents langues parlées par trois milliards de personnes dans le monde appartiennent à la même famille, celle des langues indo-européennes. Des scientifiques croient avoir résolu le mystère de son origine.
La famille des langues indo-européennes regroupe des langues parlées par la moitié de la population mondiale. Elle comprend entre autres le français, l’anglais, le russe, le gaélique, l’hindi et le punjabi. Les langues de certains peuples anciens comme les Romains, les Hittites ou les Mycéniens faisaient aussi partie de cette famille.
Toutes ces langues dériveraient d’une seule et même langue, le proto-indo-européen, mais les linguistes ne s’entendent pas sur son origine. Certains croient qu’elle aurait été parlée pour la première fois il y a 8 000 à 9 000 ans par un peuple d’agriculteurs vivant dans la région du croissant fertile et de l’Anatolie, au sud du Caucase. Selon une deuxième hypothèse, ce serait plutôt des tribus de cavaliers kourganes vivant dans la steppe pontique (aujourd’hui la Bulgarie, la Roumanie, la Moldavie, l’Ukraine, la Russie et le Kazakhstan) qui auraient propagé leur langue à travers l’Europe il y a 5 000 à 6 000 ans.
Une équipe internationale de chercheurs, sous la direction des anthropologues Russel Gray et Paul Heggarty, a toutefois trouvé moyen de réconcilier ces deux hypothèses dans un article publié récemment dans la revue Science. Selon cette étude, le proto-indo-européen aurait bien vu le jour il y a plus de 8 100 ans au sud du Caucase. Il aurait ensuite divergé en plusieurs branches qui se seraient propagées au Proche-Orient et en Asie, en même temps que l’agriculture. L’une de ces branches aurait rejoint la steppe où elle aurait donné naissance aux différentes langues européennes il y a environ 5000 ans.
Pour arriver à cette conclusion, les auteurs de l’étude et 80 spécialistes en linguistique ont développé une banque de 25 918 mots d’origine indo-européenne ayant une racine commune. Ces mots provenaient de 161 langues dont 52 aujourd’hui disparues. C’est à partir de ces données que les chercheurs ont pu générer un arbre représentant l’évolution des langues indo-européennes.
La biologie à la rescousse de la linguistique
Depuis le début des années 2000, Russel D. Gray a recours à des méthodes utilisées normalement en biologie de l’évolution pour établir les liens entre les espèces, mais il s’en sert plutôt pour réaliser l’arbre évolutif des langues indo-européennes. Cette approche permet selon lui d’estimer à quel moment les langues ont divergé tout en tenant compte de la vitesse d’évolution de chacune, des emprunts à d’autres langues et de certaines particularités qui pourraient venir fausser les résultats. Il peut aussi calculer le degré de plausibilité de l’arbre obtenu.
L’étude de l’évolution des langues fait d’ailleurs appel à plusieurs disciplines scientifiques comme l’archéologie, l’anthropologie et la génétique. Par exemple, des analyses d’ADN peuvent aider à établir d’où provenaient les peuples qui utilisaient ces langues alors que les données archéologiques permettent de mieux comprendre comment certaines technologies se sont propagées dans le monde et d’estimer ainsi les mouvements migratoires qui ont propagé ces langues en Europe et en Asie.