Un duo de chercheurs, l’un de l’Université de Rochester, l’autre de l’Université de Californie, a découvert que combiner toutes les données nécessaires pour stocker et utiliser la langue anglaise dans le cerveau nécessitait environ 1,5 mégaoctet de stockage, soit l’équivalent d’une disquette.
Dans leur étude publiée dans Royal Society Open Science, Francis Mollica et Steven Piantadosi ont décrit leur application de la théorie de l’information pour calculer l’espace de stockage nécessaire pour les divers aspects du dialecte de Shakespeare.
Pendant leur jeunesse, les humains commencent à acquérir et à parler la langue des gens qui les entourent – comment cela se produit est encore un mystère, mais les scientifiques savent que cela implique bien davantage que de simplement emmagasiner des mots et leur définition, à la manière d’un dictionnaire. Il existe des liaisons rattachées aux mots, par exemple le concept de vol associé au mot « oiseau », ou même « aile », ou encore « moineau ». Il existe également de l’information qui indique au cerveau comment prononcer un mot et la façon dont il peut ou ne peut pas être utilisé avec d’autres mots, et les sons qui forment un mot lorsqu’il est prononcé.
Au cours de leurs travaux, MM. Mollica et Piantadosi ont cherché à convertir toutes les façons dont notre cerveau peut stocker un langage en un nombre de données. Pour y parvenir, ils ont employé la théorie de l’information, une spécialisation mathématique qui se concentre sur la façon dont les informations sont codées à l’aide de séquences de symboles.
Les scientifiques ont ainsi assigné des estimations de taille aux différents aspects de la langue anglaise. Ils ont commencé par analyser les phonèmes, les sons qui s’additionnent pour former des mots parlés. Les deux hommes ont ainsi noté que les humains utilisaient approximativement 50 phonèmes et ont théorisé que chacun d’entre eux nécessitait environ 15 bits d’information pour les stocker. Passant ensuite au vocabulaire, ils ont estimé qu’un individu moyen connaissait environ 40 000 mots, soit un total d’environ 12 millions de bits.
Les chercheurs ont par ailleurs noté que la fréquence des mots était importante; ils ont ainsi ajouté 80 000 bits pour cet aspect. Enfin, le calcul a aussi tenu compte des règles de syntaxe – avec 700 bits supplémentaires. Au total, la langue anglaise, son vocabulaire et ses règles représenterait 1,56 mégaoctet, soit approximativement l’espace de stockage nécessaire pour emmagasiner une seule image numérique.
La faible place des femmes en science en influence les résultats
Un commentaire
Pingback: Les archéologues affrontent eux aussi les fausses nouvelles - pieuvre.ca