Des chercheurs de l’Université du sud de la Californie ont utilisé des technologies liées à l’intelligence artificielle pour conclure que les personnages masculins étaient quatre fois plus nombreux que leurs équivalents féminins dans la littérature.
L’un des auteurs de l’étude, Mayank Kejriwal, dit avoir été inspiré par des travaux récents en matière de biais de genre implicites, ainsi que par sa propre expertise à propos du traitement automatique du langage naturel, qui permet de créer des outils de traitement de la langue naturelle à diverses fins. Si plusieurs études déjà publiées évaluent et analysent les aspects quantitatifs de la représentation des femmes dans la littérature et dans les produits médiatiques, ces nouveaux travaux se sont surtout appuyés sur la collecte de données quantitatives à l’aide d’algorithmes d’apprentissage machine.
Pour obtenir ces résultats, M. Kejriwal et son collègue Akarsh Nagaraj ont utilisé des données du Projet Gutenberg, qui contient l’équivalent de 3000 livres en langue anglaises. Le type de livres allait de la romance à la science-fiction, en passant par le mystère et le roman d’aventure, le tout sous diverses formes que ce soit des romans, des nouvelles, ou encore de la poésie.
« Le biais genré est tout à fait réel, et lorsque nous voyons que les femmes sont quatre fois moins présentes dans la littérature, cela a un impact subliminal sur les gens qui consomment de la culture », mentionne M. Kejriwal. « Nous avons révélé, de façon quantitative et indirecte, quels biais sont toujours bien présents dans notre culture. »
Selon M. Nagaraj, « les livres sont une fenêtre sur le passé, et les écrits de ces auteurs nous offrent un aperçu de la façon dont les gens perçoivent le monde, et comment celui-ci a évolué ».
Des hommes partout… et à l’avant-plan
L’étude détaille plusieurs méthodes servant à évaluer la prévalence des femmes dans la littérature. Les chercheurs se sont tournés vers une pratique consistant à détecter les personnages dont le genre est clairement défini. « L’une des façons de parvenir à notre objectif consistait à compter le nombre de pronoms féminins dans un livre, par rapport aux pronoms masculins », a indiqué M. Kerjiwal.
L’autre technique employée consiste à quantifier le nombre de femmes qui font office de personnage principal dans les ouvrages.
Ultimement, cela a permis aux spécialistes d’évaluer si les personnages masculins étaient essentiels à l’histoire.
L’étude a également révélé que cet écart entre les personnages masculins et féminins diminue lorsque les récits sont écrits par des femmes. « Il a clairement été démontré que les femmes se mettaient davantage en scène, comparativement à ce que feraient des auteurs », a précisé M. Nagaraj.
L’équipe de recherche reconnaît qu’il existe toutefois des limites à ses méthodes pour évaluer la représentation féminine dans les livres. Notamment lorsque les auteurs ne sont ni des hommes, ni des femmes. M. Kejriwal a d’ailleurs noté qu’il serait très difficile, voire impossible, en utilisant ces deux techniques de recherche, de tomber sur un texte écrit par une personne transgenre.
De fait, le chercheur a rappelé qu’il n’existait pas encore d’outils liés à l’intelligence artificielle qui permettent de détecter le pronom they, en anglais (ou iel en français, par exemple, NDLR). Malgré tout, juge-t-il, l’étude permet de s’attaquer à certains problèmes sociaux, juge-t-il.
L’étude a aussi permis de construire un champ lexical associé à chaque type de personnage, encore une fois avec des biais souvent évidents. Ainsi, les personnages féminins étaient généralement décrits comme « faibles », « aimables », « jolis », voire parfois « stupides », alors que les hommes, eux, étaient décrits comme des « leaders », des personnes « puissantes » et « fortes », en plus d’être associés à la politique, notamment.