Wikipédia est la plus grande plateforme permettant d’accéder gratuitement à divers savoirs, mais, dans le cadre d’une nouvelle étude, des chercheurs de l’École polytechnique fédérale de Lausanne (EPFL), en Suisse, ont découvert que plus d’1 article sur 10 (15%) était inaccessible aux internautes navigant déjà sur l’encyclopédie en ligne.
Pour contrer ce problème, les auteurs de l’étude disent avoir conçu un outil spécialisé. Leurs résultats sont publiés sur le serveur arXiv.
Avec plus de 60 millions d’articles offerts en plus de 300 langues, le contenu de Wikipédia augmente constamment à un rythme d’environ 200 000 nouveaux articles chaque mois. Les gens qui s’y aventurent découvrent souvent de nouvelles informations et poursuivent leur exploration en cliquant sur des liens qui lient un article à un autre. Mais qu’en est-il des articles de l’encyclopédie qui ne sont liés à aucun autre document?
Ceux-ci sont souvent surnommés « articles orphelins », et pour mieux comprendre ce phénomène, des chercheurs de l’EPFL, en collaboration avec l’équipe de recherche de la Fondation Wikimedia, qui englobe Wikipédia, ont mené la première étude systématique des articles en question, dans l’ensemble des 319 versions langagières de l’encyclopédie qui existaient au moment des travaux.
« Wikipédia est un réseau à l’instar des routes, du web, des composés chimiques, ou des gènes, et chaque réseau possède un concept de navigabilité, pour qu’il soit possible de se rendre d’un endroit à un autre. Les réseaux d’informations sont organisés en hiérarchies spéciales, et nous voulions comprendre ce phénomène d’articles qui n’est pas rejoignable par quiconque. C’est pour cela que nous nous sommes penchés sur les articles orphelins », a déclaré Akhil Arora, le principal auteur de l’étude.
Les chercheurs ont ainsi constaté que près de neuf millions d’articles, soit environ 15% du total, étaient orphelins, et donc fondamentalement invisibles pour les internautes se trouvant déjà dans les pages de l’encyclopédie, et ce, à travers quasiment tous les sujets abordés sur la plateforme.
En général, les articles non-orphelins recevaient environ le double des clics des articles orphelins. Au-delà de la simple corrélation, les auteurs des travaux ont également établi une relation cause à effet entre l’ajout de liens internes, dans les articles orphelins, et l’augmentation de leurs visites.
L’absence de visibilité de ces articles découle de la façon dont bien des internautes utilisent les outils de recherche, ainsi qu’à la méthode utilisée pour lire des pages sur le site de l’encyclopédie.
Les premiers passent par des moteurs de recherche, sur lesquels les internautes sont dirigés vers une page Wikipédia spécifique; la seconde méthode est liée au fait que les visiteurs utilisent le site comme une encyclopédie, en cliquant d’un article à un autre.
Une troisième méthode est le résultat du mélange des deux premières.
La traduction à la rescousse
« Un éditeur modifie quelque chose à propos d’un sujet qu’il connaît, alors il est facile d’ajouter des liens vers l’extérieur », a déclaré M. Arora. « L’inverse ajoute un grand nombre d’obstacles, parce que l’éditeur en question pourrait ne pas être un expert à propos d’autres sujets et articles; parfois, ces relations ne sont pas symétriques et Wikipédia est un univers gigantesque. »
L’étude a permis de révéler des différences importantes entre les langues. Dans plus de 100 d’entre elles, le pourcentage d’articles orphelins dépasse les 30%; ce taux bondit à 78% pour l’arabe égyptien, ou encore à 50% pour le Vietnamien. Les versions de l’encyclopédie dans ces langues font pourtant partie des 20 déclinaisons les plus importantes du site.
Selon les auteurs des travaux, cela démontre l’existence d’un manque de rédacteurs et de réviseurs dans certaines langues, en plus du besoin d’améliorer des outils déjà disponibles.
Par ailleurs, il est apparu qu’un article orphelin, dans une langue, ne l’est pas nécessairement dans d’autres. Les chercheurs croient qu’à l’aide de la traduction de liens, il est donc possible de s’attaquer aisément au prolbème.
De faire, dit M. Arora, utiliser cette méthode a permis de suggérer de possible liens pour des articles orphelins « dans plus de 63% des cas ».