L’internet a beau être un répertoire immensément vaste du savoir humain, avec des centaines de milliards de pages indexées, mais même si les internautes s’appuient sur cet ensemble d’informations pour accéder à divers types de ressources numériques, ce contenu disparaît parfois sans laisser de traces.
Une récente enquête du Pew Research Center vient d’ailleurs donner une idée de l’ampleur de ce lent glissement dans le néant électronique, et le phénomène est particulièrement important.
Ainsi, le quart des pages web ayant existé entre 2013 et 2023 ne sont plus accessibles, aujourd’hui. Dans la plupart des cas, affirme-t-on, cela s’explique par le fait que les pages en question ont été effacées ou retirées de sites web qui, autrement, demeurent accessibles.
Mais la tendance s’accélère pour les contenus plus anciens: pour les pages qui étaient en ligne en 2013, le taux de disparition ou d’impossibilité d’accès atteint 38%, soit plus d’une page sur trois. À l’opposé, seulement 8% des contenus en ligne, l’an dernier, ne le sont plus, un an plus tard.
De façon plus précise, l’analyse révèle que près d’une page d’un média sur quatre (23%) contient au moins un hyperlien « brisé », tout comme c’est le cas pour 21% des pages liées à des sites gouvernementaux.
D’ailleurs, chez ces derniers, ce sont les sites municipaux qui sont les moins bien entretenus, indiquent les auteurs de l’étude.
Sur Wikipédia, ce sont 54% des articles qui contiennent au moins l’un de ces liens « brisés », dans leur section ‘Références ».
Au total, 11% de toutes les références listées sur ce site ne sont plus accessibles.
Incertitude du côté des tweets
Si l’on peut penser que ce qui est publié sur internet y demeure éternellement, cela ne semble pas être le cas pour certains contenus. La chose, écrit le Pew Research Center, est particulièrement vraie pour les tweets, publiés sur le célèbre réseau social. Dans une période de trois mois, soit entre la période de mars-avril 2023 et le 15 juin de la même année, près d’un message sur cinq (18%) avait disparu. Ou, du moins, ces tweets n’étaient plus visibles par le public.
Ces messages étaient souvent rédigés en des langues spécifiques, notamment le turc, ou encore l’arabe – près de la moitié de ceux-ci ont ainsi disparu des yeux du public en moins de trois mois, affirment les chercheurs.
Les publications provenant de compte possédant toujours la photo de profil par défaut (« l’oeuf » de Twitter), ainsi que celles provenant de comptes non vérifiés (les utilisateurs n’ayant pas payé pour le service, notamment) étaient elles aussi rapides à disparaître.
Au total, 1% des tweets ne sont plus accessibles, moins de 60 minutes après leur publication; 3% sont inaccessibles après moins d’une journée, 10% à l’intérieur d’une semaine, et 15% en moins d’un mois.
L’étude a aussi révélé un phénomène étonnant: 6% des tweets disparus sont devenus accessibles après un certain temps. Cela pourrait s’expliquer, dit-on, par le passage d’un compte en mode « privé », puis un retour en mode « public », ou par la suspension et la restauration subséquente d’un compte.