Tel que prouvé par certains incidents particulièrement controversés, comme le scandale impliquant Facebook et Cambridge Analytica, les médias sociaux peuvent représenter une véritable mine d’or en matière d’informations personnelles. De fait, des chercheurs d’un peu partout dans le monde ont tenté de développer des outils pour analyser l’activité sur les médias sociaux et récupérer automatiquement des informations sur les positions des internautes sur divers sujets.
Dans le cadre d’une récente étude, des scientifiques de l’Université d’Édimbourg ont cherché à établir certains des principaux facteurs qui aident à déterminer les prises de position des individus en s’appuyant sur leur profil sur les médias sociaux. Leurs résultats, pré-publiés sur le serveur de recherche arXiv, offrent une nouvelle avenue qui pourrait mener à la mise au point de nouveaux outils d’analyse.
« La prédiction des opinions sur les médias sociaux joue un rôle essentiel dans le cadre de plusieurs analyses visant à évaluer l’opinion publique à propos de divers sujets », mentionne ainsi Abeer Aldayel, l’une des chercheuses qui ont participé à l’étude, dans le cadre d’un entretien avec la publication TechXplore.
« Ces derniers temps, les études ont proposé plusieurs méthodes pour modéliser la prise de position sur les médias sociaux. Nos travaux portent sur la façon dont la position des gens sur divers sujets peut être prédite à partir de données provenant des médias sociaux, en utilisant plusieurs signaux d’interactions en ligne », a-t-il poursuivi, en soulignant que l’ensemble de la chose faisait ressortir des craintes concernant la protection de la vie privée.
« Nous espérons que cette étude servira à mieux faire comprendre aux internautes comment leur activité en ligne peut être utilisée. »
Pour mieux comprendre ces signaux numériques qui peuvent révéler le point de vue d’un utilisateur à propos d’un événement ou d’un sujet, les chercheurs ont effectué une étude en profondeur d’un ensemble de données déjà fort utilisé, appelé ensemble SemEval. Celui-ci contient 4000 tweets à propos de cinq sujets politiques, sociaux et religieux.
Dans le cadre de l’évaluation des facteurs en ligne guidant les avis des internautes, Mme Aldayel et ses collègues se sont intéressés à trois d’entre eux, soit les « réseaux d’interactions », qui regroupent les comptes et les domaines web avec lesquels interagit l’utilisateur, ou que ce dernier cite dans ses tweets; les « réseaux de préférence », soit les interactions indirectes avec d’autres comptes et domaines contenus dans les tweets « aimés » par l’internaute, et le « réseau de connexion », qui rassemble tous les comptes qui suivent l’utilisateur en question, et tous ceux auxquels ce même internaute est abonné.
« Il est bon de noter que ces facteurs ne dépendent pas du fait que les internautes expriment bel et bien leur avis sur le sujet analysé, puisque ces facteurs dépendent des interactions sociales et des sites web avec lesquels interagit l’internaute, et ce sans tenir compte du contenu de ses tweets », a expliqué Mme Aldayel.
Les résultats obtenus par les chercheurs portent à croire que l’avis d’un internaute peut être déterminé en analysant plusieurs aspects de son activité en ligne, y compris les publications sur les médias sociaux, les comptes avec lesquels on note des interactions, les sites visités, et les contenus « aimés ».
« Notre étude démontre clairement, via l’utilisation de fonctionnalités liées aux réseaux en ligne, comment il est possible de prédire des points de vue non exprimés en s’appuyant sur divers signaux », mentionne encore Mme Aldayel. « La plupart des facteurs décisifs peuvent parfois n’être aucunement liés au sujet de l’analyse, tout en ayant un impact important sur le processus de prise de position. Par exemple, des interactions avec des comptes tels que @GoodReads et @SkyNews aident à détecter une position favorable au mouvement féministe et à la lutte contre les changements climatiques, respectivement. »
La prochaine étape, mentionne la chercheuse, consiste non seulement à développer des outils d’analyse encore plus efficaces, mais surtout à faire prendre conscience aux internautes qu’il n’est pas toujours nécessaire d’exprimer clairement une opinion sur un sujet pour donner son avis. De là l’importance de surveiller ce que l’on dit en ligne, il n’y a qu’un pas.