Dans le cadre de deux études récemment publiées, des chercheurs en informatique de l’Université du Luxembourg, accompagnés de partenaires internationaux, affirment que les mouvements de la souris, à l’ordinateur, peuvent être utilisés pour obtenir des informations supplémentaires sur le comportement de l’utilisateur. Ces informations pourraient même compter le sexe ou l’âge des personnes aux commandes.
Les chercheurs disent ainsi vouloir attirer l’attention à propos de ces possibles enjeux en matière de protection de la vie privée, et ont proposé des mesures pour limiter les risques.
Selon le professeur Luis Leiva, de l’Université du Luxembourg, « nous avons démontré à quel point il est aisé d’obtenir des données à grande échelle à propos des utilisateurs, en suivant les mouvements de leur curseur sans se montrer intrusif, et ainsi prédire les caractéristiques démographiques de façon assez précise, le tout en utilisant seulement cinq lignes de code ».
« Pendant des années, l’enregistrement des mouvements de la souris sur les sites web a été facile; mais pour les analyser, il fallait posséder une expertise importante en informatique et en apprentissage machine. Aujourd’hui, il existe plusieurs méthodes d’y parvenir avec un minimum de connaissances en programmation, et ainsi créer des classifications assez sophistiquées. Cela mène à des enjeux en matière de vie privée et les utilisateurs ne possèdent pas de façon simple de se soustraire à tout cela. »
En s’appuyant sur leurs résultats, l’équipe a mis au point une méthode visant à empêcher le suivi des mouvements de la souris en déformant les coordonnées de celle-ci en temps réel. « Nous nous sommes inspirés de récents travaux sur l’apprentissage machine, et le tout est disponible sous la forme d’un greffon pour navigateur web; tout le monde peut donc profiter de ces travaux de façon pratique », explique M. Leiva.
Ledit greffon est disponible sur le répertoire de code Github, sous le nom MouseFaker.
Faire des choix
Malgré tout, le suivi des mouvements de la souris s’est avéré très pratique pour les gestionnaires de sites web, particulièrement pour les moteurs de recherche.
L’un des coauteurs de l’étude, le Dr Ioannis Aparakis, précise que « lorsque vous cherchez quelque chose sur Google ou Bing, les mouvements de votre souris envoient un tout petit signal au moteur de recherche, en indiquant si vous êtes intéressé ou non dans le contenu que l’on vous présente. Puisque l’enregistrement des mouvements de la souris peut entraîner des problèmes en matière de protection de la vie privée, nous avons cherché à savoir s’il était possible d’enregistrer une seule partie des mouvements, histoire de voir si cela permet toujours de déterminer comment les gens effectuent leurs choix sur le web ».
L’équipe a analysé trois scénarios où les internautes devaient faire un choix sur des moteurs de recherche: lorsqu’ils aperçoivent une publicité, lorsqu’ils quittent la page, et lorsqu’ils deviennent frustrés. Les résultats sont intéressants, écrivent les chercheurs: si les internautes portent attention à une publicité, cela sera signalé par les mouvements initiaux de la souris. Dans le cas d’un « abandon » d’une page, ce sera en fait l’opposé: les derniers mouvements informent à propos de la volonté, ou non, d’un utilisateur de quitter un site, qu’ils soient satisfaits ou non des résultats, sans avoir à cliquer sur quoi que ce soit. Et lorsqu’ils sont frustrés, les mouvements indicateurs des internautes sont mixtes, mais il semblerait que ce soit les mouvements mitoyens d’une souris qui fournissent le plus d’informations sur les intentions des utilisateurs.
Les chercheurs ont constaté qu’il était possible de prédire ces tâches en utilisant parfois à peine deux ou trois secondes des mouvements de la souris. Ils en concluent donc qu’en observant uniquement ces sections intéressantes, les moteurs de recherche pourraient obtenir des informations utiles et améliorer leurs services, tout en respectant la vie privée des internautes.
Selon le Pr Leiva, « en enregistrant efficacement la bonne quantité de données sur les mouvements, nous pouvons éviter de consommer de la bande passante et de l’espace de stockage, respecter la vie privée des internautes, et accroître la vitesse à laquelle les modèles d’apprentissage machine peuvent être formés et mis en service. En tenant compte de la taille du web, agir de la sorte aura un avantage certain pour notre environnement ».