Médor a-t-il dit wouf, woof, ou arf? Si l’on cherche depuis toujours à comprendre ce que le meilleur ami de l’homme tente de nous dire, des chercheurs de l’Université du Michigan jugent que l’IA pourrait, avec des outils spécialisés, identifier les aboiements pour y détecter une volonté de jouer, ou encore un ton agressif.
Ces mêmes modèles informatiques peuvent aussi recueillir d’autres informations à partir des vocalisations animales, comme son âge, sa race et son sexe.
Ainsi, en collaboration avec deux instituts de recherche mexicains, les chercheurs ont découvert que les modèles d’IA d’abord « formés » avec le langage parlé humain peuvent servir de point de départ pour « entraîner » de nouveaux systèmes articulés autour de la communication animale.
Les résultats des travaux, qui n’ont pas encore été révisés par les pairs, sont disponibles sur le serveur de prépublication arXiv.
« En utilisant les modèles de traitement du langage d’abord formé avec des dialogues humains, notre recherche permet de s’appuyer sur nos avancements dans le domaine pour commencer à comprendre les nuances contenues dans les aboiements des chiens », affirme ainsi Rada Mihalcea, l’une des responsables de l’étude.
« Il y a tant de choses que nous ne savons pas encore, à propos des animaux qui partagent la planète avec nous. Des avancées en intelligence artificielle peuvent servir à révolutionner notre compréhension de la communication animale, et nos conclusions portent à croire qu’il ne serait peut-être pas nécessaire de partir de rien. »
Parmi les principaux obstacles au développement de modèles d’IA qui peuvent analyser les vocalisations animales, on trouve l’absence de données en libre accès. S’il existe de nombreuses ressources et opportunités pour enregistrer la parole humaine, colliger le même genre d’informations auprès d’animaux est bien plus difficile.
« Les vocalisations animales sont, sur le plan logistique, bien plus difficiles à solliciter et enregistrer », soutient Artem Abzaliev, principal auteur de l’étude. « Celles-ci doivent être enregistrées de façon passive, dans la nature, ou, dans le cas d’animaux domestiques, avec la permission des propriétaires. »
En raison de cette pénurie de données utilisables, les techniques d’analyse des vocalisations des chiens se sont avérées difficiles à mettre au point, et celles qui existent sont limitées par, justement, le manque d’informations disponibles. Les chercheurs ont surmonté cet obstacle en convertissant un modèle déjà existant qui servait, à la base, à analyser notre propre discours.
Cette approche a permis aux chercheurs de s’appuyer sur les modèles robustes qui forment la base des différentes technologies activées par la voix que nous utilisons quotidiennement, comme la composition vocale et la traduction simultanée. Comme le rappellent les auteurs des travaux, ces modèles sont formés pour effectuer des distinctions entre les différentes nuances du langage humain, comme le ton et l’accent, et convertir cette information en un format qu’un ordinateur peut utiliser afin d’identifier les mots prononcés, reconnaître la personne qui parle, etc.
« Ces modèles sont capable d’apprendre et d’encoder les structures extrêmement complexes du langage humain », rappelle M. Abzaliey. « Nous voulions voir s’il était possible de transposer cette habileté, afin de détecter et interpréter les aboiements. »
Un taux de réussite étonnant
Les chercheurs se sont appuyés sur un échantillon de vocalisations enregistrées auprès de 74 chiens appartenant à diverses races, âges et sexes, le tout dans un ensemble de contextes variés. Ces enregistrements ont ensuite servi à améliorer un modèle d’apprentissage machine, à l’aide duquel les auteurs des travaux ont pu générer des représentations des données acoustiques recueillies auprès des chiens, puis interpréter ces représentations.
Les scientifiques ont ainsi découvert que leur modèle d’analyse, d’abord conçu pour les humains, avait non seulement réussi à accomplir quatre tâches liées à la classification, mais avait aussi réussi à être plus efficace que d’autres modèles d’apprentissage machine spécifiquement entraînés avec des données liées aux aboiements, avec une efficacité pouvant atteindre 70%.
Aux yeux des chercheurs, cette meilleure compréhension des « messages » des animaux aura des impacts positifs sur nos compagnons velus, puisque nous serons davantage en mesure de répondre à leurs besoins, et éviter des situations potentiellement dangereuses.