Une équipe de chercheurs provenant entre autres de l’Université de Sydney s’est tournée vers l’intelligence artificielle pour mettre au jour plus de 160 000 nouveaux virus à ARN. Selon les spécialistes, cette découverte permettra de mieux comprendre cette branche essentielle du vivant.
« On nous a offert un aperçu d’un pan habituellement caché de la vie sur Terre, révélant au passage une biodiversité remarquable », soutient le principal auteur de l’étude, le professeur Edwards Holmes.
Les résultats sont publiés dans Cell.
« Il s’agit du plus grand nombre de virus découvert dans le cadre d’une seule étude, et cela vient largement accroître nos connaissances des virus qui nous entourent », a poursuivi le Pr Holmes.
« Trouver autant de virus d’un coup est incroyable, et cela n’est qu’une petite partie de l’ensemble. Il y en a des millions d’autres qui attendent d’être découverts, et nous pouvons utiliser la même approche pour identifier des bactéries et des parasites. »
Comme l’écrivent les chercheurs, si les virus à ARN sont habituellement associés aux maladies humaines, on les retrouve aussi dans les environnements extrêmes, un peu partout sur la planète. Dans le cadre de l’étude, ils ont ainsi été détectés dans l’atmosphère, dans des sources thermales, ainsi que dans des conduites hydrothermales.
« Le fait que les environnements extrêmes contiennent autant de virus n’est qu’un autre exemple de leur diversité phénoménale, ainsi que de leur ténacité à vivre dans les conditions les plus dangereuses, ce qui pourrait nous donner des indices concernant l’apparition des virus et d’autres formes de vie fondamentales », a déclaré le Pr Holmes par voie de communiqué.
Faire la lumière
Les chercheurs ont conçu un algorithme d’apprentissage machine, LucaProt, pour traiter de vastes quantités de données génétiques, y compris des génomes de virus contenant jusqu’à plus de 47 000 nucléotides, ainsi que des informations génomiques complexes, afin de découvrir les plus de 160 000 virus.
« La vaste majorité de ces virus avaient déjà été séquencés et se trouvaient dans des bases de données publiques, mais ils étaient si divergents que personne ne savaient ce qu’ils étaient », a encore dit Edwards Holmes.
« Il s’agissait de ce que nous appelons de la « matière noire » de séquence génétique. Notre IA a été en mesure d’organiser et de catégoriser toutes ces informations disparates, jetant ainsi un nouvel éclairage sur cette « matière sombre » pour la première fois. »
De l’avis des spécialistes, procéder de la sorte à l’aide de méthodes traditionnelles prendrait énormément de temps.
Au dire du professeur Mang Shi, coauteur de l’étude, « nous disposons maintenant d’un modèle basé sur l’IA qui est doté d’une sensibilité et d’une spécificité exceptionnelles, tout en nous permettant d’explorer encore plus la diversité virale ».
« La prochaine étape consiste à affiner notre système pour découvrir d’autres pans de la biodiversité. Qui sait ce qui nous attend? », renchérit le Pr Holmes.