Dans un contexte où les urgences des hôpitaux d’un peu partout, au Québec et ailleurs, débordent de patients et manquent de ressources, une nouvelle étude laisse entendre que l’intelligence artificielle (IA) pourrait un jour aider à effectuer un triage des patients, c’est-à-dire évaluer l’état des malades et déterminer qui a besoin d’être vu en premier par un médecin.
En utilisant les dossiers anonymisés de 251 000 adultes ayant visité l’urgence d’un hôpital, des chercheurs de l’Université de Californie, à San Francisco, ont évalué à quel point un modèle d’IA était en mesure d’extraire des informations sur les symptômes d’un patient, à partir des notes cliniques, afin de déterminer s’ils avaient besoin d’être vus immédiatement par le personnel médical.
Les chercheurs ont ensuite comparé cette analyse de l’IA aux cotes des patients sur une échelle de sévérité des besoins utilisée par des infirmières, à l’urgence, pour évaluer la gravité des besoins.
Les résultats des travaux ont été publiés dans le magazine spécialisé JAMA Network Open. Les chercheurs ont évalué les données médicales à l’aide du modèle langagier de ChatGPT-4, le tout via une plateforme disposant d’importantes barrières visant à protéger la vie privée.
Les scientifiques ont ainsi testé la performance du modèle langagier avec un échantillon de 10 000 paires de patients, soit 20 000 malades au total, la moitié souffrant d’un problème grave, comme un accident vasculo-cérébral, et l’autre d’un problème moins urgent, comme un poignet cassé.
En n’utilisant que les symptômes des patients, l’IA a été en mesure d’identifier quel malade, au sein de chaque groupe de deux, souffrait du problème le plus grave, et ce, 89% du temps.
Et avec un sous-échantillon de 500 paires évalué à la fois par un médecin et l’IA, celle-ci a posé le bon diagnostic 88% du temps, contre 86% pour le docteur.
Au dire des chercheurs, l’utilisation de l’IA pour aider au triage des patients pourrait aider les médecins à obtenir plus de temps pour traiter les malades qui en ont le plus besoin, tout en offrant un outil d’aide à la prise de décision pour les praticiens de la santé qui doivent gérer plusieurs urgences.
« Imaginez deux patients qui doivent être transportés à l’hôpital, mais qu’il n’y ait qu’une seule ambulance de disponible. Ou un médecin est sur appel et trois personnes réclament ses services en même temps, et il faut alors déterminer à qui répondre en premier », mentionne le principal auteur des travaux, Christopher Williams.
Pas encore une solution clé en main
Cette étude est l’une des rares à évaluer un modèle langagier en utilisant de véritables données cliniques, plutôt que des scénarios simulés, et est la première à s’appuyer sur plus de 1000 cas cliniques. Toujours au dire des scientifiques, il s’agit aussi de la première étude à se servir de données découlant de visites à l’urgence, où l’on trouve une vaste gamme de conditions médicales.
Malgré le succès de l’étude, M. Williams affirme que l’IA n’est pas prête à être employée de façon responsable à l’urgence, sans une validation supplémentaire et des études cliniques.
« C’est bien de voir que l’IA puisse accomplir des choses intéressantes, mais il est surtout important de déterminer qui obtient de l’aide et qui est entravé par cette technologie », a-t-il déclaré.
« Est-ce que le simple fait de pouvoir accomplir quelque chose est la seule étape à franchir en vue de l’utilisation de l’IA, ou faut-il pouvoir accomplir quelque chose de bien, pour tous les genres de patients? »
Au dire du chercheur, l’un des enjeux importants est l’élimination des biais présents dans le modèle. De précédentes études ont démontré que ces modèles pourraient perpétuer des biais raciaux et genrés, en raison de biais inclus dans les données servant à leur apprentissage. Selon M. Williams, avant que ces modèles puissent être utilisés, ils devront être modifiés pour en faire disparaître les biais.
« Tout d’abord, nous devons savoir si « cela » fonctionne, et comprendre comment « cela » fonctionne, puis faire preuve de prudence et agir de façon délibérée dans la façon dont nous appliquons la technologie », a encore déclaré M. Williams. « De futurs travaux se pencheront sur les meilleures méthodes pour déployer cette technologie dans un environnement clinique. »