Google a déployé depuis le début de l’année une intelligence artificielle appliquée à la santé baptisée AMIE, ou Automated Medical Inquiry Engine. Présentation.
Les progrès récents des grands modèles de langage (LLM) ont montré qu’ils peuvent planifier, raisonner et utiliser le contexte pertinent pour tenir des conversations riches. Cependant, de nombreux aspects du bon dialogue diagnostique sont uniques au domaine médical. Bien que les LLM puissent accomplir des tâches telles que la synthèse médicale ou répondre à des questions médicales, peu de travaux ont été spécifiquement orientés vers le développement de ces capacités de dialogue diagnostique.
Google est très présent dans le monde de la santé au niveau de la recherche, du parcours de soin ou du suivi des pathologies au quotidien. Google poursuit ses travaux en en ce sens avec le lancement en 2024 de AMIE (Automated Medical Inquiry Engine), un système de recherche en intelligence artificielle développé par Google Research.
Conçu pour améliorer les dialogues diagnostiques médicaux, AMIE s’appuie sur des modèles de langage large (LLM) optimisés pour la raison diagnostique et les interactions. Grâce à un environnement de dialogue simulé basé sur l’auto-apprentissage et des mécanismes de feedback automatisés, AMIE vise à enrichir ses compétences à travers diverses conditions médicales et contextes.
AMIE se compose de deux principales composantes : un moteur de raisonnement médical diagnostique et un système de dialogue conversationnel.
Le moteur de raisonnement médical diagnostique d’AMIE utilise des techniques d’IA avancées, notamment l’apprentissage automatique et le traitement du langage naturel, pour analyser les symptômes et les antécédents médicaux des patients afin de générer des hypothèses de diagnostic potentielles. Il peut également suggérer des examens complémentaires ou des tests à réaliser pour confirmer ou infirmer ces hypothèses.
Le système de dialogue conversationnel d’AMIE permet aux professionnels de santé d’interagir naturellement avec le système, en leur posant des questions et en les aidant à mieux comprendre les patients. AMIE peut ainsi les assister dans la collecte d’informations médicales importantes auprès des patients, en clarifiant les symptômes et en posant des questions pertinentes.
Les tests réalisés sur AMIE ont montré des résultats prometteurs. Le système a démontré des performances élevées dans l’identification d’hypothèses de diagnostic pertinentes, tout en maintenant une communication fluide et naturelle avec les utilisateurs. Il a le potentiel d’améliorer l’efficacité et la productivité des professionnels de santé en les aidant dans le processus de diagnostic médical.
Google a conçu une étude croisée randomisée, en double aveugle, de consultations textuelles avec des acteurs-patients validés interagissant soit avec des médecins généralistes certifiés, soit avec le système d’IA optimisé pour le dialogue diagnostique. Les consultations ont été réalisées dans le style d’un examen clinique structuré objectif (OSCE), une évaluation pratique couramment utilisée dans le monde réel pour examiner les compétences des cliniciens de manière standardisée et objective. Les consultations ont été effectuées en utilisant un outil de chat textuel synchrone, imitant l’interface familière à la plupart des consommateurs utilisant aujourd’hui des LLM.
Il a été observé qu’AMIE effectuait des conversations diagnostiques simulées au moins aussi bien que les médecins généralistes lorsqu’ils étaient évalués selon de multiples axes cliniquement significatifs de qualité de consultation. AMIE avait une plus grande précision diagnostique et une performance supérieure pour 28 des 32 axes du point de vue des médecins spécialistes, et 24 des 26 axes du point de vue des acteurs-patients.
Il existe toutefois quelques limites à cette étude. Premièrement, la technique d’évaluation sous-estime probablement la valeur réelle des conversations humaines, car les cliniciens de l’étude étaient limités à une interface de chat textuel peu familière, qui permet de larges interactions LLM-patient mais ne représente pas la pratique clinique habituelle. De nombreuses limitations importantes doivent être abordées, notamment les performances expérimentales dans des conditions réelles et l’exploration dédiée de sujets importants tels que l’équité et la justice en santé, la confidentialité, la robustesse, et bien d’autres, pour garantir la sécurité et la fiabilité de la technologie.
Source : Google