IA vs experts : qui détecte le mieux les complications des plaies ?

L’intelligence artificielle peut-elle rivaliser avec les professionnels de santé pour diagnostiquer les problèmes de cicatrisation ? Une étude publiée en juillet 2025 dans le Journal of the American Medical Informatics Association apporte des réponses nuancées — et quelques surprises sur ce qui fait vraiment un « expert ».

Le défi : détecter la macération des plaies

La macération — ce gonflement et ramollissement des tissus dû à un contact prolongé avec les fluides — est une complication fréquente des plaies chroniques. Sa détection repose essentiellement sur l’observation visuelle, ce qui en fait un terrain idéal pour tester les capacités de l’IA en imagerie médicale.

Des chercheurs allemands ont soumis 30 images de plaies chroniques à deux types d’évaluateurs : 481 professionnels de santé (médecins et infirmiers) et un modèle d’intelligence artificielle basé sur un réseau de neurones convolutif.

Les résultats : avantage IA, mais pas écrasant

Sans grande surprise, l’IA affiche de meilleurs scores :

Métrique	Humains	IA
Précision	79,3 %	90 %
Sensibilité	76,4 %	93,3 %
Spécificité	83 %	86,7 %

Cependant, la différence n’est pas statistiquement significative quand on compare l’IA à l’ensemble des participants. L’écart devient significatif uniquement face aux groupes les moins performants.

La vraie surprise : ce qui définit l’expertise

C’est ici que l’étude devient vraiment intéressante. Les chercheurs ont analysé quels facteurs influençaient la précision des diagnostics humains. Deux variables seulement avaient un impact significatif :

Ce qui compte :

La qualification formelle spécialisée (dermatologues ou infirmiers certifiés en soins des plaies)
La confiance en soi diagnostique des participants

Ce qui ne compte pas (ou peu) :

Les années d’expérience professionnelle
Le fait de travailler spécifiquement dans le domaine des plaies
L’âge ou le genre

En d’autres termes, un infirmier fraîchement certifié mais confiant dans ses compétences peut surpasser un collègue avec 20 ans d’expérience mais sans formation spécialisée.

Un désaccord révélateur entre professionnels

L’étude a également mesuré la concordance entre les évaluateurs humains. Le résultat est préoccupant : l’accord global n’était que « passable » (Kappa = 0,391). Cela signifie qu’un même patient pourrait recevoir des diagnostics différents selon le soignant consulté.

Les professionnels avec une formation spécialisée et une haute confiance en eux montraient une bien meilleure concordance entre eux — signe qu’ils s’appuient sur des critères d’évaluation similaires, probablement acquis lors de leur formation.

Quelles implications pour la pratique clinique ?

Les auteurs tirent plusieurs enseignements de ces résultats :

L’IA comme filet de sécurité. Les professionnels sans formation spécialisée, avec peu de confiance en eux ou peu d’expérience, sont ceux qui bénéficieraient le plus d’un système d’aide au diagnostic par IA. Mais attention : ce sont aussi les plus susceptibles d’accepter aveuglément les recommandations de la machine, y compris les erreurs.

Repenser la notion d’expertise. Utiliser simplement le titre professionnel ou les années d’expérience pour définir un « expert » dans les études comparatives humain-IA est insuffisant. La formation spécifique et les traits psychologiques comme la confiance en soi jouent un rôle déterminant.

L’IA en complément, pas en remplacement. Les humains intègrent des informations contextuelles — état général du patient, historique médical, intuition clinique — que l’IA ne peut pas (encore) capturer à partir d’une simple image.

Les limites à garder en tête

L’étude présente quelques restrictions importantes :

Les images provenaient d’un seul centre hospitalier, ce qui peut limiter la généralisation des résultats
La tâche était relativement simple (cas clairs de macération ou non)
Les conditions réelles de travail (pression temporelle, fatigue) n’étaient pas reproduites

En conclusion

Cette étude invite à dépasser la question simpliste « l’IA est-elle meilleure que l’humain ? » pour s’intéresser à une interrogation plus utile : « Comment l’IA peut-elle aider les différents profils de soignants ? »

La réponse semble claire : c’est auprès des professionnels les moins formés que l’assistance algorithmique apporterait le plus de valeur ajoutée — à condition de garantir la fiabilité des systèmes et de former les utilisateurs à garder un regard critique sur les suggestions de la machine.

Source : https://academic.oup.com/jamia/article/32/9/1425/8203516