Google: ihr KI- System erkennt 26 Hauterkrankungen so genau wie Dermatologen
16. September 2019Google: ihr KI- System erkennt 26 Hauterkrankungen so genau wie Dermatologen
NewYork, 16.9.2019
Hauterkrankungen gehören weltweit zu den häufigsten Erkrankungen, direkt hinter Erkältungen, Müdigkeit und Kopfschmerzen. Schätzungen zufolge sind 25 % aller Behandlungen, die Patienten auf der ganzen Welt angeboten werden, für Hautkrankheiten bestimmt und bis zu 37 % der in der Klinik behandelten Patienten haben mindestens eine Hautkrankheit.
Die enorme Fallauslastung und ein weltweiter Mangel an Dermatologen haben die Betroffenen gezwungen, Hausärzte aufzusuchen, die in der Regel weniger genau sind als Spezialisten, wenn es darum geht, Krankheiten zu identifizieren. Dieser Trend motivierte die Forscher von Google, ein KI-System zu entwickeln, das in der Lage ist, die häufigsten dermatologischen Störungen in der Primärversorgung zu erkennen. In einem Beitrag („A Deep Learning System for Differential Diagnosis of Skin Diseases“) und einem begleitenden Blogbeitrag behaupten sie, dass die Erkennungsrate bei 26 Hautkrankheiten auf Augenhöhe mit US-bestätigten Dermatologen liegt.
„Wir haben ein Deep Learning System (DLS) entwickelt, um die häufigsten Hautkrankheiten in der Primärversorgung zu behandeln“, schrieben der Google-Softwareingenieur Yuan Liu und die technische Programmmanagerin von Google Health, Dr. Peggy Bui. „Diese Studie zeigt das Potenzial der DLS, die Fähigkeit von Allgemeinmedizinern ohne zusätzliche Fachausbildung zur genauen Diagnose von Hauterkrankungen zu verbessern.“
Wie Liu und Bui weiter erläuterten, geben Dermatologen nicht nur eine Diagnose für jedes Hautproblem ab, sondern erstellen eine Rangliste möglicher Diagnosen (Differentialdiagnosen), die durch nachfolgende Labortests, Bildgebung, Verfahren und Beratungen systematisch eingegrenzt werden. Das gleiche gilt für das System der Google-Forscher, das Eingaben verarbeitet, die ein oder mehrere klinische Bilder der Hautanomalie und bis zu 45 Arten von Metadaten (z.B. selbstberichtete Komponenten der Krankengeschichte wie Alter, Geschlecht und Symptome) beinhalten.
Das Forschungsteam sagt, dass es für das Training 17.777 de-identifizierte Fälle von 17 Primärkliniken in zwei Staaten bewertet hat. Sie hätten den Korpus gegabelt und den Teil der Aufzeichnungen aus den Jahren 2010 bis 2017 zur Schulung des KI-Systems verwendet und den Teil von 2017 bis 2018 für die Auswertung reserviert. Während des Trainings nutzte das Modell über 50.000 Differentialdiagnosen von über 40 Dermatologen.
Bei den Vergleichstests erwies sich, dass die Überlegenheit des Google – System in punkto diagnostische Genauigkeit. So wurden 3.750 Fälle zusammengefasst, um die Ground Truth Labels abzuleiten. Dabei erreichte das KI-System mit 71% bzw. 93% Top-1- und Top-3-Genauigkeiten. Wenn das System außerdem mit drei Kategorien von Klinikern (Dermatologen, Hausärzten und Pflegepersonal) auf einer Teilmenge des Validierungsdatensatzes verglichen wurde, berichtet das Team, dass seine drei besten Vorhersagen eine diagnostische Genauigkeit von 90% zeigten, oder vergleichbar mit Dermatologen (75%) und „wesentlich höher“ als Hausärzte (60%) und Pflegepersonal (55%).
Um eine mögliche Verzerrung des Hauttyps zu bewerten, testete das Team die Leistung des KI-Systems basierend auf dem Hauttyp Fitzpatrick, einer Skala, die von Typ I („blasses Weiß, brennt immer, bräunt nie“) bis Typ VI („dunkelstes Braun, brennt nie“) reicht. Mit Fokus auf Hauttypen, die mindestens 5% der Daten repräsentieren, fanden sie heraus, dass die Leistung des Modells ähnlich war, mit einer Top-1-Genauigkeit von 69% bis 72% und einer Top-3-Genauigkeit von 91% bis 94%.
Nach Ansicht von Google zeigt der Erfolg des tiefen Lernens zur Aufklärung der Differentialdiagnose von Hautkrankheiten, das ihr System den Mangel an Dermatologen in hohem Masse ausgleichen könnte.