Künstliche Intelligenz findet krankheitsbezogene Gene
13. März 2020Künstliche Intelligenz findet krankheitsbezogene Gene
Stockholm, 13.3.2020
Ein künstliches neuronales Netzwerk kann Muster in riesigen Mengen von Genexpressionsdaten aufdecken und Gruppen von krankheitsbezogenen Genen entdecken. Dies hat eine neue Studie unter der Leitung von Forschern der Universität Linköping gezeigt, die in Nature Communications veröffentlicht wurde. Die Wissenschaftler hoffen, dass die Methode schließlich in der Präzisionsmedizin und der individualisierten Behandlung angewendet werden kann.
Bei der Nutzung von sozialen Medien ist es üblich, dass die Plattform Personen vorschlägt, die man vielleicht als Freunde hinzufügen möchte. Der Vorschlag basiert darauf, dass Sie und die andere Person gemeinsame Kontakte haben, was darauf hindeutet, dass Sie sich vielleicht kennen. Auf ähnliche Weise erstellen Wissenschaftler Karten von biologischen Netzwerken, die darauf basieren, wie verschiedene Proteine oder Gene miteinander interagieren.
Die Forscher, die hinter einer neuen Studie stehen, haben die künstliche Intelligenz, KI, benutzt, um zu untersuchen, ob es möglich ist, biologische Netzwerke mit Hilfe von tiefem Lernen zu entdecken, bei dem Entitäten, die als „künstliche neuronale Netzwerke“ bekannt sind, durch experimentelle Daten trainiert werden. Da künstliche neuronale Netze hervorragend lernen können, wie man Muster in enormen Mengen komplexer Daten findet, werden sie in Anwendungen wie der Bilderkennung eingesetzt, jedoch bisher in der biologischen Forschung nur selten.
„Wir haben zum ersten Mal tiefes Lernen eingesetzt, um krankheitsbezogene Gene zu finden. Dies ist eine sehr leistungsfähige Methode bei der Analyse großer Mengen biologischer Informationen oder ‚großer Daten'“, sagt Sanjiv Dwivedi, Postdoc am Institut für Physik, Chemie und Biologie (IFM) der Universität Linköping.
Die Wissenschaftler nutzten eine große Datenbank mit Informationen über die Expressionsmuster von 20.000 Genen bei einer großen Zahl von Menschen. Die Informationen waren „unsortiert“ in dem Sinne, dass die Forscher dem künstlichen neuronalen Netzwerk keine Informationen darüber gaben, welche Genexpressionsmuster von Menschen mit Krankheiten und welche von gesunden Menschen stammten. Das KI-Modell wurde dann darauf trainiert, Muster der Genexpression zu finden.
Eine der Herausforderungen des maschinellen Lernens besteht darin, dass es nicht möglich ist, genau zu sehen, wie ein künstliches neuronales Netz eine Aufgabe löst. Die KI wird manchmal als „Black Box“ beschrieben – wir sehen nur die Informationen, die wir in die Box legen, und das Ergebnis, das sie produziert. Wir können die Schritte dazwischen nicht sehen.
Künstliche neuronale Netze bestehen aus mehreren Schichten, in denen Informationen mathematisch verarbeitet werden. Außer der Eingangsschicht gibt es noch die Ausgangsschicht. Sie liefert das Ergebnis der vom System durchgeführten Informationsverarbeitung. Zwischen diesen beiden Schichten befinden sich mehrere verborgene Schichten, in denen Berechnungen durchgeführt werden.
Als die Wissenschaftler das künstliche neuronale Netz trainiert hatten, fragten sie sich, ob es möglich sei, sozusagen den Deckel der Black Box zu heben und zu verstehen, wie sie funktioniert. Sind das Design des neuronalen Netzes und die bekannten biologischen Netze ähnlich?
„Als wir unser neuronales Netzwerk analysierten, stellte sich heraus, dass die erste verborgene Schicht zu einem großen Teil Wechselwirkungen zwischen verschiedenen Proteinen darstellte. Tiefer im Modell fanden wir dagegen auf der dritten Ebene Gruppen verschiedener Zelltypen. Es ist äußerst interessant, dass diese Art biologisch relevanter Gruppierungen automatisch erzeugt wird, da unser Netzwerk von unklassifizierten Genexpressionsdaten ausgegangen ist“, sagt Mika Gustafsson, Senior Dozent am IFM und Leiter der Studie.
Die Wissenschaftler untersuchten dann, ob sich mit ihrem Modell der Genexpression feststellen lässt, welche Genexpressionsmuster mit einer Krankheit assoziiert sind und welche normal sind. Sie bestätigten, dass das Modell relevante Muster findet, die gut mit den biologischen Mechanismen im Körper übereinstimmen. Da das Modell mit unklassifizierten Daten trainiert wurde, ist es möglich, dass das künstliche neuronale Netz völlig neue Muster gefunden hat. Die Forscher wollen nun untersuchen, ob solche, bisher unbekannten Muster aus biologischer Sicht relevant sind.
„Wir glauben, dass der Schlüssel zum Fortschritt auf diesem Gebiet im Verständnis des neuronalen Netzes liegt. Dies kann uns neue Dinge über biologische Zusammenhänge lehren, zum Beispiel über Krankheiten, bei denen viele Faktoren zusammenwirken. Und wir glauben, dass unsere Methode Modelle liefert, die leichter zu verallgemeinern sind und die für viele verschiedene Arten von biologischen Informationen verwendet werden können“, sagt Mika Gustafsson.
Mika Gustafsson hofft, dass die enge Zusammenarbeit mit medizinischen Forschern es ihm ermöglichen wird, die in der Studie entwickelte Methode in der Präzisionsmedizin anzuwenden. So könnte man zum Beispiel festlegen, welche Patientengruppen eine bestimmte Art von Medikamenten erhalten sollen, oder die am stärksten betroffenen Patienten identifizieren.
Die Studie wurde von der Schwedischen Stiftung für strategische Forschung (SSF) und dem Schwedischen Forschungsrat finanziell unterstützt.