Machine Learning prognostiziert das Verhalten biologischer Kreisläufe
4. Oktober 2019Machine Learning prognostiziert das Verhalten biologischer Kreisläufe
New York, 4.10.2019
Lingchong You, Professor für Biomedizinische Technik an der Duke University (North Carolina) und sein Postdoktorand Shangying Wang haben ein neurales Netzwerk trainiert, um die zirkulären Muster vorhersagen zu können, die durch einen in eine Bakterienkultur eingebetteten biologischen Kreislauf erzeugt werden. Dafür entwickelten sie einen maschinellen Lernansatz, um die Wechselwirkungen zwischen komplexen Variablen in technischen Bakterien zu modellieren, die sonst nur schwer vorherzusehen wären. Die Ergebnisse lassen aufhorchen: Ihre Algorithmen sind auf viele Arten von biologischen Systemen übertragbar und ihr System arbeitet 30.000 Mal schneller als das bestehende Rechenmodell.
Die Forscher trainierten vier verschiedene neuronale Netze und verglichen ihre Antworten für jeden Fall. Sie fanden heraus, dass, wenn die trainierten neuronalen Netze ähnliche Vorhersagen machen, diese nahe an der richtigen Antwort lagen. „Wir haben festgestellt, dass wir nicht jede Antwort mit dem langsameren Standard-Rechenmodell validieren müssen“, sagte You. „Wir haben stattdessen im Wesentlichen die Weisheit der Menge benutzt.“
Mit dem trainierten und bestätigten Modell des maschinellen Lernens machten sich die Forscher daran, daraus neue Erkenntnisse über ihren biologischen Kreislauf zu gewinnen. In den ersten 100.000 Datensimulationen, die zum Training des neuronalen Netzes verwendet wurden, produzierte nur eine einzige eine Bakterienkolonie mit drei Ringen. Aber mit der Geschwindigkeit des neuronalen Netzes konnten You und Wang nicht nur viel mehr Drillinge finden, sondern auch bestimmen, welche Variablen für die Produktion entscheidend waren. „Das neuronale Netz war in der Lage, Muster und Wechselwirkungen zwischen den Variablen zu finden, die sonst nicht auffindbar gewesen wären“, sagt Wang.
Als Abschluss ihrer Studie haben die beiden Forscher ihren Ansatz an einem biologischen System ausprobiert, das zufällig funktioniert. Die Lösung solcher Systeme erfordert ein Computermodell, das die gleichen Parameter mehrmals wiederholt, um das wahrscheinlichste Ergebnis zu erzielen. Während dies ein ganz anderer Grund für lange Rechenlaufzeiten ist als ihr Ausgangsmodell, fanden die Forscher ihren Ansatz immer noch funktionsfähig und zeigten, dass er für viele verschiedene komplexe biologische Systeme verallgemeinerbar ist.
Die Forscher versuchen nun, ihren neuen Ansatz auf komplexere biologische Systeme anzuwenden. Neben der Ausführung auf Computern mit schnelleren GPUs versuchen sie, den Algorithmus so effizient wie möglich zu programmieren. „Wir haben das neuronale Netzwerk mit 100.000 Datensätzen trainiert, aber das könnte ein Overkill gewesen sein“, sagte Wang. „Wir entwickeln einen Algorithmus, bei dem das neuronale Netzwerk mit Simulationen in Echtzeit interagieren kann, um die Dinge zu beschleunigen.“
„Unser erstes Ziel war ein relativ einfaches System“, sagte You. „Jetzt wollen wir diese neuronalen Netzsysteme verbessern, um ein Fenster in die zugrunde liegende Dynamik komplexerer biologischer Kreisläufe zu öffnen.“ Die Forscher trainierten vier verschiedene neuronale Netze und verglichen ihre Antworten für jeden Fall. Sie fanden heraus, dass, wenn die trainierten neuronalen Netze ähnliche Vorhersagen machen, diese Vorhersagen nahe an der richtigen Antwort lagen.
„Wir haben festgestellt, dass wir nicht jede Antwort mit dem langsameren Standard-Rechenmodell validieren müssen“, sagte You. „Wir haben stattdessen im Wesentlichen die Weisheit der Menge benutzt.“
Mit dem trainierten und bestätigten Modell des maschinellen Lernens machten sich die Forscher daran, daraus neue Erkenntnisse über ihren biologischen Kreislauf zu gewinnen. In den ersten 100.000 Datensimulationen, die zum Training des neuronalen Netzes verwendet wurden, produzierte nur eine einzige eine Bakterienkolonie mit drei Ringen. Aber mit der Geschwindigkeit des neuronalen Netzes konnten Sie und Wang nicht nur viel mehr Drillinge finden, sondern auch bestimmen, welche Variablen für die Produktion entscheidend waren. „Das neuronale Netz war in der Lage, Muster und Wechselwirkungen zwischen den Variablen zu finden, die sonst nicht auffindbar gewesen wären“, sagt Wang.
Als Abschluss ihrer Studie haben You und Wang ihren Ansatz an einem biologischen System ausprobiert, das zufällig funktioniert. Die Lösung solcher Systeme erfordert ein Computermodell, das die gleichen Parameter mehrmals wiederholt, um das wahrscheinlichste Ergebnis zu erzielen. Während dies ein ganz anderer Grund für lange Rechenlaufzeiten ist als ihr Ausgangsmodell, fanden die Forscher ihren Ansatz immer noch funktionsfähig und zeigten, dass er für viele verschiedene komplexe biologische Systeme verallgemeinerbar ist.
Die Forscher versuchen nun, ihren neuen Ansatz auf komplexere biologische Systeme anzuwenden. Neben der Ausführung auf Computern mit schnelleren GPUs versuchen sie, den Algorithmus so effizient wie möglich zu programmieren.
„Wir haben das neuronale Netzwerk mit 100.000 Datensätzen trainiert, aber das könnte ein Overkill gewesen sein“, sagte Wang. „Wir entwickeln einen Algorithmus, bei dem das neuronale Netzwerk mit Simulationen in Echtzeit interagieren kann, um die Dinge zu beschleunigen.“
„Unser erstes Ziel war ein relativ einfaches System“, sagte Sie. „Jetzt wollen wir diese neuronalen Netzsysteme verbessern, um ein Fenster in die zugrunde liegende Dynamik komplexerer biologischer Kreisläufe zu öffnen.“