IBM gibt das KI-Projekt für krebserregende Medikamente an die Open-Source-Gemeinschaft weiter
24. Juli 2019IBM gibt das KI-Projekt für krebserregende Medikamente an die Open-Source-Gemeinschaft weiter
Berlin, 24.7.2019
IBM hat drei Projekte der künstlichen Intelligenz (KI) veröffentlicht, die darauf zugeschnitten sind, dass auch die Open-Source-Gemeinschaft sich mit der Krebsproblematik intensiv beschäftigt.
Auf der 18. Europäischen Computerbiologie (ECCB) und der 27. Konferenz über intelligente Systeme für die Molekularbiologie (ISMB), die Ende dieses Monats in der Schweiz stattfinden werden, will der Technologieriese erklären, wie jedes der Projekte unser Verständnis von Krebs und deren Behandlung verbessern kann.
Die Fakten: Krebs hat 2018 schätzungsweise 9,6 Millionen Todesopfer gefordert, wobei im selben Jahr rund 18 Millionen neue Fälle gemeldet wurden.
Zur Diskussion stehen folgende Themen: wie bedeutsam sind Prädisposition durch die Genetik, Umweltfaktoren wie Umweltverschmutzung, Rauchen und Ernährung? Wie wahrscheinlich ist es, dass jemand eine solche Krankheit entwickelt? Welche Formen können schon behandelt werden?
Forscher der IBM- Gruppe Computational Systems Biology in Zürich arbeiten mit Machine-Learnig – Methoden daran, das Verständnis der führenden Treiber und molekularen Mechanismen dieser komplexen Krankheit zu vertiefen sowie an Methoden zur Verbesserung unserer Kenntnisse über die Tumorzusammensetzung.
Gemeinsames Ziel der folgenden Projekte sei es, „unser Verständnis von Krebs zu vertiefen, um Industrie und Wissenschaft mit dem Wissen auszustatten, das eines Tages möglicherweise helfen könnte, neue Behandlungen und Therapien zu entwickeln“, erklärte IBM.
Das erste Projekt, PaccMann genannt, wird als „Vorhersage der Empfindlichkeit von Krebspräparaten mit multimodalen aufmerksamkeitsbasierten neuronalen Netzwerken“ beschrieben.
Es kann Millionen von Dollar kosten, ein einziges Medikament zur Krebsbekämpfung zu entwickeln, und diese finanziellen Beschränkungen können unser Potenzial zur Entwicklung neuer Medikamente und Therapien verzögern oder zunichte machen. IBM arbeitet an dem PaccMann-Algorithmus, um chemische Verbindungen automatisch zu analysieren und vorherzusagen, welche die wahrscheinlichsten sind, um Krebsstämme zu bekämpfen, was diesen Prozess möglicherweise rationalisieren könnte.
Der ML-Algorithmus nutzt Daten zur Genexpression sowie die Molekularstrukturen chemischer Verbindungen. IBM erklärte dazu, dass durch die frühzeitige Identifizierung potenzieller Krebsmedikamente die Kosten für die Medikamentenentwicklung gesenkt werden konnten.
Das zweite Projekt heißt „Interaction Network infErence from vectoR representations of words“, auch bekannt als INtERAcT. Dieses Tool ist besonders interessant, da es automatisch Daten aus wertvollen wissenschaftlichen Arbeiten über unser Verständnis von Krebs extrahiert.
Mit etwa 17.000 Papieren, die jedes Jahr im Bereich der Krebsforschung veröffentlicht werden, kann es für Forscher schwierig – wenn nicht sogar unmöglich – sein, mit jedem kleinen Fortschritt Schritt zu halten. INtERAcT extrahiert automatisch Informationen aus diesen Arbeiten und entlastet dadurch die akademische Seite der Forschung. Im Moment wird das Tool auf der Extraktion von Daten im Zusammenhang mit Protein-Protein-Interaktionen getestet – ein Studienbereich, der als potenzielle Ursache für die Störung biologischer Prozesse bei Krankheiten wie Krebs markiert wurde.
„Eine besondere Stärke von INtERAcT ist seine Fähigkeit, Interaktionen im Zusammenhang mit einer bestimmten Krankheit abzuleiten“, betont IBM. „Der Vergleich mit den normalen Wechselwirkungen im gesunden Gewebe kann möglicherweise helfen, einen Einblick in die Krankheitsmechanismen zu gewinnen.“
Das dritte Projekt ist „pathway-induced multiple kernel learning“, kurz PIMKL. Dieser Algorithmus verwendet Datensätze, die beschreiben, was wir derzeit über molekulare Wechselwirkungen wissen, um das Fortschreiten von Krebs und mögliche Rückfälle bei Patienten vorherzusagen.
PIMKL nutzt das so genannte Multiple-Kernel-Learning, um molekulare Wege zu identifizieren, die für die Kategorisierung von Patienten entscheidend sind, und bietet Ärzten die Möglichkeit, Behandlungspläne zu individualisieren und anzupassen.
Der Code von PaccMann und INtERAcT wurde freigegeben und ist auf den Websites der Projekte verfügbar. PIMKL wurde auf der IBM Cloud eingesetzt und der Quellcode wurde ebenfalls freigegeben.
Jedes Projekt ist Open-Source und wurde nun öffentlich zugänglich gemacht. IBM hofft, dass durch die Bereitstellung des Quellcodes für andere Forscher und Wissenschaftler deren potenzielle Auswirkungen durch die wissenschaftliche Gemeinschaft maximiert werden können.