Ein an der JKU entwickelter Algorithmus sucht in einer Datenbank von einer Milliarde Molekülen nach möglichen Wirkstoffen gegen das Coronavirus. Der Mensch würde dafür Jahre brauchen – die Künstliche Intelligenz schafft es an nur einem einzigen Tag. Die Ergebnisse wurden jetzt für alle verfügbar gemacht.
Maschinelles Lernen beschäftigt sich mit Techniken, die einem Computer erlauben, Dinge zu tun, für die er keine genauen Instruktionen erhalten hat.“ So erklärt Günter Klambauer den Begriff Machine Learning für Nicht-Expert*innen. „Ich zeige einem Computer z.B. ein paar Spam-EMails und ein paar normale E-Mails, und er soll dann lernen, die beiden Arten von E-Mails zu unterscheiden. Eine genaue Instruktion wäre zum Beispiel, dass er alle E-Mails, die das Wort ‚GEWINN‘ enthalten, als Spam betrachtet.“ Maschinelles Lernen komme aber ohne solche genauen Instruktionen aus. Das unterscheide es von einem herkömmlichen Programm, das nicht lernfähig sei.
Derzeit entwickeln Klambauer und sein Team Algorithmen und Methoden des maschinellen Lernens, die für Probleme in der Medizin oder Biologie eingesetzt werden können. Zum Beispiel haben sie eine Methode erfunden, die basierend auf der chemischen Struktur die Toxizität, also Giftigkeit, und die Wirkungsweise eines Moleküls genau vorhersagen kann. Sie haben auch eine sehr leistungsfähige Art von künstlichen neuronalen Netzen erfunden. „Ich möchte betonen, dass die wissenschaftlichen Erfolge auf den Leistungen meiner Forschungsgruppe beruhen und dass ich bei weitem nicht allein dafür verantwortlich bin“, unterstreicht der Forscher, der 2012 als Doktorand mit dem Austrian Life Science Award ausgezeichnet wurde.
Die Suche nach dem Molekül gegen das Virus
Was hat Machine Learning nun mit COVID-19 zu tun? Mit den von Klambauer entwickelten Algorithmen kann man Moleküle, die kleinsten aus verschiedenen Atomen bestehenden chemischen Verbindungen, nach bestimmten Eigenschaften untersuchen – und zwar sehr schnell und mit hoher Genauigkeit. Eine dieser Eigenschaften ist auch eine mögliche Eignung als Wirkstoff gegen das Coronavirus. Genauer gesagt können die Algorithmen vorhersagen, ob ein Molekül ein bestimmtes Protein, das das Virus für seine Vervielfältigung braucht, behindern wird.
Dabei gibt es zwei Phasen: Die erste ist eine „Lernphase“ der Künstlichen Intelligenz. In dieser Lernphase hat die KI in 48 Stunden von 250 Millionen Datenpunkten gelernt, Eigenschaften von Molekülen vorherzusagen. Um dann nach Wirkstoffen zu suchen, geht es schneller. In dieser zweiten Phase, auch „Anwendungsphase“ genannt, hat die KI in 24 Stunden bereits eine Milliarde Moleküle durchsucht.
Dieses Modell wurde eingesetzt, um eine große Datenbank von Molekülen nach möglichen Wirkstoffen gegen das neue Coronavirus zu testen: Es wurde fündig. „Wir haben die Ergebnisse für die Allgemeinheit verfügbar gemacht, so dass jedes Labor weltweit diese Moleküle nun testen kann“, erklärt Klambauer. Die Schnelligkeit der AI (Artificial Intelligence) ist dabei ein wichtiger Faktor.
„Die AI ist sehr spezialisiert auf eine einzige Aufgabe. Ein Auto kann auch schneller fahren, als ein Mensch laufen kann, aber dafür kann es nicht kochen. Unsere AI hat sich 250 Millionen Datenpunkte zu Molekülen in 48 Stunden angeschaut, um davon zu lernen – ein Mensch bräuchte, nur um jedes Molekül eine Sekunde lang anzusehen, schon ein paar Jahre“, so der Forscher.
Die verbesserte Rechnerleistung sei dabei gar nicht so entscheidend. Sie habe sich nicht derartig gesteigert. Von großer Bedeutung sei eher, dass Grafikkarten vielmehr auch für wissenschaftliche Berechnungen verwendet würden und nicht mehr nur für Computerspiele. Dazu Klambauer: „Sehr stark verbessert haben sich allerdings die Algorithmen, was man deutlich an verbesserten AI Methoden sehen kann.“ Algorithmen sind eine Reihe von Anweisungen, die sich in praktisch jedem Computerprogramm finden und die nacheinander ausgeführt werden, um eine Aufgabe zu erfüllen oder ein Problem zu lösen. Aktuelle Algorithmen können mehr Daten in weniger Zeit verarbeiten und schneller Lösungswege finden. Dies habe auch die Bedeutung von AI in Life Science allgemein verändert.
„Durch die Erfolge von AI Methoden ist es so, dass mittlerweile Mediziner* innen und Biolog*innen auch aufmerksam geworden sind und versuchen, diese Methoden einzusetzen, um in der Forschung oder in der Praxis voranzukommen. Man hält die Vorhersagen, die man von einer AI bekommt, nicht mehr für Blödsinn oder für eine Fußnote, sondern nimmt diese durchaus ernst.“
Immer nur eine Aufgabe – die aber gründlich und schnell
Was also ist eigentlich intelligent an der Künstlichen Intelligenz? Was sind ihre Beschränkungen? Die derzeitigen Methoden seien nicht besonders intelligent, gemessen an der sehr generellen Intelligenz des Menschen, betont Klambauer. „Sie können zwar vereinzelt schon einige Dinge besser als Menschen, aber das nur in sehr speziellen Bereichen und bei sehr konkreten Aufgaben, so z.B. bei der Erkennung von Brustkrebs in Mammographien und der Erkennung von Melanomen. Die AI kann dann aber nichts anderes als diese eine Aufgabe.“
Die AI sei aber sehr vielfältig einsetzbar. Zum Beispiel bei der schon erwähnten Vorhersage von Toxizität – dies hat Klambauers Gruppe schon vor fünf Jahren gezeigt. Seither beschäftigt er sich mit vielen unterschiedlichen biologischen und medizinischen Problemen und versucht, seine Methoden zu adaptieren, um diese zu lösen. „Wir haben zum Beispiel zeigen können, dass man viele Labor-Tests, die man routinemäßig macht, durch eine AI ersetzen kann – somit wird der Medikamentenentwicklungsprozess viel schneller und sicherer. Weiters haben wir eine KI entwickelt, die herausfinden kann, in welchen Teilen der Zelle sich ein Protein befindet. Aktuell haben wir eine Arbeit veröffentlicht, in der eine KI im Antikörper-Repertoire eines Menschen nach jenen Antikörpern sucht, die ihn für eine bestimmte Erkrankung immun machen. Das ist gerade hochrelevant, weil man somit endlich gute Antikörper-Tests für das neue Coronavirus entwickeln könnte bzw. sogar eine Impfung. Überall auf der Welt sammeln Labors und Institutionen Blutproben von Menschen, die mit dem Coronavirus infiziert waren oder sind – aber viele wissen nicht, was man mit diesen Daten anfangen soll bzw. wie man die Nadel im Heuhaufen findet. Unsere AI könnte sie finden.“