Autonomer Roboter spielt mit NanoLEGO
Wissenschaftler entwickeln eine autonome Künstliche Intelligenz, die gezielt einzelne Moleküle greifen und verschieben kann
Forschungszentrum Jülich / Christian Wagner
Rapid Prototyping, die schnelle – und kostengünstige – Produktion von Prototypen oder Modellen, besser bekannt als 3D-Druck, hat sich längst als wichtiges Werkzeug für die Industrie etabliert. „Könnte man dieses Konzept auf die Nanoskala übertragen und einzelne Moleküle wie Legosteine gezielt zusammensetzen oder auch wieder trennen, böten sich nahezu unendliche Möglichkeiten, wenn man bedenkt dass es ca. 1060 denkbare Molekülarten gibt“, weiß Dr. Christian Wagner, Leiter der ERC Arbeitsgruppe Molekülmanipulation am Forschungszentrum Jülich.
Das Problem: Mit dem Rastertunnelmikroskop gibt es zwar ein Werkzeug, mit dem sich einzelne Moleküle gut hin und her schieben lassen, für die gezielte räumliche Anordnung benötigt man jedoch immer ein spezielles, geeignetes „Rezept“ zur Führung der Mikroskop-Spitze. Dieses lässt sich weder berechnen, noch intuitiv erschließen – dafür ist die Mechanik auf der Nanoskala viel zu variabel und zu kompliziert. Denn die Mikroskop-Spitze ist kein beweglicher Greifer, sondern ein einfacher starrer Kegel. Die Moleküle haften daran nur leicht an – und lassen sich nur durch ausgeklügelte Bewegungsmuster an Ort und Stelle bringen.
„Bislang war so ein gezieltes Bewegen von Molekülen höchstens per Hand, durch Trial and Error, möglich. Mithilfe einer selbstlernenden, autonomen Software-Steuerung ist es uns nun zum ersten Mal gelungen, eine Lösung für diese Vielfalt und Variabilität auf der Nanoskala zu finden und diesen Prozess zu automatisieren“, freut sich Prof. Dr. Stefan Tautz, Leiter des Jülicher Instituts für Quantum Nanoscience.
Den Schlüssel liegt in dem sogenannten Reinforcement Learning, einer speziellen Variante des maschinellen Lernens. „Wir geben dem Software-Agenten keinen Lösungsweg vor, sondern belohnen Erfolg und bestrafen Misserfolg“, erklärt Prof. Dr. Klaus-Robert Müller, Leiter des Fachgebiets Maschinelles Lernen an der Technischen Universität Berlin. Der Algorithmus versucht immer wieder, die gestellte Aufgabe zu lösen und lernt aus seinen Erfahrungen. In der breiten Öffentlichkeit bekannt geworden ist Reinforcement Learning vor ein paar Jahren durch AlphaGo Zero: Die künstliche Intelligenz entwickelte eigenständig Gewinn-Strategien des hochkomplexen Go-Spiels, ohne menschliche Spieler zu studieren – und war schon nach wenigen Tagen in der Lage, professionelle Go-Spieler zu besiegen.
„In unserem Fall bekam der Agent die Aufgabe, einzelne Moleküle aus einer Schicht zu entfernen, in der sie über ein komplexes Netzwerk an chemischen Bindungen festgehalten werden. Konkret handelte es sich dabei um Perylen-Moleküle, wie sie etwa für Farben und organischen Leuchtdioden verwendet werden“, erklärt Christian Wagner. Die besondere Herausforderung: Die aufgewendete Kraft für die Bewegung darf niemals die Stärke der Bindung überschreiten, mit der die Spitze des Rastertunnelmikroskops das Molekül anzieht, da diese Verbindung sonst bricht. „Die Spitze muss dafür ein spezielles Bewegungsmuster ausführen, das wir früher, im wahrsten Sinne des Wortes, per Hand herausfinden mussten“, so Christian Wagner. Während der Softwareagent anfangs völlig zufällige Bewegungsaktionen ausführt, die die Bindung zwischen Spitze und Molekül abreißen lassen, entwickelt er mit der Zeit Regeln, welche Bewegung in welcher Situation am erfolgversprechendsten ist und wird daher mit jedem Durchlauf besser.
Der Einsatz des Reinforcement Learning im nanoskopischen Bereich hält jedoch zusätzliche Herausforderungen parat. Die Metallatome, aus denen die Spitze des Rastertunnelmikroskops besteht, können sich leicht verschieben, was die Bindungsstärke zum Molekül jedes Mal ändert. „Jeder neue Versuch macht die Gefahr einer Veränderung und damit den Abriss der Bindung zwischen Spitze und Molekül größer. Somit ist der Software-Agent gezwungen, besonders schnell zu lernen, da seine Erfahrungen jederzeit hinfällig werden könnten“, so Stefan Tautz. „Es ist ein bisschen, als würden sich beim autonomen Fahren ständig das Straßennetz, die Verkehrsregeln, der Aufbau sowie die Bedienungsregeln des Fahrzeugs ändern.“ Die Forscher haben diese Schwierigkeit überwunden, indem die Software parallel zu den ersten Versuchen auch ein einfaches Modell der Umgebung lernt, in der die Manipulation stattfindet. Der Agent trainiert dann gleichzeitig sowohl in der Realität als auch in seinem eigenen Modell, was den Lernprozess stark beschleunigt.
„Das ist das erste Mal überhaupt, dass es gelungen ist, künstliche Intelligenz und Nanotechnologie zusammenzubringen“, betont Klaus-Robert Müller. „Bis jetzt handelt es sich zwar ausschließlich um ein ‚Proof of Principle‘“, erklärt Stefan Tautz. „Doch wir sind zuversichtlich, dass unsere Arbeit Wegbereiter für die robotergestützte, automatische Konstruktion funktioneller, supramolekularer Strukturen sein wird, beispielsweise von molekularen Transistoren und Speicherzellen – in einer Geschwindigkeit, Präzision und Ausdauer, die unsere derzeitigen Möglichkeiten weit übertreffen.“