LIKAT-Chemiker erhält Preis für digitales Datenmanagement und KI in der Katalyse
Seit vier Jahren entwickelt ein Team um David Linke im Rahmen des Konsortiums NFDI4Cat Programme, mit deren Hilfe praktisch jedes Labor seine Daten aus der Katalyseforschung digital bereitstellen kann. Solche für alle in der Wissenschaftscommunity zugänglichen Daten dienen dann auch zum Trainieren von KI-Modellen.
Bei den Daten handelt es sich um die vollständige Dokumentation der Vorgehensweise bei sämtlichen Experimenten, die für eine einzige Publikation in die Hunderte gehen können. Katalyseforscher veröffentlichen mit ihren Papers üblicherweise nur einen Bruchteil der Daten, wie David Linke sagt. „Doch es steckt die zehn- bis 50fache Menge an Daten dahinter. Zum Beispiel zu Versuchen, die erfolglos blieben, obgleich sie korrekt ausgeführt wurden.“ Und auch die seien wichtig, um KI zu füttern und anzulernen.
Die Tools, die David Linke im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) erarbeitet, erleichtern es Chemikern, diese Daten so aufzubereiten und zu dokumentieren, dass Maschinen sie eindeutig lesen und untereinander austauschen können. „Dieses Kriterium versteckt sich sozusagen hinter dem ‚I‘ in der FAIR-Formel, der Interoperability, und es stellt auch die größte Herausforderung unseres Auftrags dar“, sagt David Linke. Dafür ein präzises Vokabular entwickelt zu haben, war sein wichtigstes Verdienst, denn selbst Vertreter der sogenannten exakten Wissenschaften verwenden die Fachbegriffe oft unterschiedlich.
Zukünftig können Anwendungen der Künstlichen Intelligenz in der Wissenschaft erheblich davon profitieren, wenn solche Modelle als „wissenschaftliche Experten“ den aktuell gehypten und auch völlig anders konstruierten Sprach-KI-Lösungen, den sog. Large Language Models, zur Seite gestellt würden. Diese Rolle können sogenannte Wissensgraphen übernehmen, die Zusammenhänge exakt repräsentieren können, und unter anderem das von David Linke und seinen Kollegen entwickelte präzise Vokabular integrieren.
Welchen Vorteil bringt ein KI-kompatibler Pool an Forschungsdaten? Nach den Worten von Dr. Linke wird Forschung damit sehr viel effektiver. „Ich kann zu meinem Thema umfassend Querverbindungen schaffen, sehe zum Beispiel, wo andere Labors experimentelle Lücken ließen, die mit meinem Wissensstand wiederum interessant werden könnten.“ Der Pool an weltweit nutzbarem Wissen wird einfach größer.
Der NFDI e.V. wurde im Oktober 2020 von Bund und Ländern mit genau diesem Ziel der Digitalisierung im Forschungsdatenbereich gegründet. Die Arbeiten sind auf insgesamt zehn Jahre, also noch bis 2030, angelegt. Als einer der ersten Konsortien des Vereins gründete sich für den Bereich der chemischen Katalyse das NFDI4Cat-Konsortium, das gemeinsam mit Chemistry Europe den mit 1.000 Euro dotierten Digital Chemist Award initiierte.
Meistgelesene News
Organisationen
Weitere News aus dem Ressort Wissenschaft
Holen Sie sich die Chemie-Branche in Ihren Posteingang
Ab sofort nichts mehr verpassen: Unser Newsletter für die chemische Industrie, Analytik, Labor und Prozess bringt Sie jeden Dienstag und Donnerstag auf den neuesten Stand. Aktuelle Branchen-News, Produkt-Highlights und Innovationen - kompakt und verständlich in Ihrem Posteingang. Von uns recherchiert, damit Sie es nicht tun müssen.