LIKAT-Chemiker erhält Preis für digitales Datenmanagement und KI in der Katalyse

12.12.2024
LIKAT/Danny Gohlke

Dr. David Linke (Bereichsleiter „Katalysatorentwicklung und Reaktionstechnik“)

Zum dritten Mal hat das Katalyse-Konsortium der Nationalen Forschungsdateninfrastruktur (NFDI) seinen Preis für Verdienste bei der Umsetzung der FAIR-Prinzipien im wissenschaftlichen Datenmanagement vergeben. Der „NFDI4Cat – Digital Chemist Award“ 2024 ging an Dr. David Linke vom Leibniz-Institut für Katalyse Rostock, LIKAT, wie auf dem jährlichen Treffen des NFDI4Cat im November bekannt gegeben wurde. Die FAIR-Formel bezeichnet Standards für den Umgang mit Forschungsdaten, und zwar nach diesen Kriterien: Findability (Auffindbarkeit), Accessibility (Zugänglichkeit), Interoperability (Datenkompatibilität) und Re-Usability (Wiederverwendbarkeit).

Seit vier Jahren entwickelt ein Team um David Linke im Rahmen des Konsortiums NFDI4Cat Programme, mit deren Hilfe praktisch jedes Labor seine Daten aus der Katalyseforschung digital bereitstellen kann. Solche für alle in der Wissenschaftscommunity zugänglichen Daten dienen dann auch zum Trainieren von KI-Modellen.

Bei den Daten handelt es sich um die vollständige Dokumentation der Vorgehensweise bei sämtlichen Experimenten, die für eine einzige Publikation in die Hunderte gehen können. Katalyseforscher veröffentlichen mit ihren Papers üblicherweise nur einen Bruchteil der Daten, wie David Linke sagt. „Doch es steckt die zehn- bis 50fache Menge an Daten dahinter. Zum Beispiel zu Versuchen, die erfolglos blieben, obgleich sie korrekt ausgeführt wurden.“ Und auch die seien wichtig, um KI zu füttern und anzulernen.

Die Tools, die David Linke im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) erarbeitet, erleichtern es Chemikern, diese Daten so aufzubereiten und zu dokumentieren, dass Maschinen sie eindeutig lesen und untereinander austauschen können. „Dieses Kriterium versteckt sich sozusagen hinter dem ‚I‘ in der FAIR-Formel, der Interoperability, und es stellt auch die größte Herausforderung unseres Auftrags dar“, sagt David Linke. Dafür ein präzises Vokabular entwickelt zu haben, war sein wichtigstes Verdienst, denn selbst Vertreter der sogenannten exakten Wissenschaften verwenden die Fachbegriffe oft unterschiedlich.

Zukünftig können Anwendungen der Künstlichen Intelligenz in der Wissenschaft erheblich davon profitieren, wenn solche Modelle als „wissenschaftliche Experten“ den aktuell gehypten und auch völlig anders konstruierten Sprach-KI-Lösungen, den sog. Large Language Models, zur Seite gestellt würden. Diese Rolle können sogenannte Wissensgraphen übernehmen, die Zusammenhänge exakt repräsentieren können, und unter anderem das von David Linke und seinen Kollegen entwickelte präzise Vokabular integrieren.

Welchen Vorteil bringt ein KI-kompatibler Pool an Forschungsdaten? Nach den Worten von Dr. Linke wird Forschung damit sehr viel effektiver. „Ich kann zu meinem Thema umfassend Querverbindungen schaffen, sehe zum Beispiel, wo andere Labors experimentelle Lücken ließen, die mit meinem Wissensstand wiederum interessant werden könnten.“ Der Pool an weltweit nutzbarem Wissen wird einfach größer.

Der NFDI e.V. wurde im Oktober 2020 von Bund und Ländern mit genau diesem Ziel der Digitalisierung im Forschungsdatenbereich gegründet. Die Arbeiten sind auf insgesamt zehn Jahre, also noch bis 2030, angelegt. Als einer der ersten Konsortien des Vereins gründete sich für den Bereich der chemischen Katalyse das NFDI4Cat-Konsortium, das gemeinsam mit Chemistry Europe den mit 1.000 Euro dotierten Digital Chemist Award initiierte.

Weitere News aus dem Ressort Wissenschaft

Meistgelesene News

Weitere News von unseren anderen Portalen

So nah, da werden
selbst Moleküle rot...