Meine Merkliste
my.chemie.de  
Login  

Rosetta@home



Rosetta@home ist ein Projekt, das mittels der Technik des verteilten Rechnens versucht, Proteinstrukturen und Proteinbindungen aus einer Aminosäuresequenz vorherzusagen.

Dabei werden Algorithmen entwickelt und getestet, die eine zuverlässige Strukturvorhersage ermöglichen. Eine akkurate Vorhersage von Proteinstrukturen wäre für die Entwicklung von Heilverfahren für beispielsweise AIDS, Krebs, Malaria, Alzheimer und Virenerkrankungen ein großer Fortschritt.

Das verwendete Computerprogramm wird im BakerLab der University of Washington unter der Leitung von Prof. Dr. Baker entwickelt.

Das Projekt wurde offiziell am 16. September 2005 gestartet. Die Basis der Berechnungen bildet die Software BOINC von der University of California, Berkeley.

Das Projekt wurde bereits auf über 420.000 PCs installiert (Stand: Oktober 2007 [1]), und sucht weiterhin neue Teilnehmer, um die 150 TeraFLOPS-Grenze zu überschreiten.[2]

Inhaltsverzeichnis

Hintergrund, wissenschaftliche Relevanz und mögliche Anwendungen

Proteine sind die wichtigsten Funktionsträger des Körpers. Es handelt sich dabei um lange Ketten aus miteinander kondensierten Aminosäuren. Biologen und Biochemiker wissen seit etwa 40 Jahren, dass die Form, die ein Protein annimmt, in der lebenden Zelle ausschließlich von der Reihenfolge der in ihm vorkommenden Aminosäuren bestimmt wird. Diese Form wiederum bestimmt, welche Funktion dieses Protein wahrnehmen kann.

Welche Proteine der Körper bilden kann, ist im Erbgut, der DNA, festgelegt, die im Laufe des Humangenomprojekts vollständig kartiert wurde. Im Prinzip sind also die Aminosäuresequenzen sämtlicher Proteine des Körpers bekannt. Theoretisch müsste es daher möglich sein, die Form dieser Proteine aus ihrer Sequenz herzuleiten und damit ihre Funktion zu bestimmen.

Die bis vor kurzem besten Methoden zur Bestimmung von Proteinstrukturen sind die Kristallstrukturanalyse und die Kernspinresonanz. Beide sind jedoch äußerst zeit- und kostenaufwändig, nicht fehlerfrei und für einige Proteine (noch) nicht möglich. Deswegen versucht man, die Proteinstruktur rechnerisch anhand der Aminosäurestruktur vorherzusagen. Die Idee dahinter ist, dass aus allen möglichen Strukturen genau diejenige mit der niedrigsten Energie auch die Struktur sein wird, die ein Protein in der Natur einnimmt.

Das Problem dabei ist die ungeheure Menge an verschiedenen Strukturen, die eine Kette aus Aminosäuren bilden kann: Sie nimmt exponentiell mit der Anzahl an Aminosäuren zu. Viele Proteine bestehen aber aus hunderten oder tausenden Aminosäuren. Es hat also keinen Sinn, alle möglichen Strukturen durchzuprobieren, da die Wahrscheinlichkeit, dabei die richtige Struktur zu finden, extrem gering ist.

Die Strategie des Rosetta-Projekts besteht darin, die Strukturen kurzer Abschnitte von Proteinen aus bekannten Proteinen mit abschnittsweise gleichen Aminosäurefolgen zu erschließen und dann diese kurzen Abschnitte und die dazwischenliegenden Sequenzen miteinander zu verbinden. Dann werden zufällige räumliche Anordnungen dieser Abschnitte erzeugt und deren Energie berechnet. Dies geschieht in zwei Phasen, der „Sprungphase“, in der große Abschnitte bewegt werden, und einer nachfolgenden „Relaxationsphase“, in der die Struktur mit der niedrigsten Energie aus der Sprungphase nur minimal verändert wird, um langsam den tiefstgelegenen Ort in der „Energielandschaft“ zu finden, die das Ausgangsmodell umgibt.

Jeder beteiligte Computer erstellt für jedes Ausgangsmolekül mehrere (wenige bis einige Hundert), je nach Rechenleistung und Proteingröße) zufällige gewählte Modelle und geht dann die oben genannten Phasen durch. Jeder solche Versuch entspricht in etwa dem Vorgehen, an einer beliebigen Stelle auf einer Karte nach dem niedrigsten Punkt zu suchen und sich dabei zum Beispiel langsam an Bächen oder Wegen entlang zu arbeiten. Man wird dabei immer nur die tiefste Stelle in einer bestimmten Umgebung finden. Nur, wenn man diese Prozedur häufig an immer wieder anderen Stellen wiederholt, hat man mit hoher Wahrscheinlichkeit den tatsächlich tiefsten Punkt auf der Karte gefunden. Am Ende ist für jedes übermittelte Molekül auf jedem Rechner eine Struktur mit der absolut niedrigsten Energie in der untersuchten Umgebung gefunden, die an das Projekt übermittelt wird. Aus allen übermittelten Strukturen ist wiederum diejenige mit der absolut niedrigsten Energie am wahrscheinlichsten die, die der natürlichen Anordnung am besten entspricht. Jeder Teilnehmer hat also sozusagen eine oder mehrere Einzelkarten aus einer großen Sammlung von Karten eines viel größeren Gesamtgebiets durchforstet und das Projekt erhält für jeden Kartenteil nur die Lage des absolut niedrigsten Punktes in diesem Gebiet.

Ziel von Rosetta ist es, nicht nur häufig, sondern immer die richtige Struktur vorhersagen zu können und dies auch mit hoher Genauigkeit zu tun, was die Anordnung der einzelnen Atome angeht. Nur dann kann aus der Struktur auch sicher auf die Funktion des Proteins geschlossen werden. Neben Rosetta gibt es noch eine Reihe weiterer Computerprogramme, die anhand der Aminosäuresequenz die Struktur von Proteinen vorherzusagen versuchen. Allerdings gibt es noch keinen Algorithmus, der dies mit vertretbarem Aufwand zuverlässig berechnen kann. Rosetta@home testet verschiedene Algorithmen um eine zuverlässige Vorhersage zu ermöglichen.

Eine gelungene Strukturvorhersage würde es über die Bestimmung der Struktur natürlicher Proteine hinaus ermöglichen, künstlich Proteine mit ganz bestimmter Form und damit Funktion herzustellen. Diese Technik nennt man Proteindesign. Sie würde bahnbrechende Möglichkeiten bei der Bekämpfung vieler Krankheiten wie Aids, Krebs, Alzheimer etc. ermöglichen. Eine Reihe von Krankheiten entstehen z.B. dadurch, dass Proteine sich nicht in ihre eigentliche, natürliche Form falten, Alzheimer ist ein Beispiel dafür: Proteine, die eigentlich einzeln vorkommen sollten, verklumpen plötzlich zu so genannten Amyloid-Plaques und stören die Funktion unseres Gehirns.

Ein anderes Beispiel sind Virusinfektionen: Viren dringen in unsere Zellen ein und kapern dann deren Proteinfabriken. Sie lassen die Zellen tausende Kopien der Virenproteine und des Virenerbguts herstellen, die sich zu neuen Viren zusammensetzen, woran die Zelle schließlich stirbt. Anschließend werden viele tausend neue Viren im Körper freigesetzt, die wiederum neue Zellen infizieren.

Wenn man aber zentrale Virenproteine mit Hilfe genau passender, kleiner Proteine blockieren könnte, wäre auch die Infektion gestoppt. Man könnte z.B. die Bildung der Virenhülle oder überhaupt das Ablesen des viralen Erbguts durch die menschlichen Zellen verhindern. Genau darauf zielt das Proteindesign ab: besonders geeignete Angriffspunkte im Erbgut bzw. an den Proteinen der Viren sollen identifiziert durch gezielt entwickelte Moleküle blockiert werden.

Forscherwettbewerb zur Proteinstrukturvorhersage

Vom Mai bis August 2006 beteiligt sich Rosetta@home an dem zweijährlich stattfindenden Wettbewerb zur Proteinstrukturvorhersage CASP. Dr. Baker hat mit der Rosetta-Software schon an früheren Auflagen dieses Wettbewerbers teilgenommen und dabei bewiesen, dass Rosetta mit zu den besten Vorhersageinstrumenten zur Bestimmung der Proteinstruktur gehört. Es ist die Hoffnung beim diesjährigen Wettbewerb CASP7 zu demonstrieren, dass mit genügend Rechenleistung eine zuverlässige Vorhersage von kleineren bis mittelgroßen Proteinen möglich ist.

Baker Lab

Das Baker Laboratory hat seinen Sitz an der University of Washington.

Leitender Wissenschaftler ist David Baker, Professor der Biochemie an der University of Washington und Forscher am Howard Hughes Medical Institute, der im April 2006 zum Mitglied der United States National Academy of Science gewählt wurde.

Der wissenschaftlichen Mannschaft des BakerLabs gehören außerdem folgende Post-Doktoranden an: Philip Bradley, Kira Misura, Bill Schief, Jack Schonbrun, Vanita Sood, Gautam Dantas, Jim Havranek, Chuck Duarte, John Karanicolas, Bin Qian, Eric Althoff, Daniela Roethlisberger sowie zahlreiche Doktoranden und Gastwissenschaftler.

ESL

Das mit Abstand größte und leistungsstärkste an Rosetta@home beteiligte Team Electronic Sports League (ESL) geht auf einen Aufruf der ESL im März 2007 zurück, die (meist leistungsstarken) Spielerechner der ESL-Mitglieder für das Projekt zur Verfügung zu stellen. Insbesondere durch die Vergabe von Awards für langfristige Aktivität konnten innerhalb von wenigen Wochen viele Tausend Spieler gewonnen werden, die schon nach 2 Monaten für knappe 2% der Rechenleistung verantwortlich waren. Seit dem 4. September 2007 ist das ESL-Team das stärkste Rosetta Team mit fast 3,5% der gesamten Rechenleistung. Am 22.11 zog sich die ESL aus Rosetta zurück. Zu diesen Zeitpunkt hat die ESL etwa 4,5% der gesammten Rechenleistung erbracht. Da die teilnehmenden PCs nicht automatisch umgestellt werden ist es zur Zeit nicht möglich abzuschätzen wie sich das Team weiterentwickeln wird. Zur Zeit ist es aber unangefochten auf Platz 1 und dies scheint für die nächsten Wochen auch sichergestellt. Als Folgeprojekt wurde Spinhenge gewählt.

Quellen

Sämtliche genannten Informationen entstammen der Rosetta-Homepage und sind dort in den Wissenschafts-FAQs, dem Willkommensgruß von D. Baker und dem Forschungskonzept nachzulesen.

  1. http://www.boincstats.com/charts/chart_uk_rosetta_project_day_hosts.gif
  2. http://boinc.bakerlab.org/rosetta/rah_about.php

Siehe auch

 
Dieser Artikel basiert auf dem Artikel Rosetta@home aus der freien Enzyklopädie Wikipedia und steht unter der GNU-Lizenz für freie Dokumentation. In der Wikipedia ist eine Liste der Autoren verfügbar.
Ihr Bowser ist nicht aktuell. Microsoft Internet Explorer 6.0 unterstützt einige Funktionen auf ie.DE nicht.