„Folding@home“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Hintergrund
Zeile 18: Zeile 18:
Sein Hauptzweck ist die Bestimmung der Mechanismen der Proteinfaltung, d.&nbsp;h. des Prozesses, durch den Proteine ihre endgültige dreidimensionale Struktur erreichen, und die Untersuchung der Ursachen von Proteinfehlfaltungen. Dies ist von Interesse für die medizinische Forschung über [[Alzheimer-Krankheit|Alzheimer]], [[Chorea Huntington|Huntington]] und viele Formen von Krebs, neben weiteren, anderen Krankheiten. In geringerem Umfang versucht Folding@home auch, die endgültige Struktur eines Proteins vorherzusagen und zu bestimmen, wie andere Moleküle mit ihm interagieren können, was sich auf die Entwicklung von Medikamenten auswirkt. Folding@home wird vom Pande Laboratory der [[Stanford University]] gemeinnützig unter der Leitung von Prof. Vijay Pande entwickelt und betrieben und von verschiedenen wissenschaftlichen Einrichtungen und Forschungslabors weltweit kollektiv genutzt. Die von Folding@home generierten Ergebnisse werden nicht verkauft.<ref>{{Internetquelle |autor= |url=https://foldingathome.org/home/faq/ |titel=Folding @ Home FAQ |werk= |hrsg= |datum= |abruf=2020-03-06 |sprache=en}}</ref>
Sein Hauptzweck ist die Bestimmung der Mechanismen der Proteinfaltung, d.&nbsp;h. des Prozesses, durch den Proteine ihre endgültige dreidimensionale Struktur erreichen, und die Untersuchung der Ursachen von Proteinfehlfaltungen. Dies ist von Interesse für die medizinische Forschung über [[Alzheimer-Krankheit|Alzheimer]], [[Chorea Huntington|Huntington]] und viele Formen von Krebs, neben weiteren, anderen Krankheiten. In geringerem Umfang versucht Folding@home auch, die endgültige Struktur eines Proteins vorherzusagen und zu bestimmen, wie andere Moleküle mit ihm interagieren können, was sich auf die Entwicklung von Medikamenten auswirkt. Folding@home wird vom Pande Laboratory der [[Stanford University]] gemeinnützig unter der Leitung von Prof. Vijay Pande entwickelt und betrieben und von verschiedenen wissenschaftlichen Einrichtungen und Forschungslabors weltweit kollektiv genutzt. Die von Folding@home generierten Ergebnisse werden nicht verkauft.<ref>{{Internetquelle |autor= |url=https://foldingathome.org/home/faq/ |titel=Folding @ Home FAQ |werk= |hrsg= |datum= |abruf=2020-03-06 |sprache=en}}</ref>


== Das Projekt ==
== Hintergrund ==
[[Datei:Protein folding.png|mini|300px|Ein Protein vor und nach seiner Faltung. Das Protein liegt zunächst als ''[[Random Coil]]'' vor und wird schließlich so gefaltet, dass es in seiner nativen Konformation vorliegt.]]
[[Datei:Lossless-page1-400px-ACBP MSM from Folding@home.tiff.png|mini|Folding@home verwendet [[Hidden Markov Model|Markov-Zustandsmodelle]], wie das hier abgebildete, um die möglichen Formen und Faltungswege zu modellieren, die ein Protein annehmen kann, wenn es aus seinem anfänglich zufällig aufgewickelten Zustand (links) in seine native 3-D-Struktur (rechts) kondensiert.]]
Mittels [[Proteinfaltung|Faltung]] (''protein folding'') nimmt eine [[Aminosäuresequenz]] die für die Proteinfunktion notwendige Raumstruktur ein. Fehler bei der Faltung (''misfolding'') werden im Rahmen der Krankheitsentstehung ([[Alzheimer-Krankheit|Alzheimer]], [[Bovine spongiforme Enzephalopathie|BSE]] bzw. [[Creutzfeldt-Jakob-Krankheit]] oder [[Krebs (Medizin)|Krebs]]) diskutiert. Ziel des Projekts ist es, durch [[verteiltes Rechnen]] den räumlichen Aufbau bzw. den Aufbau von Proteinen zu verstehen und so die Entstehung und Heilung von daraus resultierenden Krankheiten zu erforschen.


Proteine ​​sind ein wesentlicher Bestandteil vieler biologischer Funktionen und sind allen Prozessen, die in Zellen ablaufen, beteiligt. Oftmals sind solche Proteine Enzyme, die biochemische Reaktionen ausführen, einschließlich [[Signaltransduktion]], molekularer Transport und Zellregulation. Einige Proteine ​​fungieren als [[Strukturprotein]]e, die als eine Art Gerüst für Zellen dienen und als Antikörper, während andere Proteine ​​am [[Immunsystem]] beteiligt sind. Damit ein Protein diese Funktionen ausführen kann, muss es sich in eine funktionelle dreidimensionale Struktur falten, ein Prozess, der häufig spontan abläuft und von Wechselwirkungen innerhalb seiner Aminosäuresequenz und Wechselwirkungen der Aminosäuren mit seiner Umgebung abhängt. Um die Proteinfaltung voranzutreiben, muss das Protein in seiner energetisch günstigsten Konformation, d.&nbsp;h. in seinem [[Nativer Zustand|nativen Zustand]], vorliegen. Für die Bioinformatik ist daher das Verständnis der Proteinfaltung wichtig, um bestimmte Funktionen und Mechanismen des Proteins vorherzusagen.<ref name="PMID19662155">F. Marinelli, F. Pietrucci, A. Laio, S. Piana: ''A kinetic model of trp-cage folding from multiple biased molecular dynamics simulations.'' In: ''PLoS Computational Biology.'' Band 5, Nummer 8, August 2009, S.&nbsp;e1000452, {{DOI|10.1371/journal.pcbi.1000452}}, PMID 19662155, {{PMC|2711228}}.</ref><ref name="PMID15994524">: ''So much more to know.'' In: ''[[Science]].'' Band 309, Nummer 5731, Juli 2005, S.&nbsp;78–102, {{DOI|10.1126/science.309.5731.78b}}, PMID 15994524.</ref> Obwohl die Faltung in einer zellulären Umgebung stattfindet, die eine hohe Konzentration an Proteinen aufweist (im Englischen als ''macromolecular crowding'' bekannt), verläuft sie normalerweise reibungslos. Aufgrund der chemischen Eigenschaften eines Proteins oder anderer Faktoren kann es zu Fehlfaltungen des Proteins kommen. Auch wenn zelluläre Mechanismen dazu beitragen, dass fehlgefaltete Proteine entfernt oder neu gefaltet werden, kann es zur [[Aggregation (Chemie)|Aggregation]] der fehlgefalteten Proteine kommen und eine Vielzahl von Krankheiten verursachen.<ref name="PMID18767168">H. Ecroyd, J. A. Carver: ''Unraveling the mysteries of protein folding and misfolding.'' In: ''IUBMB life.'' Band 60, Nummer 12, Dezember 2008, S.&nbsp;769–774, {{DOI|10.1002/iub.117}}, PMID 18767168 (Review).</ref> Laborexperimente zur Untersuchung von Proteinfaltungsprozessen sind hinsichtlich ihrem Anwendungsbereich und ihrer Genauigkeit eingeschränkt, weshalb physikalische Rechenmodelle hinzugezogen werden, die ein tieferes Verständnis zur Proteinfaltung, -fehlfaltung und -aggregation liefern.<ref name="PMID17585870">Y. Chen, F. Ding, H. Nie, A. W. Serohijos, S. Sharma, K. C. Wilcox, S. Yin, N. V. Dokholyan: ''Protein folding: then and now.'' In: ''Archives of biochemistry and biophysics.'' Band 469, Nummer 1, Januar 2008, S.&nbsp;4–19, {{DOI|10.1016/j.abb.2007.05.014}}, PMID 17585870, {{PMC|2173875}}.</ref><ref name="PMID18295611">L. M. Luheshi, D. C. Crowther, C. M. Dobson: ''Protein misfolding and disease: from the test tube to the organism.'' In: ''Current opinion in chemical biology.'' Band 12, Nummer 1, Februar 2008, S.&nbsp;25–31, {{DOI|10.1016/j.cbpa.2008.02.011}}, PMID 18295611 (Review).</ref>
Würde die Proteinfaltung lediglich auf den Rechnern der Universität Stanford simuliert, würde dies trotz hoher Rechenleistung der Universitätsrechner mehrere Jahrhunderte dauern. Ziel von Folding@home ist es daher, die benötigte Rechenleistung auf möglichst viele andere Rechner zu verteilen ([[Distributed Computing]]). Die beteiligten Rechner werden auf freiwilliger Basis von Unternehmen, öffentlichen Einrichtungen und Privatpersonen betrieben, die ihre Rechner und Rechenkapazität dem Projekt unentgeltlich zur Verfügung stellen. Damit wird die Rechenkapazität um ein Vielfaches erweitert, da der Hauptrechner nur noch die fertig erstellten Ergebnisse aufbereiten muss. Folding@home erreichte am 20. Mai 2016 eine Rechenleistung von über 100 [[Floating Point Operations Per Second|PetaFLOPS]]. Im Vergleich mit den aktuell schnellsten [[Supercomputer]]n weltweit würde Folding@home damit den zweiten Platz einnehmen. Zurzeit laufen mehrere Projekte, um die Rechenleistung um den Faktor 100 zu beschleunigen, ohne dass der Benutzer dafür neue Hardware benötigen würde.

Aufgrund der Komplexität der Proteinkonformation oder des [[Konfigurationsraum|Konfigurationsraums]] des Proteins (die Menge aller möglichen Faltungszustände, die ein Protein annehmen kann) und der begrenzten Rechenleistung sind Molekulardynamik-Simulationen hinsichtlich der Untersuchung von Proteinfaltungen stark eingeschränkt. Während sich die meisten Proteine typischerweise in der Größenordnung von Millisekunden falten<ref name="PMID17585870" /><ref name="PMID15869383">C. D. Snow, E. J. Sorin, Y. M. Rhee, V. S. Pande: ''How well can simulation predict protein folding kinetics and thermodynamics?'' In: ''Annual review of biophysics and biomolecular structure.'' Band 34, 2005, S.&nbsp;43–69, {{DOI|10.1146/annurev.biophys.34.040204.144447}}, PMID 15869383 (Review).</ref> konnten Simulationen vor 2010 nur Zeitskalen von Nanosekunden bis Mikrosekunden erreichen.<ref name="PMID20070076">V. A. Voelz, G. R. Bowman, K. Beauchamp, V. S. Pande: ''Molecular simulation of ab initio protein folding for a millisecond folder NTL9(1-39).'' In: ''[[Journal of the American Chemical Society]].'' Band 132, Nummer 5, Februar 2010, S.&nbsp;1526–1528, {{DOI|10.1021/ja9090353}}, PMID 20070076, {{PMC|2835335}}.</ref> [[Supercomputer]] wurden verwendet, um die Proteinfaltung zu simulieren, aber solche Systeme sind an sich kostspielig und werden typischerweise von vielen Forschungsgruppen gemeinsam genutzt. Da die Berechnungen in kinetischen Modellen zeitlich nacheinander erfolgen, ist zudem eine Skalierung traditioneller Molekulardynamik-Simulationen auf solche Systeme außerordentlich schwierig.<ref>A. Verma, S .M. Gopal, A. Schug, J. S. Oh, K. V. Klenin K. H. Lee, W. Wenzel: ''Massively Parallel All Atom Protein Folding in a Single Day'' In: ''Advances in Parallel Computing.'' Band 15, 2008, S.&nbsp;527–534, ISBN 978-1-58603-796-3.</ref><ref name="PMID12579582">V. S. Pande, I. Baker, J. Chapman, S. P. Elmer, S. Khaliq, S. M. Larson, Y. M. Rhee, M. R. Shirts, C. D. Snow, E. J. Sorin, B. Zagrovic: ''Atomistic protein folding simulations on the submillisecond time scale using worldwide distributed computing.'' In: ''Biopolymers.'' Band 68, Nummer 1, Januar 2003, S.&nbsp;91–109, {{DOI|10.1002/bip.10219}}, PMID 12579582.</ref> Da die Proteinfaltung ein stochastischer Prozess ist und im Laufe der Zeit statistisch variieren kann, ist es außerdem rechnerisch schwierig, lange Simulationen für umfassende Ansichten des Faltungsprozesses zu verwenden.<ref name="PMID21081274">G. R. Bowman, V. A. Voelz, V. S. Pande: ''Taming the complexity of protein folding.'' In: ''Current opinion in structural biology.'' Band 21, Nummer 1, Februar 2011, S.&nbsp;4–11, {{DOI|10.1016/j.sbi.2010.10.006}}, PMID 21081274, {{PMC|3042729}} (Review).</ref><ref name="DOI10.1137/06065146X">John D. Chodera, William C. Swope, Jed W. Pitera, Ken A. Dill: ''Long‐Time Protein Folding Dynamics from Short‐Time Molecular Dynamics Simulations.'' In: ''Multiscale Modeling & Simulation.'' Band 5, 2006, S.&nbsp;1214, {{DOI|10.1137/06065146X}}.</ref>

[[File:ACBP MSM from Folding@home.tiff|links|mini|400px|Folding@home verwendet [[Hidden Markov Model|Markov-Zustandsmodelle]], um die möglichen Formen und Faltungswege zu modellieren, die ein Protein annehmen kann, wenn es aus seinem anfänglichen ''Random-Coil''-Zustand (links) in seine native 3-D-Struktur (rechts) kondensiert.]]

Die Proteinfaltung erfolgt nicht in einem Schritt.<ref name="PMID18767168" /> Stattdessen verbringen Proteine ​​den größten Teil der gesamten Faltungzeit, in einigen Fällen mit bis zu 96&nbsp;%,<ref name="PMID22257762">R. B. Best: ''Atomistic molecular simulations of protein folding.'' In: ''Current opinion in structural biology.'' Band 22, Nummer 1, Februar 2012, S.&nbsp;52–61, {{DOI|10.1016/j.sbi.2011.12.001}}, PMID 22257762 (Review).</ref> in verschiedenen Konformationszwischenzuständen, die jeweils ein lokales thermodynamisches Minimum an [[Freie Energie|freier Energie]] in der Energielandschaft des Proteins darstellen (siehe [[Faltungstrichter]]). Durch einen Prozess namens ''Adaptive Sampling'' werden diese Konformationen von Folding@home als Ausgangspunkte für eine Reihe von Simulationsverläufen für Faltungsprozesse verwendet. Mit der Zeit werden neue Konformationen entdeckt, die als neue Ausgangspunkte für Simulationsverläufe dienen und aus diesem zyklischen Prozess schrittweise ein Hidden Markov Model (HMM) erstellt wird. HMM sind [[Zeitdiskretes Signal|zeitdiskrete]] [[Mastergleichung]]smodelle, welche die Konformations- und Energielandschaft eines Biomoleküls als eine Menge an unterschiedlichen Strukturen und kurzen Übergangszuständen zwischen den Strukturen beschreiben. Das Hidden Markov Model kombiniert mit Adaptive Sampling erhöht die Effizienz der Simulation erheblich, da dadurch die Berechnung innerhalb des lokalen Energieminimums vermieden wird und für verteilte Systeme (einschließlich [[GPUGRID]]) geeignet ist, da sie die statistische Anhäufung kurzer, unabhängiger Simulationsverläufe für Faltungsprozesse ermöglicht wird.<ref>{{Internetquelle |autor=T. J. Lane, Gregory Bowman, Robert McGibbon, Christian Schwantes, Vijay Pande, Bruce Borden |url=https://www.webcitation.org/6AqqrNstM?url=http://folding.stanford.edu/English/FAQ-Simulation |titel=Folding@home Simulation FAQ |werk=foldingathome.org |hrsg=Folding@home |datum=2012-09-21 |zugriff=2020-03-17}}</ref> Die Zeit, die zum Erstellen eines Hidden Markov Model benötigt wird, ist umgekehrt proportional zur Anzahl der parallelen Simulationen, d.&nbsp;h. zur Anzahl der verfügbaren [[Prozessor]]en. Mit anderen Worten wird eine parallele Verarbeitung geschaffen (siehe [[Parallelrechner]]), was zu einer Verringerung der gesamten Berechnungszeit um ungefähr vier Größenordnungen führt. Ein abgeschlossenes Hidden Markov Model kann bis zu zehntausend Zustände aus dem [[Phasenraum]] des Proteins (alle Konformationen, die ein Protein annehmen kann) und die Übergänge zwischen ihnen enthalten. Das Modell veranschaulicht Faltungsprozesse und -pfade und Forscher können später [[Kinetik (Chemie)|kinetische]] [[Clusteranalyse|Cluster]] verwenden, um eine sogenannte ''coarse-grained''-Darstellung (zu deutsch „grobkörnig“) des detaillierten Modells zu erstellen. Diese Hidden Markov Models können verwendet werden, um Fehlfaltungsprozesse zu bestimmen sowie Simulationen quantitativ mit Experimenten zu vergleichen.<ref name="PMID20570730">V. S. Pande, K. Beauchamp, G. R. Bowman: ''Everything you wanted to know about Markov State Models but were afraid to ask.'' In: ''Methods.'' Band 52, Nummer 1, September 2010, S.&nbsp;99–105, {{DOI|10.1016/j.ymeth.2010.06.002}}, PMID 20570730, {{PMC|2933958}} (Review).</ref><ref name="PMID21081274" /><ref name="PMID23626502">G. R. Bowman, D. L. Ensign, V. S. Pande: ''Enhanced modeling via network theory: Adaptive sampling of Markov state models.'' In: ''Journal of chemical theory and computation.'' Band 6, Nummer 3, 2010, S.&nbsp;787–794, {{DOI|10.1021/ct900620b}}, PMID 23626502, {{PMC|3637129}}.</ref>

Zwischen 2000 und 2010 hat sich die Aminosäuresequenz der von Folding@home untersuchten Proteine um den Faktor vier erhöht, während sich die Zeitskalen für Proteinfaltungssimulationen um sechs Größenordnungen erhöht haben.<ref>{{Internetquelle |autor=Vijay Pande |url=https://folding.typepad.com/news/2012/06/fahcon-2012-thinking-about-how-far-fah-has-come.html |titel=FAHcon 2012: Thinking about how far FAH has come |werk=typepad.com |hrsg=Folding@home |datum=2012-06-08 |zugriff=2020-03-17}}</ref> Im Jahr 2002 verwendete Folding@home Markov-Zustandsmodelle, um eine [[Prozessorzeit]] von ungefähr eine Million Tagen mit Simulationen über einen Zeitraum von mehreren Monaten durchzuführen<ref name="PMID12422224">C. D. Snow, H. Nguyen, V. S. Pande, M. Gruebele: ''Absolute comparison of simulated and experimental protein-folding dynamics.'' In: ''[[Nature]].'' Band 420, Nummer 6911, November 2002, S.&nbsp;102–106, {{DOI|10.1038/nature01160}}, PMID 12422224.</ref> und im Jahr 2011 erfolgte eine parallele Verarbeitung einer weiteren Simulation, die insgesamt eine Prozessorzeit von 10 Millionen Rechenstunden erforderte.<ref name="PMID21768345">K. A. Beauchamp, D. L. Ensign, R. Das, V. S. Pande: ''Quantitative comparison of villin headpiece subdomain simulations and triplet-triplet energy transfer experiments.'' In: ''[[Proceedings of the National Academy of Sciences]].'' Band 108, Nummer 31, August 2011, S.&nbsp;12734–12739, {{DOI|10.1073/pnas.1010880108}}, PMID 21768345, {{PMC|3150881}}.</ref> Im Januar 2010 simulierte Folding@home mithilfe von HMM die Dynamik des langsam faltenden [[NTL9]]-Proteins mit 32 Aminosäureresten mit einer Simulationszeit von 1,52 Millisekunden, eine Zeitskala, die mit experimentellen Vorhersagen der Faltungsrate übereinstimmt, aber tausendmal länger als die früher erreichte Zeit ist. Das Modell bestand aus vielen einzelnen Trajektorien, die jeweils um zwei Größenordnungen kürzer waren und lieferte eine genaue Darstellung der Energielandschaft des Proteins.<ref name="PMID20570730" /><ref name="PMID20070076" /><ref name="PMID21614208">T. H. Click, D. Ganguly, J. Chen: ''Intrinsically disordered proteins in a physics-based world.'' In: ''[[International Journal of Molecular Sciences]].'' Band 11, Nummer 12, 2010, S.&nbsp;5292–5309, {{DOI|10.3390/ijms11125292}}, PMID 21614208, {{PMC|3100817}} (Review).</ref>


== Performance ==
== Performance ==

Version vom 17. März 2020, 18:55 Uhr

Folding@home
Bereich: Medizin und Biologie
Ziel: Simulation der Proteinfaltung
Betreiber: Stanford University
Land: USA
Plattform: Windows, Linux, Mac OS X, Android, FreeBSD, ehemals BOINC
Website: https://foldingathome.org
Projektstatus
Status: aktiv
Beginn: 2000/2001
Ende: aktiv

Folding@home (oft auch kurz F@H oder FAH) ist ein verteiltes Computerprojekt für die Krankheitsforschung, das die Proteinfaltung und andere Arten von Molekulardynamik simuliert. Das Projekt nutzt im Rahmen des Volunteer-Computing die ungenutzten Verarbeitungsressourcen von Hunderttausenden von Personalcomputern, die sich im Besitz von Freiwilligen befinden, die die Software auf ihren Systemen installiert haben.

Sein Hauptzweck ist die Bestimmung der Mechanismen der Proteinfaltung, d. h. des Prozesses, durch den Proteine ihre endgültige dreidimensionale Struktur erreichen, und die Untersuchung der Ursachen von Proteinfehlfaltungen. Dies ist von Interesse für die medizinische Forschung über Alzheimer, Huntington und viele Formen von Krebs, neben weiteren, anderen Krankheiten. In geringerem Umfang versucht Folding@home auch, die endgültige Struktur eines Proteins vorherzusagen und zu bestimmen, wie andere Moleküle mit ihm interagieren können, was sich auf die Entwicklung von Medikamenten auswirkt. Folding@home wird vom Pande Laboratory der Stanford University gemeinnützig unter der Leitung von Prof. Vijay Pande entwickelt und betrieben und von verschiedenen wissenschaftlichen Einrichtungen und Forschungslabors weltweit kollektiv genutzt. Die von Folding@home generierten Ergebnisse werden nicht verkauft.[1]

Hintergrund

Ein Protein vor und nach seiner Faltung. Das Protein liegt zunächst als Random Coil vor und wird schließlich so gefaltet, dass es in seiner nativen Konformation vorliegt.

Proteine ​​sind ein wesentlicher Bestandteil vieler biologischer Funktionen und sind allen Prozessen, die in Zellen ablaufen, beteiligt. Oftmals sind solche Proteine Enzyme, die biochemische Reaktionen ausführen, einschließlich Signaltransduktion, molekularer Transport und Zellregulation. Einige Proteine ​​fungieren als Strukturproteine, die als eine Art Gerüst für Zellen dienen und als Antikörper, während andere Proteine ​​am Immunsystem beteiligt sind. Damit ein Protein diese Funktionen ausführen kann, muss es sich in eine funktionelle dreidimensionale Struktur falten, ein Prozess, der häufig spontan abläuft und von Wechselwirkungen innerhalb seiner Aminosäuresequenz und Wechselwirkungen der Aminosäuren mit seiner Umgebung abhängt. Um die Proteinfaltung voranzutreiben, muss das Protein in seiner energetisch günstigsten Konformation, d. h. in seinem nativen Zustand, vorliegen. Für die Bioinformatik ist daher das Verständnis der Proteinfaltung wichtig, um bestimmte Funktionen und Mechanismen des Proteins vorherzusagen.[2][3] Obwohl die Faltung in einer zellulären Umgebung stattfindet, die eine hohe Konzentration an Proteinen aufweist (im Englischen als macromolecular crowding bekannt), verläuft sie normalerweise reibungslos. Aufgrund der chemischen Eigenschaften eines Proteins oder anderer Faktoren kann es zu Fehlfaltungen des Proteins kommen. Auch wenn zelluläre Mechanismen dazu beitragen, dass fehlgefaltete Proteine entfernt oder neu gefaltet werden, kann es zur Aggregation der fehlgefalteten Proteine kommen und eine Vielzahl von Krankheiten verursachen.[4] Laborexperimente zur Untersuchung von Proteinfaltungsprozessen sind hinsichtlich ihrem Anwendungsbereich und ihrer Genauigkeit eingeschränkt, weshalb physikalische Rechenmodelle hinzugezogen werden, die ein tieferes Verständnis zur Proteinfaltung, -fehlfaltung und -aggregation liefern.[5][6]

Aufgrund der Komplexität der Proteinkonformation oder des Konfigurationsraums des Proteins (die Menge aller möglichen Faltungszustände, die ein Protein annehmen kann) und der begrenzten Rechenleistung sind Molekulardynamik-Simulationen hinsichtlich der Untersuchung von Proteinfaltungen stark eingeschränkt. Während sich die meisten Proteine typischerweise in der Größenordnung von Millisekunden falten[5][7] konnten Simulationen vor 2010 nur Zeitskalen von Nanosekunden bis Mikrosekunden erreichen.[8] Supercomputer wurden verwendet, um die Proteinfaltung zu simulieren, aber solche Systeme sind an sich kostspielig und werden typischerweise von vielen Forschungsgruppen gemeinsam genutzt. Da die Berechnungen in kinetischen Modellen zeitlich nacheinander erfolgen, ist zudem eine Skalierung traditioneller Molekulardynamik-Simulationen auf solche Systeme außerordentlich schwierig.[9][10] Da die Proteinfaltung ein stochastischer Prozess ist und im Laufe der Zeit statistisch variieren kann, ist es außerdem rechnerisch schwierig, lange Simulationen für umfassende Ansichten des Faltungsprozesses zu verwenden.[11][12]

Folding@home verwendet Markov-Zustandsmodelle, um die möglichen Formen und Faltungswege zu modellieren, die ein Protein annehmen kann, wenn es aus seinem anfänglichen Random-Coil-Zustand (links) in seine native 3-D-Struktur (rechts) kondensiert.

Die Proteinfaltung erfolgt nicht in einem Schritt.[4] Stattdessen verbringen Proteine ​​den größten Teil der gesamten Faltungzeit, in einigen Fällen mit bis zu 96 %,[13] in verschiedenen Konformationszwischenzuständen, die jeweils ein lokales thermodynamisches Minimum an freier Energie in der Energielandschaft des Proteins darstellen (siehe Faltungstrichter). Durch einen Prozess namens Adaptive Sampling werden diese Konformationen von Folding@home als Ausgangspunkte für eine Reihe von Simulationsverläufen für Faltungsprozesse verwendet. Mit der Zeit werden neue Konformationen entdeckt, die als neue Ausgangspunkte für Simulationsverläufe dienen und aus diesem zyklischen Prozess schrittweise ein Hidden Markov Model (HMM) erstellt wird. HMM sind zeitdiskrete Mastergleichungsmodelle, welche die Konformations- und Energielandschaft eines Biomoleküls als eine Menge an unterschiedlichen Strukturen und kurzen Übergangszuständen zwischen den Strukturen beschreiben. Das Hidden Markov Model kombiniert mit Adaptive Sampling erhöht die Effizienz der Simulation erheblich, da dadurch die Berechnung innerhalb des lokalen Energieminimums vermieden wird und für verteilte Systeme (einschließlich GPUGRID) geeignet ist, da sie die statistische Anhäufung kurzer, unabhängiger Simulationsverläufe für Faltungsprozesse ermöglicht wird.[14] Die Zeit, die zum Erstellen eines Hidden Markov Model benötigt wird, ist umgekehrt proportional zur Anzahl der parallelen Simulationen, d. h. zur Anzahl der verfügbaren Prozessoren. Mit anderen Worten wird eine parallele Verarbeitung geschaffen (siehe Parallelrechner), was zu einer Verringerung der gesamten Berechnungszeit um ungefähr vier Größenordnungen führt. Ein abgeschlossenes Hidden Markov Model kann bis zu zehntausend Zustände aus dem Phasenraum des Proteins (alle Konformationen, die ein Protein annehmen kann) und die Übergänge zwischen ihnen enthalten. Das Modell veranschaulicht Faltungsprozesse und -pfade und Forscher können später kinetische Cluster verwenden, um eine sogenannte coarse-grained-Darstellung (zu deutsch „grobkörnig“) des detaillierten Modells zu erstellen. Diese Hidden Markov Models können verwendet werden, um Fehlfaltungsprozesse zu bestimmen sowie Simulationen quantitativ mit Experimenten zu vergleichen.[15][11][16]

Zwischen 2000 und 2010 hat sich die Aminosäuresequenz der von Folding@home untersuchten Proteine um den Faktor vier erhöht, während sich die Zeitskalen für Proteinfaltungssimulationen um sechs Größenordnungen erhöht haben.[17] Im Jahr 2002 verwendete Folding@home Markov-Zustandsmodelle, um eine Prozessorzeit von ungefähr eine Million Tagen mit Simulationen über einen Zeitraum von mehreren Monaten durchzuführen[18] und im Jahr 2011 erfolgte eine parallele Verarbeitung einer weiteren Simulation, die insgesamt eine Prozessorzeit von 10 Millionen Rechenstunden erforderte.[19] Im Januar 2010 simulierte Folding@home mithilfe von HMM die Dynamik des langsam faltenden NTL9-Proteins mit 32 Aminosäureresten mit einer Simulationszeit von 1,52 Millisekunden, eine Zeitskala, die mit experimentellen Vorhersagen der Faltungsrate übereinstimmt, aber tausendmal länger als die früher erreichte Zeit ist. Das Modell bestand aus vielen einzelnen Trajektorien, die jeweils um zwei Größenordnungen kürzer waren und lieferte eine genaue Darstellung der Energielandschaft des Proteins.[15][8][20]

Performance

Zwischen Juni 2007 und Juni 2011 übertraf Folding@home die Leistung des schnellsten Supercomputers der TOP500. Er wurde jedoch im November 2011 vom Computer K und im Juni 2012 vom Computer Blue Gene/Q in den Schatten gestellt. Am 16. September 2007 erreichte das Folding@home-Projekt, vor allem dank der Beteiligung von PlayStation 3-Konsolen, offiziell ein dauerhaftes Leistungsniveau, das höher als ein natives petaFLOPS war, und wurde damit zum ersten Computersystem überhaupt, das dies erreicht hat.[21]

Im darauf folgenden Jahr, am 7. Mai 2008, erreichte das Projekt ein nachhaltiges Leistungsniveau, das höher als zwei einheimische petaFLOPS war, gefolgt von den drei und vier einheimischen petaFLOPS-Meilensteinen im August 2008 bzw. am 28. September 2008.[22]

Am 11. Mai 2016 gab Folding@home bekannt, dass es sich auf das Erreichen der 100 x86 petaFLOPS-Marke zubewegt.[23]

Am 19. Juli 2016 wurde bekannt gegeben, dass man die 100 petaFLOPS überschritten habe.[24]

Die Software

Jeder Benutzer eines PCs mit Windows, Mac OS X oder Linux kann ein Programm herunterladen, welches als Dienst im Hintergrund arbeitet. Die aktuelle Version (7.5.1) unterstützt Einkern- und Mehrkernprozessoren sowie auch Grafikkarten von Nvidia und AMD. Für die PlayStation 3 gab es ebenfalls eine Version, die jedoch mittlerweile eingestellt wurde.[25] Mit über einer Million PS3-Teilnehmern steht dieses Projekt als bisher leistungsstärkstes verteiltes Rechnernetzwerk im Guinness-Buch der Rekorde.[26]

Für Notebooks gibt es die Möglichkeit, dass Folding@home mit seiner Arbeit ruht, wenn diese ihre Energie aus den Akkus beziehen, was ihre Laufzeiten verlängert.

Arbeitseinheit / Work Unit

Eine Arbeitseinheit sind die Proteindaten, die der Client zu verarbeiten hat. Arbeitseinheiten sind ein Bruchteil der Simulation zwischen den Zuständen in einem Markov-Zustandsmodell. Nachdem die Arbeitseinheit heruntergeladen und vollständig vom Computer verarbeitet wurde, wird sie an die Folding@home-Server zurückgegeben, die dem User dann Kreditpunkte erteilen. Dieser Zyklus wiederholt sich automatisch. Alle Arbeitseinheiten haben zugehörige Fristen, und wenn diese Fristen überschritten werden, erhält der Benutzer möglicherweise keine Kreditpunkte und die Einheiten werden automatisch an einen anderen Teilnehmer neu vergeben. Da die Proteinfaltung seriell erfolgt und viele Arbeitseinheiten aus ihren Vorgängern generiert werden, kann der gesamte Simulationsprozess normal ablaufen, wenn eine Arbeitseinheit nicht nach einer angemessenen Zeitspanne zurückgegeben wird. Aufgrund dieser Fristen ist die Mindestsystemvoraussetzung für Folding@home ein Pentium 3 450 MHz CPU mit Streaming SIMD Extensions (SSE). Arbeitseinheiten für Hochleistungskunden haben jedoch eine viel kürzere Frist als die für den Uniprozessor-Kunden, da ein großer Teil des wissenschaftlichen Nutzens von der schnellen Fertigstellung der Simulationen abhängt.

Vor der öffentlichen Freigabe durchlaufen die Arbeitseinheiten mehrere Qualitätssicherungsschritte, um zu verhindern, dass problematische Einheiten vollständig verfügbar werden. Diese Testphasen umfassen interne, Beta- und fortgeschrittene Phasen, bevor eine endgültige vollständige Freigabe über Folding@home erfolgt.[145]

Die Arbeitseinheiten von Folding@home werden normalerweise nur einmal verarbeitet, außer in dem seltenen Fall, dass bei der Verarbeitung Fehler auftreten. Tritt dieser Fall bei drei verschiedenen Anwendern auf, wird die Einheit automatisch aus der Verteilung gezogen.

Client V7 für Mac, Windows & Linux

Der V7-Client ist die siebte und neueste Generation der Folding@home-Client-Software und stellt eine vollständige Neufassung und Vereinheitlichung der früheren Clients für die Betriebssysteme Windows, MacOS und Linux dar.[27][28]

Er wurde am 22. März 2012 veröffentlicht. Wie seine Vorgänger kann V7 Folding@home im Hintergrund mit einer sehr niedrigen Priorität laufen, sodass andere Anwendungen die CPU-Ressourcen nach Bedarf nutzen können. Es ist so konzipiert, dass die Installation, die Inbetriebnahme und der Betrieb für Anfänger benutzerfreundlicher sind und den Forschern eine größere wissenschaftliche Flexibilität bieten als frühere Clients. V7 verwendet Trac für die Verwaltung seiner Bug-Tickets, so dass die Benutzer den Entwicklungsprozess sehen und Feedback geben können.

V7 besteht aus vier integrierten Elementen. Der Benutzer interagiert typischerweise mit der Open-Source-GUI von V7, genannt FAHControl. Diese verfügt über die Benutzeroberflächenmodi "Novice", "Advanced" und "Expert" und bietet die Möglichkeit, viele entfernte Faltclients von einem Computer aus zu überwachen, zu konfigurieren und zu steuern.

FAHControl steuert den FAHClient, eine Back-End-Anwendung, die wiederum jeden FAHSlot (oder Slot) verwaltet.[29] Jeder Slot fungiert als Ersatz für die ehemals unterschiedlichen Folding@home v6 Uniprozessor-, SMP- oder GPU-Computer-Clients, da er Arbeitseinheiten unabhängig voneinander herunterladen, verarbeiten und hochladen kann. Die FAHViewer-Funktion, die dem Viewer der PS3 nachempfunden ist, zeigt, falls verfügbar, eine Echtzeit-3D-Darstellung des gerade bearbeiteten Proteins an.

Chrome

Im Jahr 2014 wurde ein Client für die Webbrowser Google Chrome und Chromium veröffentlicht, mit dem Benutzer Folding@home in ihrem Webbrowser ausführen können. Der Client verwendet Googles Native-Client-Funktion (NaCl) auf Chromium-basierten Webbrowsern, um den Folding@Home-Code mit nahezu nativer Geschwindigkeit in einer Sandbox auf dem Rechner des Benutzers auszuführen. Aufgrund des Auslaufens von NaCl und Änderungen bei Folding@Home wurde der Web-Client im Juni 2019 endgültig abgeschaltet.[30]

Android

Im Juli 2015 wurde ein Client für Android-Handys auf Google Play für Geräte mit Android 4.4 KitKat oder neuer veröffentlicht.

Am 16. Februar 2018 wurde der Android-Client, der in Zusammenarbeit mit Sony angeboten wurde, aus dem Google Play entfernt. Es wurden Pläne angekündigt, in Zukunft eine Open-Source-Alternative anzubieten, Stand März 2020 existierte jedoch kein neuer Android Client.[31]

Punkte

Wie bei vielen anderen Projekten, die verteiltes Rechnen anwenden, werden auch bei Folding@home Statistiken in Form eines Punktesystems über die beigetragene Rechenleistung erstellt.[32] Durchschnittlich laufen zwischen 500 und 550 Projekte unter Folding@home,[33] wobei es für jedes Projekt individuelle Basispunkte gibt, die von einem Referenz-PC festgelegt werden. Für jede fertig berechnete Arbeitseinheit (Work Unit) eines Projekts erhält der Benutzer die dafür vorgesehenen Basispunkte. Diese Punkte lassen sich jedoch vervielfachen (Bonuspunkte), je schneller eine Work Unit fertiggestellt wird. Voraussetzung für den Erhalt von Punkten ist eine Registrierung beim Projekt mit einem Benutzernamen. Um Bonuspunkte zu erhalten, ist zusätzlich die Verwendung eines sogenannten "Passkey" erforderlich.[34]

Jeder Benutzer kann wählen, ob seine Rechenleistung anonym (keine Punkte), nur unter seinem Benutzernamen oder auch für ein Team gezählt wird.

GPU-Unterstützung

Datei:Fah-gpu-nvidia.jpg
GPU Client

Der Folding@home-Client kann für die Berechnung, je nach Einstellung, neben der CPU auch die GPU heranziehen. Unterstützt werden Grafikkarten von Nvidia und AMD. Voraussetzung für Nvidia-Grafikkarten ist die CUDA-Technik (ab G80 mit GeForce-Treiber ab 174.55).[35] AMD-Grafikkarten werden ab der HD5000er-Serie unterstützt. Die Grafikeinheiten sämtlicher APUs von AMD, egal ob Desktop oder Notebook, können mittlerweile ebenso verwendet werden. Dabei greift der V7-Client auf den Standard OpenCL zurück.

Ergebnisse

Insgesamt wurden 205 Publikationen (Stand 31. Dezember 2018) als direktes Ergebnis von Folding@home veröffentlicht.[36] Einige Daten stehen jedem kostenlos zur freien Verfügung.[37]

Verwandte Projekte

Rosetta@home, Predictor@home und POEM@home waren bzw. sind Projekte, die das gleiche Ziel haben, aber andere Methoden anwenden. Foldit etwa ist ein experimentelles Computerspiel, welches Wissenschaftlern bei der Optimierung von Proteinen helfen soll.

Weblinks

Commons: Folding@home – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

  1. Folding @ Home FAQ. Abgerufen am 6. März 2020 (englisch).
  2. F. Marinelli, F. Pietrucci, A. Laio, S. Piana: A kinetic model of trp-cage folding from multiple biased molecular dynamics simulations. In: PLoS Computational Biology. Band 5, Nummer 8, August 2009, S. e1000452, doi:10.1371/journal.pcbi.1000452, PMID 19662155, PMC 2711228 (freier Volltext).
  3. : So much more to know. In: Science. Band 309, Nummer 5731, Juli 2005, S. 78–102, doi:10.1126/science.309.5731.78b, PMID 15994524.
  4. a b H. Ecroyd, J. A. Carver: Unraveling the mysteries of protein folding and misfolding. In: IUBMB life. Band 60, Nummer 12, Dezember 2008, S. 769–774, doi:10.1002/iub.117, PMID 18767168 (Review).
  5. a b Y. Chen, F. Ding, H. Nie, A. W. Serohijos, S. Sharma, K. C. Wilcox, S. Yin, N. V. Dokholyan: Protein folding: then and now. In: Archives of biochemistry and biophysics. Band 469, Nummer 1, Januar 2008, S. 4–19, doi:10.1016/j.abb.2007.05.014, PMID 17585870, PMC 2173875 (freier Volltext).
  6. L. M. Luheshi, D. C. Crowther, C. M. Dobson: Protein misfolding and disease: from the test tube to the organism. In: Current opinion in chemical biology. Band 12, Nummer 1, Februar 2008, S. 25–31, doi:10.1016/j.cbpa.2008.02.011, PMID 18295611 (Review).
  7. C. D. Snow, E. J. Sorin, Y. M. Rhee, V. S. Pande: How well can simulation predict protein folding kinetics and thermodynamics? In: Annual review of biophysics and biomolecular structure. Band 34, 2005, S. 43–69, doi:10.1146/annurev.biophys.34.040204.144447, PMID 15869383 (Review).
  8. a b V. A. Voelz, G. R. Bowman, K. Beauchamp, V. S. Pande: Molecular simulation of ab initio protein folding for a millisecond folder NTL9(1-39). In: Journal of the American Chemical Society. Band 132, Nummer 5, Februar 2010, S. 1526–1528, doi:10.1021/ja9090353, PMID 20070076, PMC 2835335 (freier Volltext).
  9. A. Verma, S .M. Gopal, A. Schug, J. S. Oh, K. V. Klenin K. H. Lee, W. Wenzel: Massively Parallel All Atom Protein Folding in a Single Day In: Advances in Parallel Computing. Band 15, 2008, S. 527–534, ISBN 978-1-58603-796-3.
  10. V. S. Pande, I. Baker, J. Chapman, S. P. Elmer, S. Khaliq, S. M. Larson, Y. M. Rhee, M. R. Shirts, C. D. Snow, E. J. Sorin, B. Zagrovic: Atomistic protein folding simulations on the submillisecond time scale using worldwide distributed computing. In: Biopolymers. Band 68, Nummer 1, Januar 2003, S. 91–109, doi:10.1002/bip.10219, PMID 12579582.
  11. a b G. R. Bowman, V. A. Voelz, V. S. Pande: Taming the complexity of protein folding. In: Current opinion in structural biology. Band 21, Nummer 1, Februar 2011, S. 4–11, doi:10.1016/j.sbi.2010.10.006, PMID 21081274, PMC 3042729 (freier Volltext) (Review).
  12. John D. Chodera, William C. Swope, Jed W. Pitera, Ken A. Dill: Long‐Time Protein Folding Dynamics from Short‐Time Molecular Dynamics Simulations. In: Multiscale Modeling & Simulation. Band 5, 2006, S. 1214, doi:10.1137/06065146X.
  13. R. B. Best: Atomistic molecular simulations of protein folding. In: Current opinion in structural biology. Band 22, Nummer 1, Februar 2012, S. 52–61, doi:10.1016/j.sbi.2011.12.001, PMID 22257762 (Review).
  14. T. J. Lane, Gregory Bowman, Robert McGibbon, Christian Schwantes, Vijay Pande, Bruce Borden: Folding@home Simulation FAQ. In: foldingathome.org. Folding@home, 21. September 2012, abgerufen am 17. März 2020.
  15. a b V. S. Pande, K. Beauchamp, G. R. Bowman: Everything you wanted to know about Markov State Models but were afraid to ask. In: Methods. Band 52, Nummer 1, September 2010, S. 99–105, doi:10.1016/j.ymeth.2010.06.002, PMID 20570730, PMC 2933958 (freier Volltext) (Review).
  16. G. R. Bowman, D. L. Ensign, V. S. Pande: Enhanced modeling via network theory: Adaptive sampling of Markov state models. In: Journal of chemical theory and computation. Band 6, Nummer 3, 2010, S. 787–794, doi:10.1021/ct900620b, PMID 23626502, PMC 3637129 (freier Volltext).
  17. Vijay Pande: FAHcon 2012: Thinking about how far FAH has come. In: typepad.com. Folding@home, 8. Juni 2012, abgerufen am 17. März 2020.
  18. C. D. Snow, H. Nguyen, V. S. Pande, M. Gruebele: Absolute comparison of simulated and experimental protein-folding dynamics. In: Nature. Band 420, Nummer 6911, November 2002, S. 102–106, doi:10.1038/nature01160, PMID 12422224.
  19. K. A. Beauchamp, D. L. Ensign, R. Das, V. S. Pande: Quantitative comparison of villin headpiece subdomain simulations and triplet-triplet energy transfer experiments. In: Proceedings of the National Academy of Sciences. Band 108, Nummer 31, August 2011, S. 12734–12739, doi:10.1073/pnas.1010880108, PMID 21768345, PMC 3150881 (freier Volltext).
  20. T. H. Click, D. Ganguly, J. Chen: Intrinsically disordered proteins in a physics-based world. In: International Journal of Molecular Sciences. Band 11, Nummer 12, 2010, S. 5292–5309, doi:10.3390/ijms11125292, PMID 21614208, PMC 3100817 (freier Volltext) (Review).
  21. Crossing the petaflop barrier. Abgerufen am 6. März 2020.
  22. 3 PetaFLOP barrier - PetScience. Abgerufen am 6. März 2020 (englisch).
  23. Closing in on 100 petaFLOPS. Abgerufen am 6. März 2020 (englisch).
  24. A significant milestone: 100 petaFLOPS. 19. Juli 2016, abgerufen am 6. März 2020 (englisch).
  25. Nico Jurran: Firmware-Update für PS3: Vita-Trophäen rein, Folding@home raus. 22. Oktober 2012. Auf heise online abgerufen am 8. Januar 2019.
  26. PS3 network enters record books. 2. November 2007. In: One-Minute World News. Auf BBC News, abgerufen am 8. Januar 2019.
  27. Windows V7 Client. Abgerufen am 6. März 2020 (englisch).
  28. Client version 7 now in open beta. Abgerufen am 6. März 2020.
  29. Link to GPL in FAHControl. Abgerufen am 6. März 2020.
  30. Folding@home Chrome Client. Abgerufen am 6. März 2020.
  31. android-client-overhaul. Abgerufen am 6. März 2020 (englisch).
  32. Folding@home: FAQ-Points (Memento des Originals vom 19. Juli 2013 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/folding.stanford.edu
  33. Folding@Home: Projects Summary
  34. Folding@home: FAQ-Passkey (Memento des Originals vom 16. Juli 2013 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/folding.stanford.edu
  35. ComputerBase: Folding@Home Client für Nvidia-GPUs ist raus
  36. Papers & Results. Auf FoldingAtHome, abgerufen am 8. Januar 2019.
  37. FAQ. Auf FoldingAtHome, abgerufen am 8. Januar 2019.
Dieser Artikel befindet sich in einer Auszeichnungskandidatur und wird neu bewertet, beteilige dich an der Diskussion!