Protein Data Bank

Beispiele von Proteinstrukturen aus der PDB

Die Protein Data Bank (PDB) ist eine Open AccessDatenbank für 3D-Strukturdaten von großen biologischen Molekülen. Über ein Internet-Informationsportal und ein herunterladbares Datenarchiv bietet die PDB Zugang zu 3D-Strukturdaten für Proteine, DNA und RNA. Sie ist heute eine weltweit führende Ressource für experimentelle Daten, die für wissenschaftliche Entdeckungen von zentraler Bedeutung sind. Die Kenntnis der 3D-Struktur eines biologischen Makromoleküls ist wesentlich für das Verständnis seiner Funktion. Die Strukturdaten wurden üblicherweise durch Kristallstrukturanalyse oder NMR-Spektroskopie gewonnen.

Das Archiv der Proteindatenbank (PDB) enthält derzeit über 158.000 Einträge[1] (Stand 2019) als 3D-Strukturen von Biomolekülen auf atomarer Ebene.

Die PDB wurde 1971 als erste frei zugängliche, digitale Datenquelle in der Biologie eingerichtet und die Rechenzentren werden von der "Research Collaboratory for Structural Bioinformatics" (RCSB PDB) betrieben. Sie stellt PDB-Daten allen Datenkonsumenten kostenlos und ohne Nutzungseinschränkungen (Policies) zur Verfügung.

Die RCSB-PDB wird an den Standorten Rutgers, der State University of New Jersey und dem University of California San Diego/San Diego SupercomputerCenter betrieben. Durch eine einzigartige Vereinbarung werden PDB-Daten auch von anderen Partnern der Worldwide Protein Data Bank (einschließlich der Protein Data Bank Europe (PDBe)), Protein Data Bank Japan und der Biological Magnetic Resonance Bank zur Verfügung gestellt. Das RCSB-PDB-Team (das an der Rutgers University und der University of CaliforniaSan Diego tätig ist) ist jedoch der wwPDB-Archivbetreuer und ist auch für die Datenintegrität und die Notfallwiederherstellung verantwortlich. Die Betriebskosten des RCSB-PDB, einschließlich der Kosten für die Datenerstellung und ‑speicherung sowie andere Ausgaben belaufen sich auf insgesamt 6,9 Millionen US-Dollar pro Jahr.[2]

Geschichte

PDB setzte sich ursprünglich aus Proteinstrukturen aus der Röntgen-Kristallstrukturanalyse und dem 1968 gegründeten Brookhaven RAster Display (BRAD) zusammen. Das BRAD-System konnte digitalisierte Bilder von Hough-Powell-Blasenkammer-Fotografien auf einen Schwarz-Weiß-Fernsehmonitor zeichnen. Die Entwickler des BRAD-Systems erkannten das Potenzial des BRAD-Systems für 3D-Grafiken und Walter C. Hamilton, leitender Chemiker am Brookhaven National Laboratory, nutzte das Potenzial des BRAD-Displays für die 3D-Molekulargrafik. Zusammen mit Edgar Meyer (Texas A&M University) wurde das Programm DISPLAY, eine Software zur Speicherung von Atomkoordinaten in einem gemeinsamen Format eingeführt. Das Programm DISPLAY konnte 3D-Modelle mit bis zu 512 Atomen zeichnen.

Bis 1970 wurden in Brookhaven die verfügbaren Atomkoordinaten von Proteinen gesammelt und mit dem Programm PROIN in einem einheitlichen Format gespeichert. Wegen des beschränkten Zugangs zu grafischen Darstellungen wurden sie kaum allgemein verwendet; man konnte nur endlose Listen von Atomkoordinaten bewundern oder Messingstangen so biegen, dass sie wie versteinerte Regenwürmer aussahen. Daher wurde das 1971 von Meyer das Programm SEARCH[3] in FORTRAN geschrieben, um auf die PDB zuzugreifen und Koordinaten für die Offline-Anzeige bereitzustellen. Es konnte ein bestimmtes Protein aus der PDB auswählen und Atomkoordinaten auf der Grundlage von Atomtyp, Resttyp oder Sequenzbereich extrahieren[3]. Nach Hamiltons Tod 1973 übernahm Tom Koetzle die Leitung für die folgenden 20 Jahre. Im Jahr 1994 ging die Führung an Joel Sussman über.

Von Oktober 1998 bis Juni 1999 wurde PDB in das Research Collaboratory for Structural Bioinformatics (RCSB) übertragen.[4][5] Dort wurde Helen M. Berman of Rutgers University neue Direktorin.[6] Im Jahr 2003 wurde PDB mit der Gründung von Worldwide Protein Data Bank (wwPDB) international. Gründungsmitglieder sind PDBe (Europe),[7] RCSB (USA) und PDBj (Japan).[8] 2006 schloss sich die Biological Magnetic Resonance Bank (BMRB) an.[9] Jeder Eintrag wird durch die Mitarbeiter bearbeitet.[10][11]

Siehe auch

Literatur

Weblinks

Einzelnachweise

  1. PDB Statistics: Overall Growth of Released Structures Per Year. Abgerufen am 19. August 2020.
  2. Kevin P. Sullivan, Peggy Brennan-Tonetta, Lucas J. Marxen: Economic Impacts of the Research Collaboratory for Structural Bioinformatics (RCSB) Protein Data Bank. Rutgers New Jersey Agricultural Experiment Station, 2017, abgerufen am 19. August 2020.
  3. a b EF Meyer: The first years of the Protein Data Bank. In: Cambridge University Press (Hrsg.): Protein Science. 6, Nr. 7, 1997, S. 1591–1597. doi:10.1002/pro.5560060724. PMID 9232661. PMC 2143743 (freier Volltext).
  4. RCSB / Research Collaboratory for Structural Bioinformatics (Memento des Originals vom 5. Februar 2007 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.
  5. HM Berman, J Westbrook, Z Feng, G Gilliland, TN Bhat, H Weissig, IN Shindyalov, PE Bourne: The Protein Data Bank. In: Nucleic Acids Res.. 28, Nr. 1, Januar 2000, S. 235–242. doi:10.1093/nar/28.1.235. PMID 10592235. PMC 102472 (freier Volltext).
  6. RCSB PDB Newsletter Archive. RCSB Protein Data Bank.
  7. PDBe Protein Data Bank in Europe
  8. Welcome to PDBj
  9. BMRB / Biological Magnetic Resonance Bank
  10. E Curry, A Freitas, S O'Riáin: The Role of Community-Driven Data Curation for Enterprises. In: D. Wood (Hrsg.): Linking Enterprise Data. Springer US, Boston MA 2010, ISBN 978-1-4419-7664-2, S. 25–47.
  11. PDB Validation Suite