GenBank

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

GenBank ist eine der drei im INSDC zusammengeschlossenen DNA-Sequenzdatenbanken und wird vom US-amerikanischen National Center for Biotechnology Information betrieben. Im Februar 2023 enthielt die Datenbank mehr als 240 Millionen Sequenzen mit zusammen über 1700 Milliarden Basen.[1] Neben GenBank existieren auch noch das European Nucleotide Archive (ENA) des European Molecular Biology Laboratory (EMBL-Bank) und die DNA Data Bank of Japan (DDBJ). Die Sequenzdaten dieser drei Datenbanken werden täglich untereinander abgeglichen, im Rahmen der Internationalen Nukleotidsequenz-Datenbank-Zusammenarbeit (INSDC).

Da die in diesen Datenbanken enthaltenen Sequenzinformationen eine wichtige Grundlage für die Arbeit von Forschern darstellen, verlangen die meisten wissenschaftlichen Zeitschriften die Ablage von neuen Sequenzdaten in einem dieser Archive.

GenBank ist frei zugänglich. Sequenzdaten können von jedermann mittels Webschnittstelle, Konsolenanwendung,[2] oder FTP abgerufen werden.

  1. GenBank and WGS Statistics. Abgerufen am 8. April 2023.
  2. Command line tools. Abgerufen am 8. April 2023 (englisch).