Nexus (Bioinformatik)

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 17. Juni 2014 um 12:40 Uhr durch Nsda (Diskussion | Beiträge) (Nsda verschob die Seite Nexus (Dateiformat) nach Nexus (Bioinformatik): es gibt ein anderes Dateiformat gleichen Namens in der Streuphysik). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen

Das Nexus-Format ist ein in der systematischen Biologie und Bioinformatik weit verbreitetes Dateiformat, das in mehreren Computerprogrammen zur Stammbaumanalyse Anwendung findet.

Syntax

Nexus-Dateien sind Textdateien, die ein modulares Format aufweisen: Neben obligatorischen Blöcken können optionale Blöcke Informationen und Befehle für bestimmte Anwendungen enthalten. Jeder Block beginnt mit der Zeile BEGIN BlockName; und endet mit der Zeile END;. Sinnabschnitte innerhalb eines Blocks werden mit ; getrennt. Text zwischen eckigen Klammern wird als Kommentar aufgefasst und damit ignoriert. Die erste Zeile muss #NEXUS lauten.

Ein Beispiel für eine einfache Nexus-Datei mit einem Sequenzalignment ist:

#NEXUS
BEGIN data;[eröffnet den "Data"-Block]
Dimensions ntax=4 nchar=15; [Definiert die Größe des Alignments]
Format datatype=dna missing=? gap=-; [Definiert den Datentyp (DNA) und Symbole für fehlende Daten (?) und gaps (-)]
Matrix [hier beginnt das Alignment...]
Species1   atgctagctagctcg
Species2   atgcta??tag-tag
Species3   atgttagctag-tgg
Species4   atgttagctag-tag 
; [...und hier endet es]
END; [beendet den "Data"-Block]

Quellen

  • Maddison DR, Swofford DL, Maddison WP: NEXUS: An extensible file format for systematic information. In: Systematic Biology. Band 46, Nr. 4, 1997, S. 590–621, doi:10.1093/sysbio/46.4.590.
  • Detaillierter Artikel über das NEXUS-Format mit einer Liste von Schlüsselwörtern (englisch)