„FASTQ-Format“ – Versionsunterschied

FASTQ format
Dateiendung:	.fastq
Entwickelt von:	Wellcome Trust Sanger Institute
Erstveröffentlichung:	~2000
Art:	Bioinformatik
Erweitert von:	ASCII and FASTA format
	http://maq.sourceforge.net/fastq.shtml

Versionsgeschichte interaktiv durchsuchen

[ungesichtete Version]

← Zum vorherigen Versionsunterschied Zum nächsten Versionsunterschied →

Inhalt gelöscht Inhalt hinzugefügt

VisuellWikitext

Inline

Version vom 21. Februar 2023, 12:15 Uhr

Das FASTQ-Format ist ein textbasiertes Format zum Speichern einer biologischen Sequenz (meist Nukleotidsequenz) und ihrer entsprechenden Qualitätskennzahlen. Sowohl der Sequenzbuchstabe als auch die Qualitätskennzahl sind mit einem einzigen ASCII-Zeichen codiert.

Es wurde ursprünglich am Wellcome Trust Sanger Institute entwickelt, um eine Sequenz im FASTA-Format mit ihren Qualitätsdaten zu verbinden und gemeinsam abzuspeichern. Das Format ist aber mittlerweile zum Standard für die Speicherung von high-throughput Sequenzdaten geworden^[1].

Format

Eine FASTQ-Datei hat vier Zeilen pro Sequenz:

Zeile 1 beginnt mit einem „@“-Zeichen, gefolgt von einer Sequenzkennung und einer optionalen Beschreibung (wie eine FASTA-Titelzeile).
Zeile 2 beinhaltet die Sequenzbuchstaben.
Zeile 3 beginnt mit einem „+“-Zeichen und kann optional die selbe Sequenzkennung (und eine beliebigen Beschreibung) aufweisen.
Zeile 4 codiert die Qualitätskennzahlen für die Sequenz in Zeile 2 und muss die gleiche Anzahl an Symbolen enthalten wie Buchstaben in der Sequenz sin.

Eine FASTQ-Datei mit einer einzigen Sequenz kann folgendermaßen aussehen:

@SEQ_ID
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65

Vorlage:Reflist

MAQ webpage discussing FASTQ variants

↑ Peter J. A. Cock, Christopher J. Fields, Naohisa Goto, Michael L. Heuer, Peter M. Rice: The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants. In: Nucleic Acids Research. Band 38, Nr. 6, April 2010, ISSN 1362-4962, S. 1767–1771, doi:10.1093/nar/gkp1137, PMID 20015970, PMC 2847217 (freier Volltext) – (nih.gov [abgerufen am 21. Februar 2023]).

[1] Peter J. A. Cock, Christopher J. Fields, Naohisa Goto, Michael L. Heuer, Peter M. Rice: The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants. In: Nucleic Acids Research. Band 38, Nr. 6, April 2010, ISSN 1362-4962, S. 1767–1771, doi:10.1093/nar/gkp1137, PMID 20015970, PMC 2847217 (freier Volltext) – (nih.gov [abgerufen am 21. Februar 2023]).

[1]

@@ Zeile 13: / Zeile 13: @@
 Das FASTQ-Format ist ein textbasiertes [[Datenformat|Format]] zum Speichern  einer biologischen Sequenz (meist [[Nukleotidsequenz]]) und ihrer entsprechenden Qualitätskennzahlen. Sowohl der Sequenzbuchstabe als auch die Qualitätskennzahl sind mit einem einzigen [[Ascii|ASCII]]-Zeichen codiert.
-Es wurde ursprünglich am [[Wellcome Trust Sanger Institute]] entwickelt, um eine Sequenz im [[FASTA-Format|FASTA]]-Format mit ihren Qualitätsdaten zu verbinden und gemeinsam abzuspeichern. Das Format ist aber mittlerweile zum Standard für die Speicherung von high-throughput Sequenzdaten geworden.
+Es wurde ursprünglich am [[Wellcome Trust Sanger Institute]] entwickelt, um eine Sequenz im [[FASTA-Format|FASTA]]-Format mit ihren Qualitätsdaten zu verbinden und gemeinsam abzuspeichern. Das Format ist aber mittlerweile zum Standard für die Speicherung von high-throughput Sequenzdaten geworden<ref>{{Literatur |Autor=Peter J. A. Cock, Christopher J. Fields, Naohisa Goto, Michael L. Heuer, Peter M. Rice |Titel=The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants |Sammelwerk=Nucleic Acids Research |Band=38 |Nummer=6 |Datum=2010-04 |ISSN=1362-4962 |DOI=10.1093/nar/gkp1137 |PMC=2847217 |PMID=20015970 |Seiten=1767–1771 |Online=https://pubmed.ncbi.nlm.nih.gov/20015970 |Abruf=2023-02-21}}</ref>.
 == Format ==
@@ Zeile 28: / Zeile 28: @@
 +
 !''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
-</pre>
+</pre>{{reflist|35em}}
+* [http://maq.sourceforge.net/fastq.shtml MAQ] webpage discussing FASTQ variants
 [[Kategorie:Bioinformatik]]

FASTQ format
Dateiendung:	`.fastq`
Entwickelt von:	Wellcome Trust Sanger Institute
Erstveröffentlichung:	~2000
Art:	Bioinformatik
Erweitert von:	ASCII and FASTA format
http://maq.sourceforge.net/fastq.shtml

„FASTQ-Format“ – Versionsunterschied

Version vom 21. Februar 2023, 12:15 Uhr

Format

Navigationsmenü

Suche