Diskussion:BLAST-Algorithmus
Dieser Artikel beschreibt nicht den BLAST-Algorithmus, sonder die daraus entstandenen BLAST-Tools! Der Algorithmus wird beschrieben durch Seeding, Stitching, Berechnung der Signifikanz durch Karlin Altschul Statistiken und Extremwertverteilung!
wie ist die Schreibweise: BLAST-Algorithmus oder Blast Algorithmus? --chd 00:18, 29. Mai 2003 (CEST)
- Soweit ich weiß ist BLAST korrekt --Urbanus 02:04, 29. Mai 2003 (CEST)
- BLAST ist korrekt, (steht auch im angegebenen Paper) immerhin handelt es sich dabei um eine Abkürzung. Artikel wird grad grundsätzlich überarbeitet, bitte nicht wundern! Dante hd 10:06, 21. Jan 2006 (CET)
Blast ermöglicht nicht wirklich eine unscharfe Mustererkennung. Query und Target werden in kleine Blöcke unterteilt (z. B. 3 bei AS, 11 bei Nukleotiden). Zwischen diesen Blöcken werden Übereinstimmungen gesucht, die dann verlängert werden. Ob das eine unscharfe Mustererkennung ermöglicht bezweifel ich.
Doch unscharfe Erkennung ist möglich da ja BLAST und FASTA auf Sequenzalignment beruhen, d.h. Fehler in den Sequenzen werden toleriert, verschlechtern aber den Score.
Unscharf schon, Mustererkennung ist aber etwas anderes.
Nein in den Index-Alignments ist, zumindest bei Nukleotidsequenzen keine "unschärfe" möglich. Hier müssen die beiden Sequenzen identisch sein. Bei Proteinsequenzen ist es mgl auch ähnliche AS im Index zuzulassen. --Jann 01:56, 4. Jul. 2008 (CEST)
Definition E-value
[Quelltext bearbeiten]Die Definition von E-Wert war falsch:
Der E-Wert gibt an, mit welcher Wahrscheinlichkeit man Ergebnisse mit gleichem Score in einer Datenbank, in welcher sich zufällig generierte Sequenzen befinden, erzielen könnte (je kleiner, desto besser)
richtig ist:
Der E-Wert gibt die erwartete Anzahl (daher E="expected") der Hits an,
deren score mindestens so gross ist wie der beobachtete.
So wie es vorher im Artikel stand waere es fast die Definition des p-Wertes (p="probability"), nur muesste es dann auch heissen mit gleichem Score oder groesser
Sinn
[Quelltext bearbeiten]Hallo, ich weiß nicht, ob ich auf der Leitung stehen, aber macht Man kann diese Möglichkeit nutzen, um eine mögliche Translation einer unbekannten Nukleotidsequenz zu finden. wirklich Sinn? Eine Translation einer unbekannten Nukleotidsequenz ist meiner Ansicht nach eine beliebige Anzahl verschiedener oder gleicher Aminosäuren in beliebiger Reihenfolge. Das sollte doch wohl eher ..bekannten.. heißen oder nicht? Über Aufklärung bin ich dankbar. --Jan Kiro 09:58, 11. Jun. 2009 (CEST)
Merkwürdiger Satz
[Quelltext bearbeiten]„Die Idee des Algorithmus basiert auf der Wahrscheinlichkeit, dass Alignments mit vielen Treffern kurze Stücke von großer Identität besitzen.“
Dieser Satz ist irgendwie verkorkst. Zumindest ist er nicht allgemeinverständlich. Was soll er aussagen? --77.1.99.99 23:00, 28. Mär. 2020 (CET)
- Ich glaube das soll soviel heißen wie
- "Die Idee des Algorithmus basiert auf der Annahme, dass gute Alignments viele kurze Stücke hoher Übereinstimmung/Identität besitzen"
- Wenn das jemand so bestätigen kann, sollte man das vielleicht abändern --Cydhra (Diskussion) 23:58, 5. Jun. 2022 (CEST)