Benutzer:Dirk123456/Baustellenbaustelle 001/Baustelle-3/Baustelle-3.28

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[Bearbeiten | Quelltext bearbeiten]

Baustelle-3.27, Bezugsversion: https://de.wikipedia.org/w/index.php?title=Benutzer:Dirk123456/Baustellenbaustelle_001/Baustelle-3/Baustelle-3.27&oldid=216780713.

= Baustelle-3.28, erste Version: https://de.wikipedia.org/w/index.php?title=Benutzer:Dirk123456/Baustellenbaustelle_001/Baustelle-3/Baustelle-3.28&oldid=216781160.

Verwendete Version des engl. Artikels: "19:23, 21 September 2021‎ Kaihsu talk contribs‎  10,641 bytes +2‎  →‎Creators and developers".

Erste Version des engl. Artikels: "18:14, 22 January 2021‎ Yadsalohcin talk contribs‎  3,378 bytes +3,378‎  Began article".

Zuordnung von Referenznummern und -namen
[Bearbeiten | Quelltext bearbeiten]

Im engl. Original gab es die Referenznummern 1. bis 12., die hier mit /1. / bis /12. / dargestellt werden. Die Referenzen wurden mit dem WP:VE (H:VE) „eingedeutscht“. Zuerst hatten die Referenzen im Wikitext Nummern (name=":0" bis name=":11"), die ich dann durch Namen ersetzt habe (name="RT-Epidem_2021-0117" bis name="Lineage-Assigner_2021-0210").

/1. / ":0" "RT-Epidem_2021-0117"
/2. / ":1" "Rambaut-etal2020_pmid-32669681"
/3. / ":2" "Pangolin-web-app_2021-0210"
/4. / ":3" "Rambaut-etal2021_pmid-33514928"
/5. / ":4" "Pipes-etal2021_pmid-33295605"
/6. / ":5" "preprint_Jacob-etal2020-1222"
/7. / ":6" "pangoLEARN_2021-0103"
/8. / ":7" "PANGO-lineages_2021-0228"
/9. / ":8" "scikit-learn_2021-0219"
/10. / ":9" "cov-lineages-pangolin_2021-0215"
/11. / ":10" "pangoLEARN-v2_2021-0302"
/12. / ":11" "Lineage-Assigner_2021-0210"
Referenzen am Start
[Bearbeiten | Quelltext bearbeiten]

Die zwölf Referenzen am Start dienen dazu, vor dem Textanfang des Artikelentwurf ein Verzeichnis zu haben, das alle Referenzen mit ihren jeweiligen Inhalt enthält (<ref> ... </ref>). Dadurch werden im Text ausschließlich die Kurzformen verwendet (<ref ... />).

/1. / W ← Real-Time Epidemiology for COVID-19. https://web.archive.org/web/20210117212459/https:/www.pathogensurveillance.net/resources/articles/real-time-epidemiology-for-covid-19.html /;"RT-Epidem_2021-0117"[1]

/2. / L ← A dynamic nomenclature proposal ... 15. Juli '20 [Nov. '20] PMID 32669681; "Rambaut-etal2020_pmid-32669681"[2]

/3. / Wa ← Pangolin web application release. https://web.archive.org/web/20210210223250/https:/virological.org/t/pangolin-web-application-release/482 /;"Pangolin-web-app_2021-0210"[3]

/4. / L ← Addendum: A dynamic nomenclature proposal ... März '21 PMID 33514928;"Rambaut-etal2021_pmid-33514928"[4]

/5. / L ← Assessing Uncertainty in the Rooting ... 13. April '21 PMID 33295605;"Pipes-etal2021_pmid-33295605"[5]

/6. / P ← biorxiv=10.1101/2020.12.22.423920; 10.1101/2020.12.22.423920;"preprint_Jacob-etal2020-1222"[6]

/7. / Wa ← pangoLEARN Store of the trained model for PANGOLIN to access. https://web.archive.org/web/20210103202912/https:/github.com/cov-lineages/pangoLEARN /;"pangoLEARN_2021-0103"[7]

/8. / Wa ← PANGO lineages. https://web.archive.org/web/20210228182435/https:/cov-lineages.org/pangolin.html /;"PANGO-lineages_2021-0228"[8]

/9. / Wa ← sklearn.tree.DecisionTreeClassifier. https://web.archive.org/web/20210219120920/https:/scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html /;"scikit-learn_2021-0219"[9]

/10. / W ← cov-lineages/pangolin. https://web.archive.org/web/20210215054819/https:/github.com/cov-lineages/pangolin /;"cov-lineages-pangolin_2021-0215"[10]

/11. / Wa ← pangoLEARN PANGOLIN 2.0: pangoLEARN description. https://web.archive.org/web/20210302051828/https:/cov-lineages.org/pangolin_docs/pangolearn.html /;"pangoLEARN-v2_2021-0302"[11]

/12. / Wa ← Pangolin COVID-19 Lineage Assigner. https://web.archive.org/web/20210210104229/https:/pangolin.cog-uk.io/ /;"Lineage-Assigner_2021-0210"[12]

  • Archiv: -> direkte Seite: https://pangolin.cog-uk.io/ am 2.11.'21: Es erscheint ein Eingabefenster mit der Überschrift "Pangolin COVID-19 Lineage Assigner" vor dem Seitenhintergrund, der die Fußzeile: „Pangolin (version v3.1.14‚ lineages version 2021-10-13) is built by Áine, JT, Verity, Emily and Andrew. Web Application by“—SYMBOL—„Centre for Genomic Pathogen Surveillance“ enthält. Im Eingabefenster gibt es einem Link: „This Web Application assigns lineages to COVID-19 sequenes based on the methodology described in this article“ -> Referenz zum Preprint (https://www.biorxiv.org/content/10.1101/2020.04.17.046086v1)

Weitere Referenzen (b)

/13. / W ← (name=":0") https://github.com/cov-lineages/pango-designation; Pango designation/; "GitHub-Pango-designation"[13]

/14. / W ← (name=":2") https://cov-lineages.org/index.html; PANGO Lineages/; "Latest-PANGO-Lineages"[14]

/15. / W ← (name=":1") https://www.pango.network/faqs/ |titel=FAQs – "Pango-Network-FAQs"[15]

/A-1. / (name=":0" group="A") "Anm-latein-Verb-pango"[A 1]

(c)

/16. / L ← Evolutionary Tracking of SARS-CoV-2 ... | 20. Juli '21 | Jacob et al. 2021 | Publikation des Preprits; PMID 34281387; "Jacob-etal2021_pmid-34281387"[16]

/17. / L ← Assignment ... the pangolin tool | 30. Juli 2021 [Ausgabe Okt.] | O'Toole et al. 2021 | PMID 34527285; "O-Toole-etal2021_pmid-34527285"[17]

  • Erste Zweite Nennung des Begriffs Pango-Nomenklatur(system) im Abstract unter Pubmed: „... according to the Pango dynamic lineage nomenclature scheme.“

/18. / L ← Air travel-related outbreak ... | 20. Sep. '21 | Dhanasekaran et al. 2021 | PMID 34542623; "Dhanasekaran-etal2021_pmid-34542623"[18]

  • Zweite Nennung des Begriffs Pango-Nomenklatur(system): „... on the dynamic Pango nomenclature system.“, (erste Nennung unter PubMed: O'Toole et al., Juli 2021)

Artikelbereich von "Phylogenetic Assignment of Named Global Outbreak LINeages (Software PANGOLIN)"

[Bearbeiten | Quelltext bearbeiten]
Einleitung des Artikels
[Bearbeiten | Quelltext bearbeiten]
Das Logo der Software PANGOLIN symbolisiert einen einen phylogenetischen Baum durch ein eigerolltes Schuppentier (engl. „pangolin“).

Der englische Schriftzug: „Phylogenetic Assignment of Named Global Outbreak LINeages“ steht ursprünglich für ein Software-Werkzeug, das in seiner Kurzform als PANGOLIN benannt wurde. Die PANGOLIN-Software wurde von Mitgliedern des Labors um Andrew Rambaut entwickelt und enthält eine Webanwendung, die vom Center for Genomic Pathogen Surveillance in South Cambridgeshire entwickelt wurde. /1. /[1] Der Name bezieht sich auf das Schuppentier, das im Englischen „pangolin“ heißt, wie ein Logo zur Software PANGOLIN zeigt.[12]

Der Zweck der Software besteht darin, eine dynamische Nomenklatur zu implementieren, um genetische Abstammungslinien für das Virus namens SARS-CoV-2 zu benennen und klassifizieren, also für dasjenige Virus, welches die Krankheit COVID-19 verursachen kann. /2. /[2]

Die PANGOLIN-Software und das Pango-Nomenklatursystem

[Bearbeiten | Quelltext bearbeiten]

Die PANGOLIN-Software benötigt zusätzliche Ressourcen, um die Abstammungslinien für SARS-CoV-2 und seine Varianten benennen und zuordnen zu können.[4] Das sind z. B. mindestens eine Organisation, die die Abstammungslinien kuratiert, Datenbanken und nicht zuletzt eine Definition des Nomenklatursystems, das nicht Teil der Software selbst ist.[4]

Entsprechende Abstammungslinien werden zumeist als „PANGO lineages“[11] o. ä. bezeichnet (z. B. „Pango-lineage“,[13] „Pango lineage“[13]). Darauf gründet sich auch die zumeist verwendete Bezeichnung für das resultierende Nomenklatur-System als „Pango nomenclature“.[14] Der Teilausdruck „PANGO“ (bzw. „Pango“) wird anstatt „PANGOLIN“ (bzw. „Pangolin“) verwendet, um zwischen der Software und den Abstammungslinien eindeutig zu unterscheiden und um Verwechslungen mit Schuppentieren entgegenzuwirken, wie sie z. B. durch die Kombination von „Pangolin“ und „lineage“ entstehen könnten.[4] Die Bedeutung vom Ausdruck „Pango“ soll dem lateinischem Verb ähneln.[A 1][15]

Die Software PANGOLIN ist eine Schlüsselkomponente, mit der die Pango-Nomenklatursystem angewendet werden kann. /4. /[4] Wie bei Rambaut et al. (2020) beschrieben, /2. /[2] ist eine Pango-Abstammungslinie ein Cluster von Sequenzen, die mit einem epidemiologischen Ereignis verbunden sind, beispielsweise mit der Einschleppung des Virus in ein bestimmtes geografisches Gebiet und Hinweisen auf eine weitere Ausbreitung. Die Abstammungslinien sollen im Randbereich der Pandemie die sich entwickelnden Ereignisse erfassen und durch eine feinkörnige Auflösung für die genomische epidemiologische Überwachung und die Untersuchung von Ausbrüchen geeignet sein. Sowohl das Tool PANGOLIN als auch das Pango-Nomenklatursystem wurden während der COVID-19-Pandemie ausgiebig genutzt. /2. /[2] /5. /[5] /6. /[6]

Anwendung der Software PANGOLIN

[Bearbeiten | Quelltext bearbeiten]

Eine Person, die eine vollständige Genomsequenz einer SARS-CoV-2-Probe verfügbar hat, kann das Tool verwenden, um diese Sequenz einzureichen; sie wird dann mit anderen Genomsequenzen in der Datenbank verglichen und der wahrscheinlichsten Abstammungslinie zugeordnet. /3. /[3] Es sind einzelne oder mehrere Durchläufe möglich und das Tool kann weitere Informationen zur bekannten Historie der zugewiesenen Abstammungslinie zurückliefern. /3. /[3]

Darüber hinaus ist das PANGOLIN-Softwaresystem mit Microreact verbunden, sodass die Position innerhalb einer zeitlichen Abfolge von mehreren Ergebnissen zu den sequenzierten Proben derselben Abstammungslinie angezeigt werden kann. /3. /[3] Diese letztere Funktion stützt sich auf öffentlich zugängliche Genome, die z. B. vom COVID-19 Genomics UK Consortium erhalten wurden und solche, die bei GISAID eingereicht wurden. /3. /[3]

Benennung und Zuordnung der Abstammungslinien

[Bearbeiten | Quelltext bearbeiten]

Es wird zwischen „Lineage designation“, der Benennung von Abstammungslinien, und „Lineage assignation“, der Zuordnung der Abstammungslinien, unterschieden.[15]

Ursprünglich verwendete PANGOLIN einen auf Maximum-Likelihood-basierten Zuweisungsalgorithmus, um der Abfrage SARS-CoV-2 die wahrscheinlichste Abstammungssequenz zuzuweisen. Seit der Veröffentlichung von Version 2.0 im Juli 2020 verwendet es jedoch den auf maschinellem Lernen basierenden Zuordnungsalgorithmus „pangoLEARN“, um Linien neuen SARS-CoV-2-Genomen zuzuordnen. /10. /[10] Dieser Ansatz ist schnell und kann in relativ kurzer Zeit eine große Anzahl von SARS-CoV-2-Genomen zuordnen. /11. /[11]

Unabhängig von der Nutzung des PANGOLIN-Tools werden die Abstammungslinien gemäß der Pango-Nomenklatur (sogenannte Pango-Linien), regelmäßig manuell durch das Pango-Team kuratiert.[15]

Der große phylogenetische Baum, der durch Alignments der öffentlich verfügbaren SARS-CoV-2-Genome durch die PANGOLIN-Software erstellt wird, enthält Subcluster von Sequenzen. Diese werden manuell untersucht und mit epidemiologischen Informationen verglichen, um neue Abstammungslinien zu bestimmen. Vorschläge können über eine GitHub- Ausgabeanfrage an das Pango-Team gesendet werden.[15] /8. /[8] /7. /[7]

Training des Modells

[Bearbeiten | Quelltext bearbeiten]

Die manuell kuratierten Bezeichnungen der Abstammungslinien und die zugehörigen Genomsequenzen bilden die Eingabe für das Training eines Modells durch maschinelles Lernen. Das Modell, das sowohl das Training als auch die Zuordnung der Sequenzen beinhaltet, hat den Namen „pangoLEARN“ erhalten. Es verwendet einen Klassifikationsbaum, der auf der Scikit-Learn-Implementierung eines Entscheidungsbaum-Klassifikators basiert (Stand Feb. 2021).[9]

PANGOLIN kann als Befehlszeilen-basiertes Werkzeug bei Conda und aus einem GitHub Repository heruntergeladen werden /10. /[10] und ist auch als Web-Anwendung /12. /[12] mit einer grafischen Benutzeroberfläche verfügbar..

Personen – Entwicklung und Gestaltung

[Bearbeiten | Quelltext bearbeiten]

PANGOLIN wurde von Áine O'Toole und dem Labor um Andrew Rambaut erstellt und am 5. April 2020 veröffentlicht.

Die Hauptentwickler von PANGOLIN sind Áine O'Toole und Emily Scher; viele andere haben zu verschiedenen Aspekten des Tools beigetragen, darunter Ben Jackson, JT McCrone, Verity Hill und Rachel Colquhoun vom Labor unter Andrew Rambaut. /3. /[3]

Die Webanwendung zu PANGOLIN wurde vom Center for Genomic Pathogen Surveillance, /12. /[12] entwickelt, namentlich von Anthony Underwood, Ben Taylor, Corin Yeats, Khali Abu-Dahab und David Aanensen. /3. /[3]

  • Das englische Wort „pangolin“ bedeutet im Deutschen „Schuppentier“.
  1. a b Unter den häufig gestellten Fragen von „Pango Network“ (https://www.pango.network/faqs/; Abruf 31. Okt. 2021) wird das Wort Pango folgendermaßen erklärt: »Why is it called Pango? Pango is a latin verb meaning “I fix or set”, or record, or tell accounts of something. The nomenclature system and its lineages are called Pango. Our logo represents this in three ways (good luck finding them all!).The name pangolin only refers to the software tool for sequence assignment, available here, and is an acronym of “Phylogenetic Assignment of Named Global Outbreak LINeages”.«.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. a b Real-Time Epidemiology for COVID-19 | Centre for Genomic Pathogen Surveillance. 17. Januar 2021, abgerufen am 27. Oktober 2021.
  2. a b c d Andrew Rambaut, Edward C. Holmes, Áine O'Toole, Verity Hill, John T. McCrone: A dynamic nomenclature proposal for SARS-CoV-2 lineages to assist genomic epidemiology. In: Nature Microbiology. Band 5, Nr. 11, November 2020, ISSN 2058-5276, S. 1403–1407, doi:10.1038/s41564-020-0770-5, PMID 32669681, PMC 7610519 (freier Volltext).
  3. a b c d e f g Pangolin web application release - Software and Tools - Virological. 10. Februar 2021, abgerufen am 28. Oktober 2021.
  4. a b c d e Andrew Rambaut, Edward C. Holmes, Áine O'Toole, Verity Hill, John T. McCrone: Addendum: A dynamic nomenclature proposal for SARS-CoV-2 lineages to assist genomic epidemiology. In: Nature Microbiology. Band 6, Nr. 3, März 2021, ISSN 2058-5276, S. 415, doi:10.1038/s41564-021-00872-5, PMID 33514928, PMC 7845574 (freier Volltext).
  5. a b Lenore Pipes, Hongru Wang, John P. Huelsenbeck, Rasmus Nielsen: Assessing Uncertainty in the Rooting of the SARS-CoV-2 Phylogeny. In: Molecular Biology and Evolution. Band 38, Nr. 4, 13. April 2021, ISSN 1537-1719, S. 1537–1543, doi:10.1093/molbev/msaa316, PMID 33295605, PMC 7798932 (freier Volltext).
  6. a b Jobin John Jacob, Karthick Vasudevan, Agila Kumari Pragasam, Karthik Gunasekaran, Balaji Veeraraghavan: Evolutionary tracking of SARS-CoV-2 genetic variants highlights an intricate balance of stabilizing and destabilizing mutations. Genomics, 22. Dezember 2020, doi:10.1101/2020.12.22.423920.
  7. a b GitHub - cov-lineages/pangoLEARN: Store of the trained model for pangolin to access. 3. Januar 2021, abgerufen am 28. Oktober 2021.
  8. a b PANGO lineages. 28. Februar 2021, abgerufen am 28. Oktober 2021.
  9. a b sklearn.tree.DecisionTreeClassifier — scikit-learn 0.24.1 documentation. 19. Februar 2021, abgerufen am 28. Oktober 2021.
  10. a b c GitHub - cov-lineages/pangolin: Software package for assigning SARS-CoV-2 genome sequences to global lineages. 15. Februar 2021, abgerufen am 28. Oktober 2021.
  11. a b c PANGO lineages. 2. März 2021, abgerufen am 28. Oktober 2021.
  12. a b c d COG-UK. 10. Februar 2021, abgerufen am 28. Oktober 2021.
  13. a b c Pango designation. CoV-lineages, 29. Oktober 2021, abgerufen am 29. Oktober 2021.
  14. a b PANGO Lineages: Latest epidemiological lineages of SARS-CoV-2. In: cov-lineages.org. © SARS-CoV-2 lineages / Design by Emily Scher / Text by Áine O'Toole, Emily Scher, and Andrew Rambaut, abgerufen am 29. Oktober 2021.
  15. a b c d e FAQs – Pango Network. In: © The Pango Lineage Nomenclature. Pango.network, abgerufen am 31. Oktober 2021 (britisches Englisch).
  16. Jobin John Jacob, Karthick Vasudevan, Agila Kumari Pragasam, Karthik Gunasekaran, Balaji Veeraraghavan: Evolutionary Tracking of SARS-CoV-2 Genetic Variants Highlights an Intricate Balance of Stabilizing and Destabilizing Mutations. In: mBio. Band 12, Nr. 4, 31. August 2021, ISSN 2150-7511, S. e0118821, doi:10.1128/mBio.01188-21, PMID 34281387, PMC 8406184 (freier Volltext).
  17. Áine O'Toole, Emily Scher, Anthony Underwood, Ben Jackson, Verity Hill: Assignment of epidemiological lineages in an emerging pandemic using the pangolin tool. In: Virus Evolution. Band 7, Nr. 2, 2021, ISSN 2057-1577, S. veab064, doi:10.1093/ve/veab064, PMID 34527285, PMC 8344591 (freier Volltext).
  18. Vijaykrishna Dhanasekaran, Kimberly M. Edwards, Ruopeng Xie, Haogao Gu, Dillon C. Adam: Air travel-related outbreak of multiple SARS-CoV-2 variants. In: Journal of Travel Medicine. 20. September 2021, ISSN 1708-8305, S. taab149, doi:10.1093/jtm/taab149, PMID 34542623, PMC 8522424 (freier Volltext).