„Named-entity recognition“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K Leerzeichen vor Prozentzeichen eingefügt
EgoBrain (Diskussion | Beiträge)
Definition leicht geändert und mit Quellen belegt
Zeile 1: Zeile 1:
'''Named-entity recognition''' '''(NER)''' oder '''Eigennamenerkennung''' ist eine Aufgabe in der [[Informationsextraktion]] und bezeichnet die automatische Identifikation und Klassifikation von Eigennamen. Ein Eigenname ist eine Folge von Wörtern, die eine real existierende Entität beschreibt, wie z.B. ein Firmenname.<ref>{{Literatur |Autor=Kai-Uwe Carstensen |Titel=Anwendungen |Hrsg= |Sammelwerk=Computerlinguistik und Sprachtechnologie |Band= |Nummer= |Auflage= |Verlag=Spektrum Akademischer Verlag |Ort= |Datum=2010 |Seiten=596 |ISBN=9783827420237 |DOI=10.1007/978-3-8274-2224-8_5 |Online=https://link.springer.com/chapter/10.1007/978-3-8274-2224-8_5 |Abruf=2017-10-22}}</ref><ref>{{Literatur |Autor=Jing Jiang |Titel=Information Extraction from Text |Hrsg= |Sammelwerk=Mining Text Data |Band= |Nummer= |Auflage= |Verlag=Springer, Boston, MA |Ort= |Datum=2012 |Seiten=15 |ISBN=9781461432227 |DOI=10.1007/978-1-4614-3223-4_2 |Online=https://link.springer.com/chapter/10.1007/978-1-4614-3223-4_2 |Abruf=2017-10-22}}</ref>
'''Named-entity recognition''' (kurz: NER) ist eine Aufgabe in der Computerlinguistik und bezeichnet die automatische Identifikation von Eigennamen. Zur Evaluierung wird beispielsweise der [[Message Understanding Conference|MUC-7]] Datensatz verwendet. Auf diesem wurde nach dem <math>F_1</math>-Maß 93,39 % erreicht, wohingegen Menschen auf diesem Datensatz zwischen 96,95 % und 97,60 % erreichen.<ref>http://www-nlpir.nist.gov/related_projects/muc/proceedings/muc_7_proceedings/marsh_slides.pdf</ref>

Zur Evaluierung wird beispielsweise der [[Message Understanding Conference|MUC-7]] Datensatz verwendet. Auf diesem wurde nach dem <math>F_1</math>-Maß 93,39 % erreicht, wohingegen Menschen auf diesem Datensatz zwischen 96,95 % und 97,60 % erreichen.<ref>http://www-nlpir.nist.gov/related_projects/muc/proceedings/muc_7_proceedings/marsh_slides.pdf</ref>


== Einzelnachweise ==
== Einzelnachweise ==

Version vom 22. Oktober 2017, 11:16 Uhr

Named-entity recognition (NER) oder Eigennamenerkennung ist eine Aufgabe in der Informationsextraktion und bezeichnet die automatische Identifikation und Klassifikation von Eigennamen. Ein Eigenname ist eine Folge von Wörtern, die eine real existierende Entität beschreibt, wie z.B. ein Firmenname.[1][2]

Zur Evaluierung wird beispielsweise der MUC-7 Datensatz verwendet. Auf diesem wurde nach dem -Maß 93,39 % erreicht, wohingegen Menschen auf diesem Datensatz zwischen 96,95 % und 97,60 % erreichen.[3]

Einzelnachweise

  1. Kai-Uwe Carstensen: Anwendungen. In: Computerlinguistik und Sprachtechnologie. Spektrum Akademischer Verlag, 2010, ISBN 978-3-8274-2023-7, S. 596, doi:10.1007/978-3-8274-2224-8_5 (springer.com [abgerufen am 22. Oktober 2017]).
  2. Jing Jiang: Information Extraction from Text. In: Mining Text Data. Springer, Boston, MA, 2012, ISBN 978-1-4614-3222-7, S. 15, doi:10.1007/978-1-4614-3223-4_2 (springer.com [abgerufen am 22. Oktober 2017]).
  3. http://www-nlpir.nist.gov/related_projects/muc/proceedings/muc_7_proceedings/marsh_slides.pdf