„Named-entity recognition“ – Versionsunterschied
Zur Navigation springen
Zur Suche springen
[gesichtete Version] | [gesichtete Version] |
Inhalt gelöscht Inhalt hinzugefügt
Aka (Diskussion | Beiträge) K Leerzeichen vor Prozentzeichen eingefügt |
Definition leicht geändert und mit Quellen belegt |
||
Zeile 1: | Zeile 1: | ||
'''Named-entity recognition''' '''(NER)''' oder '''Eigennamenerkennung''' ist eine Aufgabe in der [[Informationsextraktion]] und bezeichnet die automatische Identifikation und Klassifikation von Eigennamen. Ein Eigenname ist eine Folge von Wörtern, die eine real existierende Entität beschreibt, wie z.B. ein Firmenname.<ref>{{Literatur |Autor=Kai-Uwe Carstensen |Titel=Anwendungen |Hrsg= |Sammelwerk=Computerlinguistik und Sprachtechnologie |Band= |Nummer= |Auflage= |Verlag=Spektrum Akademischer Verlag |Ort= |Datum=2010 |Seiten=596 |ISBN=9783827420237 |DOI=10.1007/978-3-8274-2224-8_5 |Online=https://link.springer.com/chapter/10.1007/978-3-8274-2224-8_5 |Abruf=2017-10-22}}</ref><ref>{{Literatur |Autor=Jing Jiang |Titel=Information Extraction from Text |Hrsg= |Sammelwerk=Mining Text Data |Band= |Nummer= |Auflage= |Verlag=Springer, Boston, MA |Ort= |Datum=2012 |Seiten=15 |ISBN=9781461432227 |DOI=10.1007/978-1-4614-3223-4_2 |Online=https://link.springer.com/chapter/10.1007/978-1-4614-3223-4_2 |Abruf=2017-10-22}}</ref> |
|||
⚫ | |||
⚫ | Zur Evaluierung wird beispielsweise der [[Message Understanding Conference|MUC-7]] Datensatz verwendet. Auf diesem wurde nach dem <math>F_1</math>-Maß 93,39 % erreicht, wohingegen Menschen auf diesem Datensatz zwischen 96,95 % und 97,60 % erreichen.<ref>http://www-nlpir.nist.gov/related_projects/muc/proceedings/muc_7_proceedings/marsh_slides.pdf</ref> |
||
== Einzelnachweise == |
== Einzelnachweise == |
Version vom 22. Oktober 2017, 11:16 Uhr
Named-entity recognition (NER) oder Eigennamenerkennung ist eine Aufgabe in der Informationsextraktion und bezeichnet die automatische Identifikation und Klassifikation von Eigennamen. Ein Eigenname ist eine Folge von Wörtern, die eine real existierende Entität beschreibt, wie z.B. ein Firmenname.[1][2]
Zur Evaluierung wird beispielsweise der MUC-7 Datensatz verwendet. Auf diesem wurde nach dem -Maß 93,39 % erreicht, wohingegen Menschen auf diesem Datensatz zwischen 96,95 % und 97,60 % erreichen.[3]
Einzelnachweise
- ↑ Kai-Uwe Carstensen: Anwendungen. In: Computerlinguistik und Sprachtechnologie. Spektrum Akademischer Verlag, 2010, ISBN 978-3-8274-2023-7, S. 596, doi:10.1007/978-3-8274-2224-8_5 (springer.com [abgerufen am 22. Oktober 2017]).
- ↑ Jing Jiang: Information Extraction from Text. In: Mining Text Data. Springer, Boston, MA, 2012, ISBN 978-1-4614-3222-7, S. 15, doi:10.1007/978-1-4614-3223-4_2 (springer.com [abgerufen am 22. Oktober 2017]).
- ↑ http://www-nlpir.nist.gov/related_projects/muc/proceedings/muc_7_proceedings/marsh_slides.pdf