Difference between revisions of "Tagger (de)"
Haspelmath (talk | contribs) (oops: dc > wb) |
Mahlatse65 (talk | contribs) |
||
Line 16: | Line 16: | ||
* [[HMM Tagger]] | * [[HMM Tagger]] | ||
* [[Memory-based Tagger]] | * [[Memory-based Tagger]] | ||
− | * [ | + | * [http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/DecisionTreeTagger.html TreeTagger] |
===Herkunft=== | ===Herkunft=== |
Revision as of 13:20, 21 August 2009
Ein Tagger weist sprachlichen Einheiten ein Etikett (Tag) zu, das aus einer gegebenen (endlichen) Menge von Etiketten (Tagset) stammt.
Kommentare
Die Mehrzahl der verfügbaren Tagger weisen einzelnen Wortformen bzw. Token Tags zu, die morpho-syntaktische Informationen (Wortart, Genus, Numerus, etc.) repräsentieren. Aber es gibt auch Tagger, die die semantischen Rollen von Nominal- und Präpositionalphrasen (sense tagging) oder die Diskursstruktur von Texten (discourse structure tagging) identifizieren sollen.
Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung.
Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden.
Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%.
Subtypen
Herkunft
englisch to tag - markieren, mit einem Etikett versehen
Andere Sprachen
- Englisch tagger