Difference between revisions of "Tagger (de)"
Jump to navigation
Jump to search
m (→Herkunft) |
m |
||
Line 4: | Line 4: | ||
Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Stochastische (oder statistische) Tagger arbeiten mit Übergangswahrscheinlichkeiten von Wortfolgen, während regelbasierte Tagger (oder Brill-Tagger) Regeln zur Wortfolge aufstellen, die mit weiteren Regeln inkrementell verbessert werden. Beide Tagging-Algorithmen lernen die erforderlichen Informationen aus einem Trainingskorpus. | Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Stochastische (oder statistische) Tagger arbeiten mit Übergangswahrscheinlichkeiten von Wortfolgen, während regelbasierte Tagger (oder Brill-Tagger) Regeln zur Wortfolge aufstellen, die mit weiteren Regeln inkrementell verbessert werden. Beide Tagging-Algorithmen lernen die erforderlichen Informationen aus einem Trainingskorpus. | ||
Tagger erreichen je nach Textsorte eine Korrektheit von 90-97%. | Tagger erreichen je nach Textsorte eine Korrektheit von 90-97%. | ||
+ | |||
+ | ==Subtypen== | ||
+ | |||
+ | * [[Brill Tagger]] | ||
+ | * [[HMM Tagger]] | ||
+ | * [[Memory-based Tagger]] | ||
+ | * [[Tree Tagger]] | ||
==Herkunft== | ==Herkunft== |
Revision as of 18:05, 6 July 2007
Definition
Ein Tagger versieht jedes Wort in einem Korpus mit einem Tag (Etikett), welches eine part of speech oder eine andere lexikalische Kategorie Kategorie bezeichnet. Die Tags stammen aus einem Tagset.
Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Stochastische (oder statistische) Tagger arbeiten mit Übergangswahrscheinlichkeiten von Wortfolgen, während regelbasierte Tagger (oder Brill-Tagger) Regeln zur Wortfolge aufstellen, die mit weiteren Regeln inkrementell verbessert werden. Beide Tagging-Algorithmen lernen die erforderlichen Informationen aus einem Trainingskorpus. Tagger erreichen je nach Textsorte eine Korrektheit von 90-97%.
Subtypen
Herkunft
engl. to tag - markieren, mit einem Etikett versehen
Andere Sprachen
- Englisch tagger