Difference between revisions of "Tagger (de)"

From Glottopedia
Jump to navigation Jump to search
(Marked as {{ref}})
 
(7 intermediate revisions by 3 users not shown)
Line 1: Line 1:
==Definition==
+
Ein '''Tagger''' weist sprachlichen Einheiten ein Etikett (''Tag'') zu, das aus einer gegebenen (endlichen) Menge von Etiketten (''Tagset'') stammt.
Ein Tagger versieht jedes Wort in einem [[Korpus]] mit einem Tag (Etikett), welches eine part of speech oder eine andere [[lexikalische Kategorie]] Kategorie bezeichnet. Die Tags stammen aus einem Tagset.  
 
  
Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Stochastische (oder statistische) Tagger arbeiten mit Übergangswahrscheinlichkeiten von Wortfolgen, während regelbasierte Tagger (oder Brill-Tagger) Regeln zur Wortfolge aufstellen, die mit weiteren Regeln inkrementell verbessert werden. Beide Tagging-Algorithmen lernen die erforderlichen Informationen aus einem Trainingskorpus.
+
===Kommentare===
Tagger erreichen je nach Textsorte eine Korrektheit von 90-97%.
+
Die Mehrzahl der verfügbaren Tagger weisen einzelnen Wortformen bzw. Token Tags zu, die morpho-syntaktische Informationen (Wortart, Genus, Numerus, etc.) repräsentieren. Aber es gibt auch Tagger, die die [[semantischen Rollen]] von Nominal- und Präpositionalphrasen
 +
([[sense tagging]]) oder die Diskursstruktur von Texten ([[discourse structure tagging]]) identifizieren sollen.
  
==Herkunft==
+
Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung.
engl. ''tag'' - markieren, mit einem Anhängeretikett versehen
 
  
==Andere Sprachen==
+
Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden.
 +
 
 +
Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%.
 +
 
 +
===Subtypen===
 +
* [[Brill Tagger]]
 +
* [[HMM Tagger]]
 +
* [[Memory-based Tagger]]
 +
* [http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/DecisionTreeTagger.html TreeTagger]
 +
 
 +
===Herkunft===
 +
englisch ''to tag'' - markieren, mit einem Etikett versehen
 +
 
 +
===Andere Sprachen===
  
 
* Englisch [[tagger]]
 
* Englisch [[tagger]]
  
[[Category:De]]
+
{{wb}}{{ref}}
[[Category:DICT]]
 
 
[[Category:Computational Linguistics]]
 
[[Category:Computational Linguistics]]

Latest revision as of 16:30, 27 July 2014

Ein Tagger weist sprachlichen Einheiten ein Etikett (Tag) zu, das aus einer gegebenen (endlichen) Menge von Etiketten (Tagset) stammt.

Kommentare

Die Mehrzahl der verfügbaren Tagger weisen einzelnen Wortformen bzw. Token Tags zu, die morpho-syntaktische Informationen (Wortart, Genus, Numerus, etc.) repräsentieren. Aber es gibt auch Tagger, die die semantischen Rollen von Nominal- und Präpositionalphrasen (sense tagging) oder die Diskursstruktur von Texten (discourse structure tagging) identifizieren sollen.

Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung.

Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden.

Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%.

Subtypen

Herkunft

englisch to tag - markieren, mit einem Etikett versehen

Andere Sprachen

REF This article has no reference(s) or source(s).
Please remove this block only when the problem is solved.