Stemming

From Glottopedia
Revision as of 15:09, 27 July 2014 by NBlöcher (talk | contribs) (Marked as {{ref}})
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

Definition

Stemming nennt man den Vorgang, bei dem versucht wird, den Stamm eines Wortes zu isolieren. Dazu werden die Präfixe und Suffixe eines Wortes in einem Dokument oder einer Anfrage abgetrennt. Im Gegensatz zur Lemmatisierung wird beim Stemming nicht versucht, den linguistisch korrekten Stamm zu finden.

Stemming wird oft im Bereich des Information Retrievals verwendet, da dadurch verschiedene Wörter auf dieselbe Repräsentation projeziert werden können, was den Speicherbedarf verkleinert und die Verarbeitungszeit verkürzt. Die Internet-Suchmaschinen Lycos und Google verwenden Stemming.

Beispiele

Durch Stemming wird computation und auch computer auf compute reduziert.

Herkunft

Englisch stem - Stamm

REF This article has no reference(s) or source(s).
Please remove this block only when the problem is solved.