Stemming
Revision as of 11:29, 12 July 2007 by WikiLingua (talk | contribs)
Definition
Stemming nennt man den Vorgang, bei dem versucht wird, den Stamm eines Wortes zu isolieren. Dazu werden die Präfixe und Suffixe eines Wortes in einem Dokument oder einer Anfrage abgetrennt. Im Gegensatz zur Lemmatisierung wird beim Stemming nicht versucht, den linguistisch korrekten Stamm zu finden.
Stemming wird oft im Bereich des Information Retrievals verwendet, da dadurch verschiedene Wörter auf dieselbe Repräsentation projeziert werden können, was den Speicherbedarf verkleinert und die Verarbeitungszeit verkürzt. Die Internet-Suchmaschinen Lycos und Google verwenden Stemming.
Beispiele
Durch Stemming wird computation und auch computer auf compute reduziert.
Herkunft
engl. stem - Stamm