Porter Stemmer for German in Python

Anybody need a quick and dirty Python 2.5.2 implementation of the Porter German stemming algorithm?

I wrote one for the German S.L.U.T student project today: porterde.py

The only testing I did is running it on the complete list of examples on above page (pink background).

To use, import porterde as a module and call porterde.stem(word). The function requires and returns unicode strings.

Edit: I should have looked harder before jumping into this, there already is PyStemmer which does the same but for eight languages. Thanks to Mathieu for pointing that out.

 

Verwandte Beiträge:

  1. Translating with Semantic Representations
  2. Word of the Day: Internationalizabilization
Dieser Beitrag wurde unter Computerlinguistik, English veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>