nltk.stem.rslp module

class nltk.stem.rslp.RSLPStemmer[source]

Bases: StemmerI

A stemmer for Portuguese.

>>> from nltk.stem import RSLPStemmer
>>> st = RSLPStemmer()
>>> # opening lines of Erico Verissimo's "Música ao Longe"
>>> text = '''
... Clarissa risca com giz no quadro-negro a paisagem que os alunos
... devem copiar . Uma casinha de porta e janela , em cima duma
... coxilha .'''
>>> for token in text.split(): 
...     print(st.stem(token))
clariss risc com giz no quadro-negr a pais que os alun dev copi .
uma cas de port e janel , em cim dum coxilh .
__init__()[source]
apply_rule(word, rule_index)[source]
read_rule(filename)[source]
stem(word)[source]

Strip affixes from the token and return the stem.

Parameters

token (str) – The token that should be stemmed.