spaCy/spacy/tests/lang/tr/test_lemmatization.py

15 lines
709 B
Python
Raw Normal View History

2017-12-01 17:04:32 +03:00
# coding: utf-8
from __future__ import unicode_literals
import pytest
@pytest.mark.parametrize('string,lemma', [('evlerimizdeki', 'ev'),
('işlerimizi', ''),
('biran', 'biran'),
('bitirmeliyiz', 'bitir'),
('isteklerimizi', 'istek'),
('karşılaştırmamızın', 'karşılaştır'),
('çoğulculuktan', 'çoğulcu')])
def test_lemmatizer_lookup_assigns(tr_tokenizer, string, lemma):
tokens = tr_tokenizer(string)
assert tokens[0].lemma_ == lemma