# coding: utf-8 from __future__ import unicode_literals import pytest @pytest.mark.parametrize('string,lemma', [('DNA-profilernas', 'DNA-profil'), ('Elfenbenskustens', 'Elfenbenskusten'), ('abortmotståndarens', 'abortmotståndare'), ('kolesterols', 'kolesterol'), ('portionssnusernas', 'portionssnus'), ('åsyns', 'åsyn')]) def test_lemmatizer_lookup_assigns(sv_tokenizer, string, lemma): tokens = sv_tokenizer(string) assert tokens[0].lemma_ == lemma