spaCy/spacy/tests/lang/sv/test_lemmatizer.py

# coding: utf-8
from __future__ import unicode_literals

import pytest


@pytest.mark.parametrize('string,lemma', [('DNA-profilernas', 'DNA-profil'),
                                          ('Elfenbenskustens', 'Elfenbenskusten'),
                                          ('abortmotståndarens', 'abortmotståndare'),
                                          ('kolesterols', 'kolesterol'),
                                          ('portionssnusernas', 'portionssnus'),
                                          ('åsyns', 'åsyn')])
def test_lemmatizer_lookup_assigns(sv_tokenizer, string, lemma):
    tokens = sv_tokenizer(string)
    assert tokens[0].lemma_ == lemma