spaCy/spacy/tests/lang/hr/test_lemma.py

# coding: utf-8
from __future__ import unicode_literals

import pytest


@pytest.mark.parametrize(
    "string,lemma",
    [
        ("trčao", "trčati"),
        ("adekvatnim", "adekvatan"),
        ("dekontaminacijama", "dekontaminacija"),
        ("filologovih", "filologov"),
        ("je", "biti"),
        ("se", "sebe"),
    ],
)
def test_hr_lemmatizer_lookup_assigns(hr_tokenizer, string, lemma):
    tokens = hr_tokenizer(string)
    assert tokens[0].lemma_ == lemma
adds Croatian lemma_lookup.json, license file and corresponding tests (#4252) 2019-09-08 14:40:45 +03:00			`# coding: utf-8`
			`from __future__ import unicode_literals`

			`import pytest`


			`@pytest.mark.parametrize(`
			`"string,lemma",`
			`[`
			`("trčao", "trčati"),`
			`("adekvatnim", "adekvatan"),`
			`("dekontaminacijama", "dekontaminacija"),`
			`("filologovih", "filologov"),`
			`("je", "biti"),`
			`("se", "sebe"),`
			`],`
			`)`
			`def test_hr_lemmatizer_lookup_assigns(hr_tokenizer, string, lemma):`
			`tokens = hr_tokenizer(string)`
			`assert tokens[0].lemma_ == lemma`