Update ru/uk lemmatizers for new nlp.initialize

2025-11-24 03:46:02 +03:00 · 2020-10-05 09:26:43 +02:00 · 2020-10-05 09:26:43 +02:00 · b0b93854cb
commit b0b93854cb
parent 549758f67d
5 changed files with 14 additions and 11 deletions
--- a/spacy/lang/ru/init.py
+++ b/spacy/lang/ru/init.py
@ -25,8 +25,14 @@ class Russian(Language):
    default_config={"model": None, "mode": "pymorphy2"},
    default_score_weights={"lemma_acc": 1.0},
 )
-def make_lemmatizer(nlp: Language, model: Optional[Model], name: str, mode: str):
-    return RussianLemmatizer(nlp.vocab, model, name, mode=mode)
+def make_lemmatizer(
+    nlp: Language,
+    model: Optional[Model],
+    name: str,
+    mode: str,
+    overwrite: bool = False,
+):
+    return RussianLemmatizer(nlp.vocab, model, name, mode=mode, overwrite=overwrite)


 __all__ = ["Russian"]
--- a/spacy/lang/ru/lemmatizer.py
+++ b/spacy/lang/ru/lemmatizer.py
@ -2,7 +2,6 @@ from typing import Optional, List, Dict, Tuple

 from thinc.api import Model

-from ...lookups import Lookups
 from ...pipeline import Lemmatizer
 from ...symbols import POS
 from ...tokens import Token
@ -22,9 +21,9 @@ class RussianLemmatizer(Lemmatizer):
        name: str = "lemmatizer",
        *,
        mode: str = "pymorphy2",
-        lookups: Optional[Lookups] = None,
+        overwrite: bool = False,
    ) -> None:
-        super().__init__(vocab, model, name, mode=mode, lookups=lookups)
+        super().__init__(vocab, model, name, mode=mode, overwrite=overwrite)

        try:
            from pymorphy2 import MorphAnalyzer
--- a/spacy/lang/uk/init.py
+++ b/spacy/lang/uk/init.py
@ -26,8 +26,8 @@ class Ukrainian(Language):
    default_config={"model": None, "mode": "pymorphy2"},
    default_score_weights={"lemma_acc": 1.0},
 )
-def make_lemmatizer(nlp: Language, model: Optional[Model], name: str, mode: str):
-    return UkrainianLemmatizer(nlp.vocab, model, name, mode=mode)
+def make_lemmatizer(nlp: Language, model: Optional[Model], name: str, mode: str, overwrite: bool = False,):
+    return UkrainianLemmatizer(nlp.vocab, model, name, mode=mode, overwrite=overwrite)


 __all__ = ["Ukrainian"]
--- a/spacy/lang/uk/lemmatizer.py
+++ b/spacy/lang/uk/lemmatizer.py
@ -3,7 +3,6 @@ from typing import Optional
 from thinc.api import Model

 from ..ru.lemmatizer import RussianLemmatizer
-from ...lookups import Lookups
 from ...vocab import Vocab


@ -15,9 +14,9 @@ class UkrainianLemmatizer(RussianLemmatizer):
        name: str = "lemmatizer",
        *,
        mode: str = "pymorphy2",
-        lookups: Optional[Lookups] = None,
+        overwrite: bool = False,
    ) -> None:
-        super().__init__(vocab, model, name, mode=mode, lookups=lookups)
+        super().__init__(vocab, model, name, mode=mode, overwrite=overwrite)
        try:
            from pymorphy2 import MorphAnalyzer
        except ImportError:
--- a/spacy/tests/conftest.py
+++ b/spacy/tests/conftest.py
@ -248,7 +248,6 @@ def tt_tokenizer():
@pytest.fixture(scope="session")
 def uk_tokenizer():
    pytest.importorskip("pymorphy2")
-    pytest.importorskip("pymorphy2.lang")
    return get_lang_class("uk")().tokenizer