Merge pull request #6199 from adrianeboyd/bugfix/ru-uk-lemmatizer-init

Update ru/uk lemmatizers for new nlp.initialize
2025-10-23 04:04:22 +03:00 · 2020-10-05 11:48:47 +02:00 · 2020-10-05 11:48:47 +02:00 · 2acbec2d2b
commit 2acbec2d2b
parent 549758f67d b0b93854cb
5 changed files with 14 additions and 11 deletions
--- a/spacy/lang/ru/init.py
+++ b/spacy/lang/ru/init.py
@ -25,8 +25,14 @@ class Russian(Language):
    default_config={"model": None, "mode": "pymorphy2"},
    default_score_weights={"lemma_acc": 1.0},
 )
-def make_lemmatizer(nlp: Language, model: Optional[Model], name: str, mode: str):
+def make_lemmatizer(
-    return RussianLemmatizer(nlp.vocab, model, name, mode=mode)
+    nlp: Language,
    model: Optional[Model],
    name: str,
    mode: str,
    overwrite: bool = False,
 ):
    return RussianLemmatizer(nlp.vocab, model, name, mode=mode, overwrite=overwrite)
 __all__ = ["Russian"]
--- a/spacy/lang/ru/lemmatizer.py
+++ b/spacy/lang/ru/lemmatizer.py
@ -2,7 +2,6 @@ from typing import Optional, List, Dict, Tuple
 from thinc.api import Model
 from ...lookups import Lookups
 from ...pipeline import Lemmatizer
 from ...symbols import POS
 from ...tokens import Token
@ -22,9 +21,9 @@ class RussianLemmatizer(Lemmatizer):
        name: str = "lemmatizer",
        *,
        mode: str = "pymorphy2",
-        lookups: Optional[Lookups] = None,
+        overwrite: bool = False,
    ) -> None:
-        super().__init__(vocab, model, name, mode=mode, lookups=lookups)
+        super().__init__(vocab, model, name, mode=mode, overwrite=overwrite)
        try:
            from pymorphy2 import MorphAnalyzer
--- a/spacy/lang/uk/init.py
+++ b/spacy/lang/uk/init.py
@ -26,8 +26,8 @@ class Ukrainian(Language):
    default_config={"model": None, "mode": "pymorphy2"},
    default_score_weights={"lemma_acc": 1.0},
 )
-def make_lemmatizer(nlp: Language, model: Optional[Model], name: str, mode: str):
+def make_lemmatizer(nlp: Language, model: Optional[Model], name: str, mode: str, overwrite: bool = False,):
-    return UkrainianLemmatizer(nlp.vocab, model, name, mode=mode)
+    return UkrainianLemmatizer(nlp.vocab, model, name, mode=mode, overwrite=overwrite)
 __all__ = ["Ukrainian"]
--- a/spacy/lang/uk/lemmatizer.py
+++ b/spacy/lang/uk/lemmatizer.py
@ -3,7 +3,6 @@ from typing import Optional
 from thinc.api import Model
 from ..ru.lemmatizer import RussianLemmatizer
 from ...lookups import Lookups
 from ...vocab import Vocab
@ -15,9 +14,9 @@ class UkrainianLemmatizer(RussianLemmatizer):
        name: str = "lemmatizer",
        *,
        mode: str = "pymorphy2",
-        lookups: Optional[Lookups] = None,
+        overwrite: bool = False,
    ) -> None:
-        super().__init__(vocab, model, name, mode=mode, lookups=lookups)
+        super().__init__(vocab, model, name, mode=mode, overwrite=overwrite)
        try:
            from pymorphy2 import MorphAnalyzer
        except ImportError:
--- a/spacy/tests/conftest.py
+++ b/spacy/tests/conftest.py
@ -248,7 +248,6 @@ def tt_tokenizer():
@pytest.fixture(scope="session")
 def uk_tokenizer():
    pytest.importorskip("pymorphy2")
    pytest.importorskip("pymorphy2.lang")
    return get_lang_class("uk")().tokenizer