Look_up table for languages in spacy.

Need to find an another name for lemmatizerlookup. I was not inspired. Trying to uses new files in fr language.
2025-11-05 18:37:27 +03:00 · 2017-04-24 16:39:00 +02:00 · 2017-04-24 16:39:00 +02:00 · 55c6910f90
commit 55c6910f90
parent 1b12f342e4
10 changed files with 2961774 additions and 1 deletions
--- a/spacy/de/lemmatization.py
+++ b/spacy/de/lemmatization.py
--- a/spacy/en/lemmatization.py
+++ b/spacy/en/lemmatization.py
--- a/spacy/es/lemmatization.py
+++ b/spacy/es/lemmatization.py
--- a/spacy/fr/init.py
+++ b/spacy/fr/init.py
@ -6,7 +6,8 @@ from ..attrs import LANG
 from .language_data import *
 from .punctuation import TOKENIZER_INFIXES, TOKENIZER_SUFFIXES
-
+from ..lemmatizerlookup import Lemmatizer
 from .lemmatization import LOOK_UP
 class FrenchDefaults(BaseDefaults):
    lex_attr_getters = dict(Language.Defaults.lex_attr_getters)
@ -17,13 +18,21 @@ class FrenchDefaults(BaseDefaults):
    suffixes = tuple(TOKENIZER_SUFFIXES)
    token_match = TOKEN_MATCH
    @classmethod
    def create_tokenizer(cls, nlp=None):
        cls.tokenizer_exceptions = get_tokenizer_exceptions()
        return super(FrenchDefaults, cls).create_tokenizer(nlp)
    @classmethod
    def create_lemmatizer(cls, nlp=None):
        return Lemmatizer(LOOK_UP)
 class French(Language):
    lang = 'fr'
    Defaults = FrenchDefaults
--- a/spacy/fr/lemmatization.py
+++ b/spacy/fr/lemmatization.py
--- a/spacy/hu/lemmatization.py
+++ b/spacy/hu/lemmatization.py
--- a/spacy/it/lemmatization.py
+++ b/spacy/it/lemmatization.py
--- a/spacy/lemmatizerlookup.py
+++ b/spacy/lemmatizerlookup.py
@ -0,0 +1,21 @@
 # coding: utf8
 from __future__ import unicode_literals
 from .lemmatizer import Lemmatizer
 class Lemmatizer(Lemmatizer):
    @classmethod
    def load(cls, path, lookup):
        return cls(lookup or {})
    def __init__(self, lookup):
        print("Mon lemmatizer")
        self.lookup = lookup
    def __call__(self, string, univ_pos, morphology=None):
        print("call")
        try:
            return self.lookup[string]
        except:
            return string
--- a/spacy/pt/lemmatization.py
+++ b/spacy/pt/lemmatization.py
--- a/spacy/sv/lemmatization.py
+++ b/spacy/sv/lemmatization.py