Adding method lemmatizer for every class

2025-11-06 10:57:34 +03:00 · 2017-05-03 12:14:42 +02:00 · 2017-05-03 12:14:42 +02:00 · 0e8c41ea4f
commit 0e8c41ea4f
parent 32ca07989e
6 changed files with 34 additions and 5 deletions
--- a/spacy/de/init.py
+++ b/spacy/de/init.py
@ -7,6 +7,8 @@ from ..language import Language
 from ..attrs import LANG

 from .language_data import *
+from ..lemmatizerlookup import Lemmatizer
+from .lemmatization import LOOK_UP


 class German(Language):
@ -21,5 +23,9 @@ class German(Language):
        tag_map = TAG_MAP
        stop_words = STOP_WORDS

+        @classmethod
+        def create_lemmatizer(cls, nlp=None):
+            return Lemmatizer(LOOK_UP)
+

 EXPORT = German
--- a/spacy/es/init.py
+++ b/spacy/es/init.py
@ -7,7 +7,8 @@ from ..language import Language
 from ..attrs import LANG

 from .language_data import *
-
+from ..lemmatizerlookup import Lemmatizer
+from .lemmatization import LOOK_UP

 class Spanish(Language):
    lang = 'es'
@ -21,4 +22,5 @@ class Spanish(Language):
        stop_words = STOP_WORDS


+
 EXPORT = Spanish
--- a/spacy/hu/init.py
+++ b/spacy/hu/init.py
@ -5,7 +5,8 @@ from .tokenizer_exceptions import TOKEN_MATCH
 from .language_data import *
 from ..attrs import LANG
 from ..language import Language
-
+from ..lemmatizerlookup import Lemmatizer
+from .lemmatization import LOOK_UP

 class Hungarian(Language):
    lang = 'hu'
@ -25,5 +26,9 @@ class Hungarian(Language):

        token_match = TOKEN_MATCH

+        @classmethod
+        def create_lemmatizer(cls, nlp=None):
+            return Lemmatizer(LOOK_UP)
+

 EXPORT = Hungarian
--- a/spacy/it/init.py
+++ b/spacy/it/init.py
@ -5,7 +5,8 @@ from ..language import Language
 from ..attrs import LANG

 from .language_data import *
-
+from ..lemmatizerlookup import Lemmatizer
+from .lemmatization import LOOK_UP

 class Italian(Language):
    lang = 'it'
@ -17,5 +18,10 @@ class Italian(Language):
        tokenizer_exceptions = TOKENIZER_EXCEPTIONS
        stop_words = STOP_WORDS

+        @classmethod
+        def create_lemmatizer(cls, nlp=None):
+            return Lemmatizer(LOOK_UP)
+
+

 EXPORT = Italian
--- a/spacy/pt/init.py
+++ b/spacy/pt/init.py
@ -5,7 +5,8 @@ from ..language import Language
 from ..attrs import LANG

 from .language_data import *
-
+from ..lemmatizerlookup import Lemmatizer
+from .lemmatization import LOOK_UP

 class Portuguese(Language):
    lang = 'pt'
@ -17,5 +18,9 @@ class Portuguese(Language):
        tokenizer_exceptions = TOKENIZER_EXCEPTIONS
        stop_words = STOP_WORDS

+        @classmethod
+        def create_lemmatizer(cls, nlp=None):
+            return Lemmatizer(LOOK_UP)
+

 EXPORT = Portuguese
--- a/spacy/sv/init.py
+++ b/spacy/sv/init.py
@ -4,7 +4,8 @@ from __future__ import unicode_literals, print_function
 from ..language import Language
 from ..attrs import LANG
 from .language_data import *
-
+from ..lemmatizerlookup import Lemmatizer
+from .lemmatization import LOOK_UP

 class Swedish(Language):
    lang = 'sv'
@ -16,5 +17,9 @@ class Swedish(Language):
        tokenizer_exceptions = TOKENIZER_EXCEPTIONS
        stop_words = STOP_WORDS

+        @classmethod
+        def create_lemmatizer(cls, nlp=None):
+            return Lemmatizer(LOOK_UP)
+

 EXPORT = Swedish