Remove default initialize lookups

2025-11-04 09:57:26 +03:00 · 2020-10-01 21:54:33 +02:00 · 2020-10-01 21:54:33 +02:00 · d48ddd6c9a
commit d48ddd6c9a
parent 1700c8541e
11 changed files with 0 additions and 116 deletions
--- a/spacy/lang/da/init.py
+++ b/spacy/lang/da/init.py
@ -3,21 +3,9 @@ from .punctuation import TOKENIZER_INFIXES, TOKENIZER_SUFFIXES
 from .stop_words import STOP_WORDS
 from .lex_attrs import LEX_ATTRS
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class DanishDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    infixes = TOKENIZER_INFIXES
    suffixes = TOKENIZER_SUFFIXES
--- a/spacy/lang/de/init.py
+++ b/spacy/lang/de/init.py
@ -3,21 +3,9 @@ from .punctuation import TOKENIZER_PREFIXES, TOKENIZER_SUFFIXES, TOKENIZER_INFIX
 from .stop_words import STOP_WORDS
 from .syntax_iterators import SYNTAX_ITERATORS
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class GermanDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    prefixes = TOKENIZER_PREFIXES
    suffixes = TOKENIZER_SUFFIXES
--- a/spacy/lang/el/init.py
+++ b/spacy/lang/el/init.py
@ -9,21 +9,9 @@ from .punctuation import TOKENIZER_PREFIXES, TOKENIZER_SUFFIXES, TOKENIZER_INFIX
 from .lemmatizer import GreekLemmatizer
 from ...lookups import Lookups
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class GreekDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    prefixes = TOKENIZER_PREFIXES
    suffixes = TOKENIZER_SUFFIXES
--- a/spacy/lang/id/init.py
+++ b/spacy/lang/id/init.py
@ -4,21 +4,9 @@ from .tokenizer_exceptions import TOKENIZER_EXCEPTIONS
 from .lex_attrs import LEX_ATTRS
 from .syntax_iterators import SYNTAX_ITERATORS
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class IndonesianDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    prefixes = TOKENIZER_PREFIXES
    suffixes = TOKENIZER_SUFFIXES
--- a/spacy/lang/lb/init.py
+++ b/spacy/lang/lb/init.py
@ -3,21 +3,9 @@ from .punctuation import TOKENIZER_INFIXES
 from .lex_attrs import LEX_ATTRS
 from .stop_words import STOP_WORDS
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class LuxembourgishDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    infixes = TOKENIZER_INFIXES
    lex_attr_getters = LEX_ATTRS
--- a/spacy/lang/pt/init.py
+++ b/spacy/lang/pt/init.py
@ -3,21 +3,9 @@ from .stop_words import STOP_WORDS
 from .lex_attrs import LEX_ATTRS
 from .punctuation import TOKENIZER_INFIXES, TOKENIZER_PREFIXES
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class PortugueseDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    infixes = TOKENIZER_INFIXES
    prefixes = TOKENIZER_PREFIXES
--- a/spacy/lang/ru/init.py
+++ b/spacy/lang/ru/init.py
@ -7,21 +7,9 @@ from .lex_attrs import LEX_ATTRS
 from .lemmatizer import RussianLemmatizer
 from ...language import Language
 from ...lookups import Lookups
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class RussianDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    lex_attr_getters = LEX_ATTRS
    stop_words = STOP_WORDS
--- a/spacy/lang/sr/init.py
+++ b/spacy/lang/sr/init.py
@ -2,21 +2,9 @@ from .stop_words import STOP_WORDS
 from .tokenizer_exceptions import TOKENIZER_EXCEPTIONS
 from .lex_attrs import LEX_ATTRS
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class SerbianDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
    lex_attr_getters = LEX_ATTRS
    stop_words = STOP_WORDS
--- a/spacy/lang/ta/init.py
+++ b/spacy/lang/ta/init.py
@ -1,21 +1,9 @@
 from .stop_words import STOP_WORDS
 from .lex_attrs import LEX_ATTRS
 from ...language import Language
 from ...util import load_config_from_str
 DEFAULT_CONFIG = """
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
 class TamilDefaults(Language.Defaults):
    config = load_config_from_str(DEFAULT_CONFIG)
    lex_attr_getters = LEX_ATTRS
    stop_words = STOP_WORDS
--- a/spacy/lang/th/init.py
+++ b/spacy/lang/th/init.py
@ -10,13 +10,6 @@ DEFAULT_CONFIG = """
 [nlp.tokenizer]
@tokenizers = "spacy.th.ThaiTokenizer"
 [initialize]
 [initialize.lookups]
@misc = "spacy.LookupsDataLoader.v1"
 lang = ${nlp.lang}
 tables = ["lexeme_norm"]
 """
--- a/spacy/tests/parser/test_ner.py
+++ b/spacy/tests/parser/test_ner.py
@ -339,7 +339,6 @@ def test_ner_warns_no_lookups(caplog):
    nlp.vocab.lookups = Lookups()
    assert not len(nlp.vocab.lookups)
    nlp.add_pipe("ner")
    nlp.config["initialize"]["lookups"] = None
    with caplog.at_level(logging.DEBUG):
        nlp.initialize()
        assert "W033" in caplog.text