Use base language data as default

2026-02-17 04:30:49 +03:00 · 2016-12-18 16:55:25 +01:00 · 2016-12-18 16:55:25 +01:00 · 753068f1d5
commit 753068f1d5
parent bcc1d50d09
1 changed files with 7 additions and 6 deletions
--- a/spacy/language.py
+++ b/spacy/language.py
@ -21,6 +21,7 @@ from .matcher import Matcher
 from . import attrs
 from . import orth
 from . import util
+from . import language_data
 from .lemmatizer import Lemmatizer
 from .train import Trainer

@ -140,14 +141,14 @@ class BaseDefaults(object):
        if nlp.entity:
            pipeline.append(nlp.entity)
        return pipeline
-    
-    prefixes = tuple()

-    suffixes = tuple()
+    prefixes = tuple(language_data.TOKENIZER_PREFIXES)

-    infixes = tuple()
- 
-    tag_map = {}
+    suffixes = tuple(language_data.TOKENIZER_SUFFIXES)
+
+    infixes = tuple(language_data.TOKENIZER_INFIXES)
+
+    tag_map = dict(language_data.TAG_MAP)

    tokenizer_exceptions = {}