Fix custom tokenizer example

2025-11-04 18:07:26 +03:00 · 2017-06-01 13:02:50 +02:00 · 2017-06-01 13:02:50 +02:00 · 5e60b09dcd
commit 5e60b09dcd
parent 706cec6d58
1 changed files with 3 additions and 2 deletions
--- a/website/docs/usage/customizing-tokenizer.jade
+++ b/website/docs/usage/customizing-tokenizer.jade
@ -201,11 +201,12 @@ p
    prefix_re = re.compile(r'''[\[\(&quot;&apos;]''')
    suffix_re = re.compile(r'''[\]\)&quot;&apos;]''')

-    def create_tokenizer(nlp):
+    def custom_tokenizer(nlp):
        return Tokenizer(nlp.vocab, prefix_search=prefix_re.search,
                                    suffix_search=suffix_re.search)

-    nlp = spacy.load('en', tokenizer=create_tokenizer)
+    nlp = spacy.load('en')
+    nlp.tokenizer = custom_tokenizer(nlp)

 p
    |  If you need to subclass the tokenizer instead, the relevant methods to