fix token len

2025-09-06 20:34:56 +03:00 · 2023-05-08 00:54:12 +08:00 · 2023-05-08 00:54:12 +08:00 · 82ce3cc3f0
commit 82ce3cc3f0
parent 86d78d9730
1 changed files with 1 additions and 1 deletions
--- a/spacy/tests/lang/ms/test_prefix_suffix_infix.py
+++ b/spacy/tests/lang/ms/test_prefix_suffix_infix.py
@ -61,7 +61,7 @@ def test_ms_tokenizer_splits_uneven_wrap_interact(id_tokenizer, text):


@pytest.mark.parametrize(
-    "text,length", [("kerana", 1), ("Mahathir-Anwar", 3), ("Tun Dr. Ismail-Abdul Rahman", 4)]
+    "text,length", [("kerana", 1), ("Mahathir-Anwar", 3), ("Tun Dr. Ismail-Abdul Rahman", 6)]
 )
 def test_my_tokenizer_splits_hyphens(ms_tokenizer, text, length):
    tokens = ms_tokenizer(text)