Auto-format code with black (#11427)

Co-authored-by: explosion-bot <explosion-bot@users.noreply.github.com>
2025-10-22 19:54:18 +03:00 · 2022-09-02 11:43:20 +02:00 · 2022-09-02 11:43:20 +02:00 · 71884d0942
commit 71884d0942
parent d1760ebe02
6 changed files with 67 additions and 16 deletions
--- a/spacy/lang/la/init.py
+++ b/spacy/lang/la/init.py
@ -6,7 +6,7 @@ from .lex_attrs import LEX_ATTRS
 class LatinDefaults(BaseDefaults):
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
-    stop_words = STOP_WORDS    
+    stop_words = STOP_WORDS
    lex_attr_getters = LEX_ATTRS
--- a/spacy/lang/la/lex_attrs.py
+++ b/spacy/lang/la/lex_attrs.py
@ -2,7 +2,9 @@ from ...attrs import LIKE_NUM
 import re
 # cf. Goyvaerts/Levithan 2009; case-insensitive, allow 4
-roman_numerals_compile = re.compile(r'(?i)^(?=[MDCLXVI])M*(C[MD]|D?C{0,4})(X[CL]|L?X{0,4})(I[XV]|V?I{0,4})$')
+roman_numerals_compile = re.compile(
    r"(?i)^(?=[MDCLXVI])M*(C[MD]|D?C{0,4})(X[CL]|L?X{0,4})(I[XV]|V?I{0,4})$"
 )
 _num_words = set(
    """
--- a/spacy/lang/la/tokenizer_exceptions.py
+++ b/spacy/lang/la/tokenizer_exceptions.py
@ -9,21 +9,67 @@ _exc = {
    "tecum": [{ORTH: "te"}, {ORTH: "cum"}],
    "nobiscum": [{ORTH: "nobis"}, {ORTH: "cum"}],
    "vobiscum": [{ORTH: "vobis"}, {ORTH: "cum"}],
-    "uobiscum": [{ORTH: "uobis"}, {ORTH: "cum"}],    
+    "uobiscum": [{ORTH: "uobis"}, {ORTH: "cum"}],
 }
 for orth in [
-
+    "A.",
-    'A.', 'Agr.', 'Ap.', 'C.', 'Cn.', 'D.', 'F.', 'K.', 'L.', "M'.", 'M.', 'Mam.', 'N.', 'Oct.', 
+    "Agr.",
-    'Opet.', 'P.', 'Paul.', 'Post.', 'Pro.', 'Q.', 'S.', 'Ser.', 'Sert.', 'Sex.', 'St.', 'Sta.', 
+    "Ap.",
-    'T.', 'Ti.', 'V.', 'Vol.', 'Vop.', 'U.', 'Uol.', 'Uop.',
+    "C.",
-
+    "Cn.",
-    'Ian.', 'Febr.', 'Mart.', 'Apr.', 'Mai.', 'Iun.', 'Iul.', 'Aug.', 'Sept.', 'Oct.', 'Nov.', 'Nou.', 
+    "D.",
-    'Dec.',
+    "F.",
-    
+    "K.",
-    'Non.', 'Id.', 'A.D.', 
+    "L.",
-
+    "M'.",
-    'Coll.', 'Cos.', 'Ord.', 'Pl.', 'S.C.', 'Suff.', 'Trib.',
+    "M.",
    "Mam.",
    "N.",
    "Oct.",
    "Opet.",
    "P.",
    "Paul.",
    "Post.",
    "Pro.",
    "Q.",
    "S.",
    "Ser.",
    "Sert.",
    "Sex.",
    "St.",
    "Sta.",
    "T.",
    "Ti.",
    "V.",
    "Vol.",
    "Vop.",
    "U.",
    "Uol.",
    "Uop.",
    "Ian.",
    "Febr.",
    "Mart.",
    "Apr.",
    "Mai.",
    "Iun.",
    "Iul.",
    "Aug.",
    "Sept.",
    "Oct.",
    "Nov.",
    "Nou.",
    "Dec.",
    "Non.",
    "Id.",
    "A.D.",
    "Coll.",
    "Cos.",
    "Ord.",
    "Pl.",
    "S.C.",
    "Suff.",
    "Trib.",
 ]:
    _exc[orth] = [{ORTH: orth}]
--- a/spacy/tests/conftest.py
+++ b/spacy/tests/conftest.py
@ -258,7 +258,7 @@ def ko_tokenizer_tokenizer():
@pytest.fixture(scope="module")
 def la_tokenizer():
-    return get_lang_class("la")().tokenizer    
+    return get_lang_class("la")().tokenizer
@pytest.fixture(scope="session")
--- a/spacy/tests/lang/la/test_exception.py
+++ b/spacy/tests/lang/la/test_exception.py
@ -1,5 +1,6 @@
 import pytest
 def test_la_tokenizer_handles_exc_in_text(la_tokenizer):
    text = "scio te omnia facturum, ut nobiscum quam primum sis"
    tokens = la_tokenizer(text)
--- a/spacy/tests/lang/la/test_text.py
+++ b/spacy/tests/lang/la/test_text.py
@ -1,6 +1,7 @@
 import pytest
 from spacy.lang.la.lex_attrs import like_num
@pytest.mark.parametrize(
    "text,match",
    [
@ -13,7 +14,7 @@ from spacy.lang.la.lex_attrs import like_num
        ("ix", True),
        ("MMXXII", True),
        ("0", True),
-        ("1", True),        
+        ("1", True),
        ("quattuor", True),
        ("decem", True),
        ("tertius", True),
@ -27,6 +28,7 @@ def test_lex_attrs_like_number(la_tokenizer, text, match):
    assert len(tokens) == 1
    assert tokens[0].like_num == match
@pytest.mark.parametrize("word", ["quinque"])
 def test_la_lex_attrs_capitals(word):
    assert like_num(word)