Auto-format code with black (#11427)

Co-authored-by: explosion-bot <explosion-bot@users.noreply.github.com>
2025-12-22 09:34:23 +03:00 · 2022-09-02 11:43:20 +02:00 · 2022-09-02 11:43:20 +02:00 · 71884d0942
commit 71884d0942
parent d1760ebe02
6 changed files with 67 additions and 16 deletions
--- a/spacy/lang/la/init.py
+++ b/spacy/lang/la/init.py
@ -6,7 +6,7 @@ from .lex_attrs import LEX_ATTRS

 class LatinDefaults(BaseDefaults):
    tokenizer_exceptions = TOKENIZER_EXCEPTIONS
-    stop_words = STOP_WORDS    
+    stop_words = STOP_WORDS
    lex_attr_getters = LEX_ATTRS


--- a/spacy/lang/la/lex_attrs.py
+++ b/spacy/lang/la/lex_attrs.py
@ -2,7 +2,9 @@ from ...attrs import LIKE_NUM
 import re

 # cf. Goyvaerts/Levithan 2009; case-insensitive, allow 4
-roman_numerals_compile = re.compile(r'(?i)^(?=[MDCLXVI])M*(C[MD]|D?C{0,4})(X[CL]|L?X{0,4})(I[XV]|V?I{0,4})$')
+roman_numerals_compile = re.compile(
+    r"(?i)^(?=[MDCLXVI])M*(C[MD]|D?C{0,4})(X[CL]|L?X{0,4})(I[XV]|V?I{0,4})$"
+)

 _num_words = set(
    """
--- a/spacy/lang/la/tokenizer_exceptions.py
+++ b/spacy/lang/la/tokenizer_exceptions.py
@ -9,21 +9,67 @@ _exc = {
    "tecum": [{ORTH: "te"}, {ORTH: "cum"}],
    "nobiscum": [{ORTH: "nobis"}, {ORTH: "cum"}],
    "vobiscum": [{ORTH: "vobis"}, {ORTH: "cum"}],
-    "uobiscum": [{ORTH: "uobis"}, {ORTH: "cum"}],    
+    "uobiscum": [{ORTH: "uobis"}, {ORTH: "cum"}],
 }

 for orth in [
-
-    'A.', 'Agr.', 'Ap.', 'C.', 'Cn.', 'D.', 'F.', 'K.', 'L.', "M'.", 'M.', 'Mam.', 'N.', 'Oct.', 
-    'Opet.', 'P.', 'Paul.', 'Post.', 'Pro.', 'Q.', 'S.', 'Ser.', 'Sert.', 'Sex.', 'St.', 'Sta.', 
-    'T.', 'Ti.', 'V.', 'Vol.', 'Vop.', 'U.', 'Uol.', 'Uop.',
-
-    'Ian.', 'Febr.', 'Mart.', 'Apr.', 'Mai.', 'Iun.', 'Iul.', 'Aug.', 'Sept.', 'Oct.', 'Nov.', 'Nou.', 
-    'Dec.',
-    
-    'Non.', 'Id.', 'A.D.', 
-
-    'Coll.', 'Cos.', 'Ord.', 'Pl.', 'S.C.', 'Suff.', 'Trib.',
+    "A.",
+    "Agr.",
+    "Ap.",
+    "C.",
+    "Cn.",
+    "D.",
+    "F.",
+    "K.",
+    "L.",
+    "M'.",
+    "M.",
+    "Mam.",
+    "N.",
+    "Oct.",
+    "Opet.",
+    "P.",
+    "Paul.",
+    "Post.",
+    "Pro.",
+    "Q.",
+    "S.",
+    "Ser.",
+    "Sert.",
+    "Sex.",
+    "St.",
+    "Sta.",
+    "T.",
+    "Ti.",
+    "V.",
+    "Vol.",
+    "Vop.",
+    "U.",
+    "Uol.",
+    "Uop.",
+    "Ian.",
+    "Febr.",
+    "Mart.",
+    "Apr.",
+    "Mai.",
+    "Iun.",
+    "Iul.",
+    "Aug.",
+    "Sept.",
+    "Oct.",
+    "Nov.",
+    "Nou.",
+    "Dec.",
+    "Non.",
+    "Id.",
+    "A.D.",
+    "Coll.",
+    "Cos.",
+    "Ord.",
+    "Pl.",
+    "S.C.",
+    "Suff.",
+    "Trib.",
 ]:
    _exc[orth] = [{ORTH: orth}]

--- a/spacy/tests/conftest.py
+++ b/spacy/tests/conftest.py
@ -258,7 +258,7 @@ def ko_tokenizer_tokenizer():

@pytest.fixture(scope="module")
 def la_tokenizer():
-    return get_lang_class("la")().tokenizer    
+    return get_lang_class("la")().tokenizer


@pytest.fixture(scope="session")
--- a/spacy/tests/lang/la/test_exception.py
+++ b/spacy/tests/lang/la/test_exception.py
@ -1,5 +1,6 @@
 import pytest

+
 def test_la_tokenizer_handles_exc_in_text(la_tokenizer):
    text = "scio te omnia facturum, ut nobiscum quam primum sis"
    tokens = la_tokenizer(text)
--- a/spacy/tests/lang/la/test_text.py
+++ b/spacy/tests/lang/la/test_text.py
@ -1,6 +1,7 @@
 import pytest
 from spacy.lang.la.lex_attrs import like_num

+
@pytest.mark.parametrize(
    "text,match",
    [
@ -13,7 +14,7 @@ from spacy.lang.la.lex_attrs import like_num
        ("ix", True),
        ("MMXXII", True),
        ("0", True),
-        ("1", True),        
+        ("1", True),
        ("quattuor", True),
        ("decem", True),
        ("tertius", True),
@ -27,6 +28,7 @@ def test_lex_attrs_like_number(la_tokenizer, text, match):
    assert len(tokens) == 1
    assert tokens[0].like_num == match

+
@pytest.mark.parametrize("word", ["quinque"])
 def test_la_lex_attrs_capitals(word):
    assert like_num(word)