Auto-format

2026-03-06 21:01:34 +03:00 · 2019-02-17 12:22:07 +01:00 · 2019-02-17 12:22:07 +01:00 · 1e252b129c
commit 1e252b129c
parent 7d4a52a4d0
2 changed files with 22 additions and 11 deletions
--- a/spacy/errors.py
+++ b/spacy/errors.py
@ -325,7 +325,7 @@ class Errors(object):
            "in previous versions, but had significant bugs that led to poor "
            "performance")
    E117 = ("The newly split tokens must match the text of the original token. "
-            "New orths: {new}. Old text: {old}.") 
+            "New orths: {new}. Old text: {old}.")


@add_codes
--- a/spacy/tests/doc/test_doc_split.py
+++ b/spacy/tests/doc/test_doc_split.py
@ -22,9 +22,9 @@ def test_doc_split(en_vocab):
            ["Los", "Angeles"],
            [(doc[0], 1), doc[1]],
            attrs={
-                "tag": ["NNP"]*2,
+                "tag": ["NNP"] * 2,
                "lemma": ["Los", "Angeles"],
-                "ent_type": ["GPE"]*2
+                "ent_type": ["GPE"] * 2,
            },
        )
    assert len(doc) == 4
@ -46,8 +46,12 @@ def test_split_dependencies(en_vocab):
    dep1 = doc.vocab.strings.add("amod")
    dep2 = doc.vocab.strings.add("subject")
    with doc.retokenize() as retokenizer:
-        retokenizer.split(doc[0], ["Los", "Angeles"],
-                [(doc[0], 1), doc[1]], attrs={'dep': [dep1, dep2]})
+        retokenizer.split(
+            doc[0],
+            ["Los", "Angeles"],
+            [(doc[0], 1), doc[1]],
+            attrs={"dep": [dep1, dep2]},
+        )
    assert doc[0].dep == dep1
    assert doc[1].dep == dep2

@ -73,8 +77,7 @@ def test_spans_entity_merge_iob():
    assert doc[0].ent_iob_ == "B"
    assert doc[1].ent_iob_ == "I"
    with doc.retokenize() as retokenizer:
-        retokenizer.split(doc[0], ["a", "b", "c"],
-            [(doc[0], 1), (doc[0], 2), doc[1]])
+        retokenizer.split(doc[0], ["a", "b", "c"], [(doc[0], 1), (doc[0], 2), doc[1]])
    assert doc[0].ent_iob_ == "B"
    assert doc[1].ent_iob_ == "I"
    assert doc[2].ent_iob_ == "I"
@ -94,10 +97,18 @@ def test_spans_sentence_update_after_merge(en_vocab):
    init_len = len(sent1)
    init_len2 = len(sent2)
    with doc.retokenize() as retokenizer:
-        retokenizer.split(doc[0], ["Stewart", "Lee"], [(doc[0], 1), doc[1]],
-            attrs={"dep": ["compound", "nsubj"]})
-        retokenizer.split(doc[13], ["Joe", "Pasquale"], [(doc[13], 1), doc[12]],
-            attrs={"dep": ["compound", "dobj"]})
+        retokenizer.split(
+            doc[0],
+            ["Stewart", "Lee"],
+            [(doc[0], 1), doc[1]],
+            attrs={"dep": ["compound", "nsubj"]},
+        )
+        retokenizer.split(
+            doc[13],
+            ["Joe", "Pasquale"],
+            [(doc[13], 1), doc[12]],
+            attrs={"dep": ["compound", "dobj"]},
+        )
    sent1, sent2 = list(doc.sents)
    assert len(sent1) == init_len + 1
    assert len(sent2) == init_len2 + 1