Try to fix tests on Travis (2.7)

2025-11-22 10:45:45 +03:00 · 2020-05-21 14:04:57 +02:00 · 2020-05-21 14:04:57 +02:00 · 56de520afd
commit 56de520afd
parent f2a131bd9a
5 changed files with 21 additions and 21 deletions
--- a/spacy/lang/hy/examples.py
+++ b/spacy/lang/hy/examples.py
@ -1,3 +1,4 @@
+# coding: utf8
 from __future__ import unicode_literals


--- a/spacy/lang/hy/lex_attrs.py
+++ b/spacy/lang/hy/lex_attrs.py
@ -1,3 +1,4 @@
+# coding: utf8
 from __future__ import unicode_literals

 from ...attrs import LIKE_NUM
--- a/spacy/lang/hy/stop_words.py
+++ b/spacy/lang/hy/stop_words.py
@ -1,3 +1,4 @@
+# coding: utf8
 from __future__ import unicode_literals


--- a/spacy/lang/zh/init.py
+++ b/spacy/lang/zh/init.py
@ -109,6 +109,7 @@ class ChineseTokenizer(DummyTokenizer):
            if reset:
                try:
                    import pkuseg
+
                    self.pkuseg_seg.preprocesser = pkuseg.Preprocesser(None)
                except ImportError:
                    if self.use_pkuseg:
@ -118,7 +119,7 @@ class ChineseTokenizer(DummyTokenizer):
                        )
                        raise ImportError(msg)
            for word in words:
-                self.pkuseg_seg.preprocesser.insert(word.strip(), '')
+                self.pkuseg_seg.preprocesser.insert(word.strip(), "")

    def _get_config(self):
        config = OrderedDict(
@ -168,21 +169,19 @@ class ChineseTokenizer(DummyTokenizer):
        return util.to_bytes(serializers, [])

    def from_bytes(self, data, **kwargs):
-        pkuseg_features_b = b""
-        pkuseg_weights_b = b""
-        pkuseg_processors_data = None
+        data = {"features_b": b"", "weights_b": b"", "processors_data": None}
+        # pkuseg_features_b = b""
+        # pkuseg_weights_b = b""
+        # pkuseg_processors_data = None

        def deserialize_pkuseg_features(b):
-            nonlocal pkuseg_features_b
-            pkuseg_features_b = b
+            data["features_b"] = b

        def deserialize_pkuseg_weights(b):
-            nonlocal pkuseg_weights_b
-            pkuseg_weights_b = b
+            data["weights_b"] = b

        def deserialize_pkuseg_processors(b):
-            nonlocal pkuseg_processors_data
-            pkuseg_processors_data = srsly.msgpack_loads(b)
+            data["processors_data"] = srsly.msgpack_loads(b)

        deserializers = OrderedDict(
            (
@ -194,13 +193,13 @@ class ChineseTokenizer(DummyTokenizer):
        )
        util.from_bytes(data, deserializers, [])

-        if pkuseg_features_b and pkuseg_weights_b:
+        if data["features_b"] and data["weights_b"]:
            with tempfile.TemporaryDirectory() as tempdir:
                tempdir = Path(tempdir)
                with open(tempdir / "features.pkl", "wb") as fileh:
-                    fileh.write(pkuseg_features_b)
+                    fileh.write(data["features_b"])
                with open(tempdir / "weights.npz", "wb") as fileh:
-                    fileh.write(pkuseg_weights_b)
+                    fileh.write(data["weights_b"])
                try:
                    import pkuseg
                except ImportError:
@ -209,13 +208,10 @@ class ChineseTokenizer(DummyTokenizer):
                        + _PKUSEG_INSTALL_MSG
                    )
                self.pkuseg_seg = pkuseg.pkuseg(str(tempdir))
-            if pkuseg_processors_data:
-                (
-                    user_dict,
-                    do_process,
-                    common_words,
-                    other_words,
-                ) = pkuseg_processors_data
+            if data["processors_data"]:
+                (user_dict, do_process, common_words, other_words) = data[
+                    "processors_data"
+                ]
                self.pkuseg_seg.preprocesser = pkuseg.Preprocesser(user_dict)
                self.pkuseg_seg.postprocesser.do_process = do_process
                self.pkuseg_seg.postprocesser.common_words = set(common_words)
--- a/spacy/tests/lang/hy/test_text.py
+++ b/spacy/tests/lang/hy/test_text.py
@ -1,3 +1,4 @@
+# coding: utf8
 from __future__ import unicode_literals

 import pytest