Try to fix memory error by moving fr_tokenizer to module scope

2025-10-18 09:44:16 +03:00 · 2018-07-24 20:09:06 +02:00 · 2018-07-24 20:09:06 +02:00 · 6303ce3d0e
commit 6303ce3d0e
parent afe3fa4449
4 changed files with 21 additions and 6 deletions
--- a/spacy/tests/conftest.py
+++ b/spacy/tests/conftest.py
@ -92,11 +92,6 @@ def de_tokenizer():
    return util.get_lang_class('de').Defaults.create_tokenizer()


-@pytest.fixture(scope='session')
-def fr_tokenizer():
-    return util.get_lang_class('fr').Defaults.create_tokenizer()
-
-
@pytest.fixture(scope='session')
 def hu_tokenizer():
    return util.get_lang_class('hu').Defaults.create_tokenizer()
--- a/spacy/tests/lang/fr/test_exceptions.py
+++ b/spacy/tests/lang/fr/test_exceptions.py
@ -3,6 +3,11 @@
 from __future__ import unicode_literals

 import pytest
+from .... import util
+
+@pytest.fixture(scope='module')
+def fr_tokenizer():
+    return util.get_lang_class('fr').Defaults.create_tokenizer()


@pytest.mark.parametrize('text', ["aujourd'hui", "Aujourd'hui", "prud'hommes",
--- a/spacy/tests/lang/fr/test_text.py
+++ b/spacy/tests/lang/fr/test_text.py
@ -1,5 +1,13 @@
 # coding: utf8
 from __future__ import unicode_literals
+import pytest
+
+from .... import util
+
+@pytest.fixture(scope='module')
+def fr_tokenizer():
+    return util.get_lang_class('fr').Defaults.create_tokenizer()
+


 def test_tokenizer_handles_long_text(fr_tokenizer):
--- a/spacy/tests/regression/test_issue852.py
+++ b/spacy/tests/regression/test_issue852.py
@ -3,6 +3,13 @@ from __future__ import unicode_literals

 import pytest

+from ... import util
+
+@pytest.fixture(scope='module')
+def fr_tokenizer():
+    return util.get_lang_class('fr').Defaults.create_tokenizer()
+
+

@pytest.mark.parametrize('text', ["au-delàs", "pair-programmâmes",
                                  "terra-formées", "σ-compacts"])