* Reorganize tests

2025-12-31 22:13:40 +03:00 · 2015-06-07 16:49:46 +02:00 · 2015-06-07 16:49:46 +02:00 · d37dca72dd
commit d37dca72dd
parent 2ef3555d88
51 changed files with 6 additions and 194 deletions
--- a/tests/_depr_group_by.py
+++ b/tests/_depr_group_by.py
@ -1,35 +0,0 @@
-from __future__ import unicode_literals
-
-import pytest
-
-from spacy import en
-from spacy.lexeme import lex_of
-
-from spacy import LEX, NORM, SHAPE, LAST3
-
-
-def test_group_by_lex():
-    tokens = en.tokenize("I like the red one and I like the blue one")
-    names, hashes, groups = tokens.group_by(LEX)
-
-    assert len(groups[0]) == 2
-    assert en.unhash(lex_of(groups[0][0])) == 'I'
-    assert names[0] == 'I'
-    assert len(groups[1]) == 2
-    assert en.unhash(lex_of(groups[1][0])) == 'like'
-    assert names[1] == "like"
-    assert len(groups[2]) == 2
-    assert len(groups[3]) == 1
-
-
-def test_group_by_last3():
-    tokens = en.tokenize("I the blithe swarthy mate ate on the filthy deck")
-    names, hashes, groups = tokens.group_by(LAST3)
-
-    assert len(groups[0]) == 1
-    assert en.unhash(lex_of(groups[0][0])) == 'I'
-    assert len(groups[1]) == 3
-    assert en.unhash(lex_of(groups[1][0])) == 'the'
-    assert len(groups[2]) == 2
-    assert len(groups[3]) == 2
-    assert len(groups[4]) == 1
--- a/tests/depr_test_ner.py
+++ b/tests/depr_test_ner.py
@ -1,156 +0,0 @@
-from __future__ import unicode_literals
-
-from spacy.ner.pystate import PyState
-import pytest
-
-
-@pytest.fixture
-def labels():
-    ent_types = ['LOC', 'MISC', 'ORG', 'PER']
-    moves = ['B', 'I', 'L', 'U']
-    labels = ['NULL', 'EOL', 'O']
-    for move in moves:
-        for ent_type in ent_types:
-            labels.append('%s-%s' % (move, ent_type))
-    return labels
-
-
-@pytest.fixture
-def sentence():
-    return "Ms. Haag plays Elianti .".split()
-
-
-@pytest.fixture
-def state(labels, sentence):
-    return PyState(labels, len(sentence))
-
-
-def test_begin(state, sentence):
-    assert state.n_ents == 0
-    assert state.i == 0
-    state.transition('B-PER')
-    assert state.n_ents == 0
-    assert state.i == 1
-    assert state.open_entity
-    assert state.ent == {'start': 0, 'label': 4, 'end': 0}
-    assert state.is_valid('I-PER')
-    assert not state.is_valid('I-LOC')
-    assert state.is_valid('L-PER')
-    assert not state.is_valid('L-LOC')
-    assert not state.is_valid('O')
-    assert not state.is_valid('U-PER')
-
-
-def test_in(state, sentence):
-    state.transition('B-PER')
-    assert state.n_ents == 0
-    state.transition('I-PER')
-    assert state.n_ents == 0
-    assert state.i == 2
-    assert state.is_valid('I-PER')
-    assert state.is_valid('L-PER')
-    assert not state.is_valid('B-PER')
-    assert not state.is_valid('I-LOC')
-    assert not state.is_valid('L-LOC')
-    assert not state.is_valid('U-PER')
-    assert not state.is_valid('O')
-
-
-def test_last(state, sentence):
-    state.transition('B-PER')
-    assert state.n_ents == 0
-    state.transition('L-PER')
-    assert state.n_ents == 1
-    assert state.i == 2
-    assert not state.open_entity
-    assert state.is_valid('B-PER')
-    assert state.is_valid('B-LOC')
-    assert state.is_valid('U-PER')
-    assert state.is_valid('U-LOC')
-    assert state.is_valid('O')
-    assert not state.is_valid('L-PER')
-    assert not state.is_valid('I-PER')
-
-
-def test_unit(state, sentence):
-    assert state.n_ents == 0
-    state.transition('U-PER')
-    assert state.n_ents == 1
-    assert state.i == 1
-    assert not state.open_entity
-    assert state.is_valid('B-PER')
-    assert state.is_valid('B-LOC')
-    assert state.is_valid('U-PER')
-    assert state.is_valid('U-LOC')
-    assert state.is_valid('O')
-    assert not state.is_valid('I-PER')
-    assert not state.is_valid('L-PER')
-
-
-def test_out(state, sentence):
-    assert state.n_ents == 0
-    state.transition('U-PER')
-    assert state.n_ents == 1
-    assert state.i == 1
-    state.transition('O')
-    assert state.i == 2
-    assert not state.open_entity
-    assert state.is_valid('B-PER')
-    assert state.is_valid('B-LOC')
-    assert state.is_valid('U-PER')
-    assert state.is_valid('U-LOC')
-    assert state.is_valid('O')
-    assert not state.is_valid('I-PER')
-    assert not state.is_valid('L-PER')
-
-
-@pytest.fixture
-def golds(sentence):
-    g = ['B-PER', 'L-PER', 'O', 'U-PER', 'O']
-    assert len(g) == len(sentence)
-    return g
-
-
-def test_oracle_gold(state, sentence, golds):
-    state.set_golds(golds)
-    assert state.is_gold('B-PER')
-    assert not state.is_gold('B-LOC')
-    assert not state.is_gold('I-PER')
-    assert not state.is_gold('L-PER')
-    assert not state.is_gold('U-PER')
-    assert not state.is_gold('O')
-    state.transition('B-PER')
-    assert state.is_gold('L-PER')
-    state.transition('L-PER')
-    assert state.is_gold('O')
-    assert not state.is_gold('B-PER')
-    state.transition('O')
-    assert not state.is_gold('B-PER')
-    assert not state.is_gold('O')
-    assert state.is_gold('U-PER')
-    state.transition('U-PER')
-    assert state.is_gold('O')
-    state.transition('O')
-    assert state.i == len(sentence)
-
-
-def test_oracle_miss_entity(state, sentence, golds):
-    state.set_golds(golds)
-    state.transition('O')
-    assert not state.is_gold('L-PER')
-    assert not state.is_gold('U-PER')
-    assert not state.is_gold('I-PER')
-    assert not state.is_gold('B-PER')
-    assert state.is_gold('O')
-    state.transition('O')
-    state.transition('O')
-    assert state.is_gold('U-PER')
-
-
-def test_oracle_extend_entity(state, sentence, golds):
-    state.set_golds(golds)
-    state.transition('B-PER')
-    assert not state.is_gold('I-PER')
-    state.transition('I-PER')
-    assert state.is_gold('L-PER')
-    assert not state.is_gold('I-PER')
--- a/tests/munge/test_align.py
+++ b/tests/munge/test_align.py
--- a/tests/munge/test_detokenize.py
+++ b/tests/munge/test_detokenize.py
--- a/tests/munge/test_lev_align.py
+++ b/tests/munge/test_lev_align.py
--- a/tests/munge/test_onto_ner.py
+++ b/tests/munge/test_onto_ner.py
--- a/tests/munge/test_onto_sgml_extract.py
+++ b/tests/munge/test_onto_sgml_extract.py
--- a/tests/munge/test_read_ptb.py
+++ b/tests/munge/test_read_ptb.py
--- a/tests/my_test.py
+++ b/tests/my_test.py
--- a/tests/parser/test_conjuncts.py
+++ b/tests/parser/test_conjuncts.py
@ -4,22 +4,25 @@ from __future__ import unicode_literals
 from spacy.en import English
 import pytest

-NLU = English()

 def orths(tokens):
    return [t.orth_ for t in tokens]


 def test_simple_two():
-    tokens = NLU('I lost money and pride.', tag=True, parse=False)
+    nlp = English()
+    tokens = nlp('I lost money and pride.', tag=True, parse=True)
    pride = tokens[4]
+    for t in tokens:
+        print t.orth_, t.tag_, t.head.orth_
    assert orths(pride.conjuncts) == ['money', 'pride']
    money = tokens[2]
    assert orths(money.conjuncts) == ['money', 'pride']


 def test_comma_three():
-    tokens = NLU('I found my wallet, phone and keys.')
+    nlp = English()
+    tokens = nlp('I found my wallet, phone and keys.')
    keys = tokens[-2]
    assert orths(keys.conjuncts) == ['wallet', 'phone', 'keys']
    wallet = tokens[3]
--- a/tests/parser/test_ner.py
+++ b/tests/parser/test_ner.py
--- a/tests/parser/test_parse.py
+++ b/tests/parser/test_parse.py
--- a/tests/parser/test_parse_navigate.py
+++ b/tests/parser/test_parse_navigate.py
--- a/tests/parser/test_sbd.py
+++ b/tests/parser/test_sbd.py
--- a/tests/parser/test_subtree.py
+++ b/tests/parser/test_subtree.py
--- a/tests/spans/test_merge.py
+++ b/tests/spans/test_merge.py
--- a/tests/spans/test_span.py
+++ b/tests/spans/test_span.py
--- a/tests/spans/test_times.py
+++ b/tests/spans/test_times.py
--- a/tests/tagger/test_add_lemmas.py
+++ b/tests/tagger/test_add_lemmas.py
--- a/tests/tagger/test_lemmatizer.py
+++ b/tests/tagger/test_lemmatizer.py
--- a/tests/tagger/test_morph_exceptions.py
+++ b/tests/tagger/test_morph_exceptions.py
--- a/tests/tagger/test_tag_names.py
+++ b/tests/tagger/test_tag_names.py
--- a/tests/tokenizer/test_contractions.py
+++ b/tests/tokenizer/test_contractions.py
--- a/tests/tokenizer/test_emoticons.py
+++ b/tests/tokenizer/test_emoticons.py
--- a/tests/tokenizer/test_indices.py
+++ b/tests/tokenizer/test_indices.py
--- a/tests/tokenizer/test_infix.py
+++ b/tests/tokenizer/test_infix.py
--- a/tests/tokenizer/test_only_punct.py
+++ b/tests/tokenizer/test_only_punct.py
--- a/tests/tokenizer/test_post_punct.py
+++ b/tests/tokenizer/test_post_punct.py
--- a/tests/tokenizer/test_pre_punct.py
+++ b/tests/tokenizer/test_pre_punct.py
--- a/tests/tokenizer/test_special_affix.py
+++ b/tests/tokenizer/test_special_affix.py
--- a/tests/tokenizer/test_surround_punct.py
+++ b/tests/tokenizer/test_surround_punct.py
--- a/tests/tokenizer/test_tokenizer.py
+++ b/tests/tokenizer/test_tokenizer.py
--- a/tests/tokenizer/test_tokens_from_list.py
+++ b/tests/tokenizer/test_tokens_from_list.py
--- a/tests/tokenizer/test_whitespace.py
+++ b/tests/tokenizer/test_whitespace.py
--- a/tests/tokens/test_array.py
+++ b/tests/tokens/test_array.py
--- a/tests/tokens/test_token.py
+++ b/tests/tokens/test_token.py
--- a/tests/tokens/test_token_api.py
+++ b/tests/tokens/test_token_api.py
--- a/tests/tokens/test_token_references.py
+++ b/tests/tokens/test_token_references.py
--- a/tests/tokens/test_tokens_api.py
+++ b/tests/tokens/test_tokens_api.py
--- a/tests/tokens/test_vec.py
+++ b/tests/tokens/test_vec.py
--- a/tests/vocab/test_asciify.py
+++ b/tests/vocab/test_asciify.py
--- a/tests/vocab/test_flag_features.py
+++ b/tests/vocab/test_flag_features.py
--- a/tests/vocab/test_intern.py
+++ b/tests/vocab/test_intern.py
--- a/tests/vocab/test_is_punct.py
+++ b/tests/vocab/test_is_punct.py
--- a/tests/vocab/test_iter_lexicon.py
+++ b/tests/vocab/test_iter_lexicon.py
--- a/tests/vocab/test_lexeme_flags.py
+++ b/tests/vocab/test_lexeme_flags.py
--- a/tests/vocab/test_number.py
+++ b/tests/vocab/test_number.py
--- a/tests/vocab/test_shape.py
+++ b/tests/vocab/test_shape.py
--- a/tests/vocab/test_string_loading.py
+++ b/tests/vocab/test_string_loading.py
--- a/tests/vocab/test_urlish.py
+++ b/tests/vocab/test_urlish.py
--- a/tests/vocab/test_vocab.py
+++ b/tests/vocab/test_vocab.py