* Ignore adjective supersenses

2026-03-05 12:21:27 +03:00 · 2015-07-03 04:46:11 +02:00 · 2015-07-03 04:46:11 +02:00 · c60cc22390
commit c60cc22390
parent dbcef2b76e
1 changed files with 2 additions and 4 deletions
--- a/bin/init_model.py
+++ b/bin/init_model.py
@ -87,6 +87,8 @@ def _read_senses(loc):
        word = sense_strings.pop(0)
        for sense in sense_strings:
            pos, sense = sense[3:].split('.')
+            if pos[0].upper() == 'A':
+                continue
            sense_name = '%s_%s' % (pos[0].upper(), sense.lower())
            if sense_name != 'N_tops':
                sense_id = sense_names[sense_name]
@ -124,10 +126,6 @@ def setup_vocab(src_dir, dst_dir):
                for lemma in lemmatizer(word.lower(), pos):
                    lemmas.append(lemma)
                    orth_senses.update(senses[lemma][pos])
-            if word.lower() == 'dogging':
-                print word
-                print lemmas
-                print [spacy.senses.STRINGS[si] for si in orth_senses]
            entry['senses'] = list(sorted(orth_senses))
            vocab[word] = entry
    vocab.dump(str(dst_dir / 'lexemes.bin'))