* Use the gold sense labels for training

2025-08-13 16:44:56 +03:00 · 2015-07-03 05:45:42 +02:00 · 2015-07-03 05:45:42 +02:00 · 5d933eec8e
commit 5d933eec8e
parent 4a60b68a24
1 changed files with 7 additions and 2 deletions
--- a/spacy/sense_tagger.pyx
+++ b/spacy/sense_tagger.pyx
@ -207,11 +207,16 @@ cdef class SenseTagger:
        eg = Example(self.model.n_classes, CONTEXT_SIZE, self.model.n_feats+1,
                     self.model.n_feats+1)
        cdef int i
+        for i, ssenses in enumerate(gold.ssenses):
+            if ssenses:
+                gold.c.ssenses[i] = encode_sense_strs(ssenses)
+            else:
+                gold.c.ssenses[i] = pos_senses(&tokens.data[i])
        cdef int cost = 0
        for i in range(tokens.length):
-            if tokens.data[i].lex.senses == 0:
+            if tokens.data[i].lex.senses == 0 or tokens.data[i].lex.senses == 1:
                continue
-            self._set_costs(<bint*>eg.c.is_valid, eg.c.costs, pos_senses(&tokens.data[i]))
+            self._set_costs(<bint*>eg.c.is_valid, eg.c.costs, gold.c.ssenses[i])
            fill_context(eg.c.atoms, &tokens.data[i])

            self.model.train(eg)