Fix gradient in fine_tune

2026-02-04 22:39:50 +03:00 · 2017-08-14 14:55:47 -05:00 · 2017-08-14 14:55:47 -05:00 · 335fa8b05c
commit 335fa8b05c
parent 0ae045256d
1 changed files with 3 additions and 3 deletions
--- a/spacy/_ml.py
+++ b/spacy/_ml.py
@ -377,16 +377,16 @@ def fine_tune(embedding, combine=None):
                    lengths)

        def fine_tune_bwd(d_output, sgd=None):
-            bp_vecs(d_output, sgd=sgd)
+            bp_vecs([d_o * model.d_mix[0] for d_o in d_output], sgd=sgd)
            flat_grad = model.ops.flatten(d_output)
            model.d_mix[1] += flat_tokvecs.dot(flat_grad.T).sum()
            model.d_mix[0] += flat_vecs.dot(flat_grad.T).sum()
            sgd(model._mem.weights, model._mem.gradient, key=model.id)
-            return d_output
+            return [d_o * model.d_mix[1] for d_o in d_output]
        return output, fine_tune_bwd
    model = wrap(fine_tune_fwd, embedding)
    model.mix = model._mem.add((model.id, 'mix'), (2,))
-    model.mix.fill(1.)
+    model.mix.fill(0.5)
    model.d_mix = model._mem.add_gradient((model.id, 'd_mix'), (model.id, 'mix'))
    return model