From dfec6993d65ca3b80aa2f9e48ce4df77d046c4bb Mon Sep 17 00:00:00 2001
From: Paul O'Leary McCann <polm@dampfkraft.com>
Date: Mon, 14 Mar 2022 19:27:23 +0900
Subject: [PATCH] Training works now

---
 spacy/pipeline/coref.py | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/spacy/pipeline/coref.py b/spacy/pipeline/coref.py
index 6833a95b4..0c42ac94a 100644
--- a/spacy/pipeline/coref.py
+++ b/spacy/pipeline/coref.py
@@ -25,6 +25,8 @@ from ..ml.models.coref_util import (
     doc2clusters,
 )
 
+from ..ml.models.coref_util_wl import make_head_only_clusters
+
 from ..coref_scorer import Evaluator, get_cluster_info, b_cubed, muc, ceafe
 
 # TODO remove this - kept for reference for now
@@ -235,6 +237,8 @@ class CoreferenceResolver(TrainablePipe):
             return losses
         set_dropout_rate(self.model, drop)
 
+        make_head_only_clusters(examples)
+
         inputs = [example.predicted for example in examples]
         preds, backprop = self.model.begin_update(inputs)
         score_matrix, mention_idx = preds
@@ -275,6 +279,7 @@ class CoreferenceResolver(TrainablePipe):
         if self._rehearsal_model is None:
             return losses
         validate_examples(examples, "CoreferenceResolver.rehearse")
+        #TODO test this whole function
         docs = [eg.predicted for eg in examples]
         if not any(len(doc) for doc in docs):
             # Handle cases where there are no tokens in any docs.
@@ -394,6 +399,7 @@ class CoreferenceResolver(TrainablePipe):
     def score(self, examples, **kwargs):
         """Score a batch of examples."""
 
+        make_head_only_clusters(examples)
         # NOTE traditionally coref uses the average of b_cubed, muc, and ceaf.
         # we need to handle the average ourselves.
         scores = []