spaCy/spacy/scorer.py

from __future__ import division


class Scorer(object):
    def __init__(self, eval_punct=False):
        self.heads_corr = 0
        self.labels_corr = 0
        self.tags_corr = 0
        self.ents_tp = 0
        self.ents_fp = 0
        self.ents_fn = 0
        self.total = 1e-100
        self.mistokened = 0
        self.n_tokens = 0
        self.eval_punct = eval_punct

    @property
    def tags_acc(self):
        return ((self.tags_corr - self.mistokened) / (self.n_tokens - self.mistokened)) * 100

    @property
    def uas(self):
        return (self.heads_corr / self.total) * 100

    @property
    def las(self):
        return (self.labels_corr / self.total) * 100

    @property
    def ents_p(self):
        return (self.ents_tp / (self.ents_tp + self.ents_fp + 1e-100)) * 100

    @property
    def ents_r(self):
        return (self.ents_tp / (self.ents_tp + self.ents_fn + 1e-100)) * 100

    @property
    def ents_f(self):
        return (2 * self.ents_p * self.ents_r) / (self.ents_p + self.ents_r + 1e-100)

    def score(self, tokens, gold, verbose=False):
        assert len(tokens) == len(gold)

        for i, token in enumerate(tokens):
            if gold.orths.get(token.idx) != token.orth_:
                self.mistokened += 1
            if not self.skip_token(i, token, gold):
                self.total += 1
                if verbose:
                    print token.orth_, token.dep_, token.head.orth_, token.head.i == gold.heads[i]
                if token.head.i == gold.heads[i]:
                    self.heads_corr += 1
                    self.labels_corr += token.dep_ == gold.labels[i]
            self.tags_corr += token.tag_ == gold.tags[i]
            self.n_tokens += 1
        gold_ents = set((start, end, label) for (start, end, label) in gold.ents)
        guess_ents = set((e.start, e.end, e.label_) for e in tokens.ents)
        if verbose and gold_ents:
            for start, end, label in guess_ents:
                mark = 'T' if (start, end, label) in gold_ents else 'F'
                ent_str = ' '.join(tokens[i].orth_ for i in range(start, end))
                print mark, label, ent_str
            for start, end, label in gold_ents:
                if (start, end, label) not in guess_ents:
                    ent_str = ' '.join(tokens[i].orth_ for i in range(start, end))
                    print 'M', label, ent_str
            print
        if gold_ents:
            self.ents_tp += len(gold_ents.intersection(guess_ents))
            self.ents_fn += len(gold_ents - guess_ents)
            self.ents_fp += len(guess_ents - gold_ents)

    def skip_token(self, i, token, gold):
        return gold.labels[i] in ('P', 'punct')
* Add scorer script 2015-03-11 04:07:03 +03:00			`from __future__ import division`

* Print parse if verbose in scorer 2015-04-05 23:29:30 +03:00
* Add scorer script 2015-03-11 04:07:03 +03:00			`class Scorer(object):`
			`def __init__(self, eval_punct=False):`
			`self.heads_corr = 0`
			`self.labels_corr = 0`
			`self.tags_corr = 0`
			`self.ents_tp = 0`
			`self.ents_fp = 0`
			`self.ents_fn = 0`
			`self.total = 1e-100`
* Adjust scorer to account for tokenization mistakes 2015-03-24 06:26:37 +03:00			`self.mistokened = 0`
			`self.n_tokens = 0`
* Add scorer script 2015-03-11 04:07:03 +03:00			`self.eval_punct = eval_punct`

			`@property`
			`def tags_acc(self):`
* Adjust scorer to account for tokenization mistakes 2015-03-24 06:26:37 +03:00			`return ((self.tags_corr - self.mistokened) / (self.n_tokens - self.mistokened)) * 100`
* Add scorer script 2015-03-11 04:07:03 +03:00
			`@property`
			`def uas(self):`
			`return (self.heads_corr / self.total) * 100`

			`@property`
			`def las(self):`
			`return (self.labels_corr / self.total) * 100`

			`@property`
			`def ents_p(self):`
			`return (self.ents_tp / (self.ents_tp + self.ents_fp + 1e-100)) * 100`

			`@property`
			`def ents_r(self):`
			`return (self.ents_tp / (self.ents_tp + self.ents_fn + 1e-100)) * 100`
Remove trailing whitespace 2015-04-19 11:31:31 +03:00
* Add scorer script 2015-03-11 04:07:03 +03:00			`@property`
			`def ents_f(self):`
			`return (2 * self.ents_p * self.ents_r) / (self.ents_p + self.ents_r + 1e-100)`

			`def score(self, tokens, gold, verbose=False):`
			`assert len(tokens) == len(gold)`

			`for i, token in enumerate(tokens):`
* Adjust scorer to account for tokenization mistakes 2015-03-24 06:26:37 +03:00			`if gold.orths.get(token.idx) != token.orth_:`
			`self.mistokened += 1`
* Add scorer script 2015-03-11 04:07:03 +03:00			`if not self.skip_token(i, token, gold):`
			`self.total += 1`
* Print parse if verbose in scorer 2015-04-05 23:29:30 +03:00			`if verbose:`
* Tweak verbose output printing in scorer.py 2015-05-06 17:31:23 +03:00			`print token.orth_, token.dep_, token.head.orth_, token.head.i == gold.heads[i]`
* Add scorer script 2015-03-11 04:07:03 +03:00			`if token.head.i == gold.heads[i]:`
			`self.heads_corr += 1`
			`self.labels_corr += token.dep_ == gold.labels[i]`
* Adjust scorer to account for tokenization mistakes 2015-03-24 06:26:37 +03:00			`self.tags_corr += token.tag_ == gold.tags[i]`
			`self.n_tokens += 1`
* Add scorer script 2015-03-11 04:07:03 +03:00			`gold_ents = set((start, end, label) for (start, end, label) in gold.ents)`
* Fix NER scoring 2015-03-26 05:20:00 +03:00			`guess_ents = set((e.start, e.end, e.label_) for e in tokens.ents)`
* Fix verbose printing for scorer 2015-03-11 09:24:22 +03:00			`if verbose and gold_ents:`
* Add scorer script 2015-03-11 04:07:03 +03:00			`for start, end, label in guess_ents:`
			`mark = 'T' if (start, end, label) in gold_ents else 'F'`
			`ent_str = ' '.join(tokens[i].orth_ for i in range(start, end))`
			`print mark, label, ent_str`
			`for start, end, label in gold_ents:`
			`if (start, end, label) not in guess_ents:`
			`ent_str = ' '.join(tokens[i].orth_ for i in range(start, end))`
			`print 'M', label, ent_str`
			`print`
			`if gold_ents:`
			`self.ents_tp += len(gold_ents.intersection(guess_ents))`
			`self.ents_fn += len(gold_ents - guess_ents)`
			`self.ents_fp += len(guess_ents - gold_ents)`

			`def skip_token(self, i, token, gold):`
* Print parse if verbose in scorer 2015-04-05 23:29:30 +03:00			`return gold.labels[i] in ('P', 'punct')`