From b6b1e1aa1296f7f8a3fb0a669c290ef12853073d Mon Sep 17 00:00:00 2001 From: Matthew Honnibal Date: Thu, 27 Aug 2015 10:26:02 +0200 Subject: [PATCH] * Add link for Finnish model --- bin/init_model.py | 9 ++++++++- 1 file changed, 8 insertions(+), 1 deletion(-) diff --git a/bin/init_model.py b/bin/init_model.py index 0badf71fc..e81d668aa 100644 --- a/bin/init_model.py +++ b/bin/init_model.py @@ -38,6 +38,7 @@ from spacy.parts_of_speech import NOUN, VERB, ADJ import spacy.en import spacy.de +import spacy.fi @@ -184,7 +185,8 @@ def setup_vocab(get_lex_attr, src_dir, dst_dir): def main(lang_id, lang_data_dir, corpora_dir, model_dir): languages = { 'en': spacy.en.English.default_lex_attrs(), - 'de': spacy.de.Deutsch.default_lex_attrs() + 'de': spacy.de.Deutsch.default_lex_attrs(), + 'fi': spacy.fi.Finnish.default_lex_attrs() } model_dir = Path(model_dir) @@ -203,6 +205,11 @@ def main(lang_id, lang_data_dir, corpora_dir, model_dir): if (lang_data_dir / 'gazetteer.json').exists(): copyfile(str(lang_data_dir / 'gazetteer.json'), str(model_dir / 'vocab' / 'gazetteer.json')) + + if (lang_data_dir / 'lemma_rules.json').exists(): + copyfile(str(lang_data_dir / 'lemma_rules.json'), + str(model_dir / 'vocab' / 'lemma_rules.json')) + if not (model_dir / 'wordnet').exists() and (corpora_dir / 'wordnet').exists(): copytree(str(corpora_dir / 'wordnet' / 'dict'), str(model_dir / 'wordnet'))