spaCy/spacy/__init__.py

import pathlib

from .util import set_lang_class, get_lang_class

from . import en
from . import de
from . import zh


try:
    basestring
except NameError:
    basestring = str


set_lang_class(en.English.lang, en.English)
set_lang_class(de.German.lang, de.German)
set_lang_class(zh.Chinese.lang, zh.Chinese)


def blank(name, vocab=None, tokenizer=None, parser=None, tagger=None, entity=None,
         matcher=None, serializer=None, vectors=None, pipeline=None):
    target_name, target_version = util.split_data_name(name)
    cls = get_lang_class(target_name)
    return cls(
        path=None,
        vectors=vectors,
        vocab=vocab,
        tokenizer=tokenizer,
        tagger=tagger,
        parser=parser,
        entity=entity,
        matcher=matcher,
        pipeline=pipeline,
        serializer=serializer)


def load(name, vocab=True, tokenizer=True, parser=True, tagger=True, entity=True,
         matcher=True, serializer=True, vectors=True, pipeline=True, via=None):
    if via is None:
        via = util.get_data_path()

    target_name, target_version = util.split_data_name(name)
    path = util.match_best_version(target_name, target_version, via)

    if isinstance(vectors, basestring):
        vectors = util.match_best_version(vectors, None, via)
    
    cls = get_lang_class(target_name)
    return cls(
        path,
        vectors=vectors,
        vocab=vocab,
        tokenizer=tokenizer,
        tagger=tagger,
        parser=parser,
        entity=entity,
        matcher=matcher,
        pipeline=pipeline,
        serializer=serializer)
Mostly finished loading refactoring. Design is in place, but doesn't work yet. 2016-09-24 16:42:01 +03:00			`import pathlib`

			`from .util import set_lang_class, get_lang_class`
refactored data_dir->via, add zip_safe, add spacy.load() 2016-01-15 20:01:02 +03:00
avoid polluting spacy namespace with lang classes 2016-04-12 17:31:16 +03:00			`from . import en`
			`from . import de`
* Register Chinese language in spacy/__init__.py 2016-04-24 19:45:16 +03:00			`from . import zh`
refactored data_dir->via, add zip_safe, add spacy.load() 2016-01-15 20:01:02 +03:00
first idea for supporting multiple langs in download script 2016-03-24 13:19:43 +03:00
Python 3 compatible basestring 2016-09-24 23:09:21 +03:00			`try:`
Whitespace 2016-09-24 23:17:01 +03:00			`basestring`
Python 3 compatible basestring 2016-09-24 23:09:21 +03:00			`except NameError:`
Whitespace 2016-09-24 23:17:01 +03:00			`basestring = str`
Python 3 compatible basestring 2016-09-24 23:09:21 +03:00


avoid polluting spacy namespace with lang classes 2016-04-12 17:31:16 +03:00			`set_lang_class(en.English.lang, en.English)`
			`set_lang_class(de.German.lang, de.German)`
* Register Chinese language in spacy/__init__.py 2016-04-24 19:45:16 +03:00			`set_lang_class(zh.Chinese.lang, zh.Chinese)`
add lang registration facility 2016-03-25 20:54:45 +03:00

Add spacy.blank() method, that doesn't load data. Don't try to load data if path is falsey 2016-09-26 12:07:46 +03:00			`def blank(name, vocab=None, tokenizer=None, parser=None, tagger=None, entity=None,`
			`matcher=None, serializer=None, vectors=None, pipeline=None):`
			`target_name, target_version = util.split_data_name(name)`
			`cls = get_lang_class(target_name)`
			`return cls(`
Refactor the pipeline classes to make them more consistent, and remove the redundant blank() constructor. 2016-10-16 22:34:57 +03:00			`path=None,`
Add spacy.blank() method, that doesn't load data. Don't try to load data if path is falsey 2016-09-26 12:07:46 +03:00			`vectors=vectors,`
			`vocab=vocab,`
			`tokenizer=tokenizer,`
			`tagger=tagger,`
			`parser=parser,`
			`entity=entity,`
			`matcher=matcher,`
			`pipeline=pipeline,`
			`serializer=serializer)`


Finish refactoring data loading 2016-09-24 21:26:17 +03:00			`def load(name, vocab=True, tokenizer=True, parser=True, tagger=True, entity=True,`
Python 3 compatible basestring 2016-09-24 23:09:21 +03:00			`matcher=True, serializer=True, vectors=True, pipeline=True, via=None):`
Finish refactoring data loading 2016-09-24 21:26:17 +03:00			`if via is None:`
			`via = util.get_data_path()`
Mostly finished loading refactoring. Design is in place, but doesn't work yet. 2016-09-24 16:42:01 +03:00
Finish refactoring data loading 2016-09-24 21:26:17 +03:00			`target_name, target_version = util.split_data_name(name)`
			`path = util.match_best_version(target_name, target_version, via)`
Mostly finished loading refactoring. Design is in place, but doesn't work yet. 2016-09-24 16:42:01 +03:00
Finish refactoring data loading 2016-09-24 21:26:17 +03:00			`if isinstance(vectors, basestring):`
Python 3 compatible basestring 2016-09-24 23:09:21 +03:00			`vectors = util.match_best_version(vectors, None, via)`
Finish refactoring data loading 2016-09-24 21:26:17 +03:00
			`cls = get_lang_class(target_name)`
* Add missing keyword arguments to spacy.load() function 2016-04-17 22:31:50 +03:00			`return cls(`
Finish refactoring data loading 2016-09-24 21:26:17 +03:00			`path,`
Mostly finished loading refactoring. Design is in place, but doesn't work yet. 2016-09-24 16:42:01 +03:00			`vectors=vectors,`
* Add missing keyword arguments to spacy.load() function 2016-04-17 22:31:50 +03:00			`vocab=vocab,`
			`tokenizer=tokenizer,`
			`tagger=tagger,`
			`parser=parser,`
			`entity=entity,`
			`matcher=matcher,`
Python 3 compatible basestring 2016-09-24 23:09:21 +03:00			`pipeline=pipeline,`
* Add missing keyword arguments to spacy.load() function 2016-04-17 22:31:50 +03:00			`serializer=serializer)`