Merge branch 'master' of https://github.com/explosion/spaCy

2025-12-23 10:03:15 +03:00 · 2018-08-14 02:32:01 +02:00 · 2018-08-14 02:32:01 +02:00 · 13fa550b36
commit 13fa550b36
parent 85000ea13b fe94e696d3
15 changed files with 3223 additions and 2882 deletions
--- a/.github/contributors/wojtuch.md
+++ b/.github/contributors/wojtuch.md
@ -0,0 +1,106 @@
+# spaCy contributor agreement
+
+This spaCy Contributor Agreement (**"SCA"**) is based on the
+[Oracle Contributor Agreement](http://www.oracle.com/technetwork/oca-405177.pdf).
+The SCA applies to any contribution that you make to any product or project
+managed by us (the **"project"**), and sets out the intellectual property rights
+you grant to us in the contributed materials. The term **"us"** shall mean
+[ExplosionAI UG (haftungsbeschränkt)](https://explosion.ai/legal). The term
+**"you"** shall mean the person or entity identified below.
+
+If you agree to be bound by these terms, fill in the information requested
+below and include the filled-in version with your first pull request, under the
+folder [`.github/contributors/`](/.github/contributors/). The name of the file
+should be your GitHub username, with the extension `.md`. For example, the user
+example_user would create the file `.github/contributors/example_user.md`.
+
+Read this agreement carefully before signing. These terms and conditions
+constitute a binding legal agreement.
+
+## Contributor Agreement
+
+1. The term "contribution" or "contributed materials" means any source code,
+object code, patch, tool, sample, graphic, specification, manual,
+documentation, or any other material posted or submitted by you to the project.
+
+2. With respect to any worldwide copyrights, or copyright applications and
+registrations, in your contribution:
+
+    * you hereby assign to us joint ownership, and to the extent that such
+    assignment is or becomes invalid, ineffective or unenforceable, you hereby
+    grant to us a perpetual, irrevocable, non-exclusive, worldwide, no-charge,
+    royalty-free, unrestricted license to exercise all rights under those
+    copyrights. This includes, at our option, the right to sublicense these same
+    rights to third parties through multiple levels of sublicensees or other
+    licensing arrangements;
+
+    * you agree that each of us can do all things in relation to your
+    contribution as if each of us were the sole owners, and if one of us makes
+    a derivative work of your contribution, the one who makes the derivative
+    work (or has it made will be the sole owner of that derivative work;
+
+    * you agree that you will not assert any moral rights in your contribution
+    against us, our licensees or transferees;
+
+    * you agree that we may register a copyright in your contribution and
+    exercise all ownership rights associated with it; and
+
+    * you agree that neither of us has any duty to consult with, obtain the
+    consent of, pay or render an accounting to the other for any use or
+    distribution of your contribution.
+
+3. With respect to any patents you own, or that you can license without payment
+to any third party, you hereby grant to us a perpetual, irrevocable,
+non-exclusive, worldwide, no-charge, royalty-free license to:
+
+    * make, have made, use, sell, offer to sell, import, and otherwise transfer
+    your contribution in whole or in part, alone or in combination with or
+    included in any product, work or materials arising out of the project to
+    which your contribution was submitted, and
+
+    * at our option, to sublicense these same rights to third parties through
+    multiple levels of sublicensees or other licensing arrangements.
+
+4. Except as set out above, you keep all right, title, and interest in your
+contribution. The rights that you grant to us under these terms are effective
+on the date you first submitted a contribution to us, even if your submission
+took place before the date you sign these terms.
+
+5. You covenant, represent, warrant and agree that:
+
+    * Each contribution that you submit is and shall be an original work of
+    authorship and you can legally grant the rights set out in this SCA;
+
+    * to the best of your knowledge, each contribution will not violate any
+    third party's copyrights, trademarks, patents, or other intellectual
+    property rights; and
+
+    * each contribution shall be in compliance with U.S. export control laws and
+    other applicable export and import laws. You agree to notify us if you
+    become aware of any circumstance which would make any of the foregoing
+    representations inaccurate in any respect. We may publicly disclose your
+    participation in the project, including the fact that you have signed the SCA.
+
+6. This SCA is governed by the laws of the State of California and applicable
+U.S. Federal law. Any choice of law rules will not apply.
+
+7. Please place an “x” on one of the applicable statement below. Please do NOT
+mark both statements:
+
+    * [x] I am signing on behalf of myself as an individual and no other person
+    or entity, including my employer, has or will have rights with respect to my
+    contributions.
+
+    * [ ] I am signing on behalf of my employer or a legal entity and I have the
+    actual authority to contractually bind that entity.
+
+## Contributor Details
+
+| Field                          | Entry                |
+|------------------------------- | -------------------- |
+| Name                           | Wojciech Lukasiewicz |
+| Company name (if applicable)   |                      |
+| Title or role (if applicable)  |                      |
+| Date                           | 13.08.2018           |
+| GitHub username                | wojtuch              |
+| Website (optional)             |                      |
--- a/spacy/lang/el/init.py
+++ b/spacy/lang/el/init.py
@ -7,6 +7,8 @@ from .tag_map_general import TAG_MAP
 from .stop_words import STOP_WORDS
 from .lex_attrs import LEX_ATTRS
 from .lemmatizer import LEMMA_RULES, LEMMA_INDEX, LEMMA_EXC
+from .lemmatizer.lemmatizer import GreekLemmatizer
+from .syntax_iterators import SYNTAX_ITERATORS
 from .punctuation import TOKENIZER_PREFIXES, TOKENIZER_SUFFIXES, TOKENIZER_INFIXES
 from ..tokenizer_exceptions import BASE_EXCEPTIONS
 from .norm_exceptions import NORM_EXCEPTIONS
@ -20,15 +22,23 @@ class GreekDefaults(Language.Defaults):
    lex_attr_getters = dict(Language.Defaults.lex_attr_getters)
    lex_attr_getters.update(LEX_ATTRS)
    lex_attr_getters[LANG] = lambda text: 'el'  # ISO code
-    lex_attr_getters[NORM] = add_lookups(Language.Defaults.lex_attr_getters[NORM], BASE_NORMS, NORM_EXCEPTIONS)
+    lex_attr_getters[NORM] = add_lookups(
+        Language.Defaults.lex_attr_getters[NORM], BASE_NORMS, NORM_EXCEPTIONS)
    tokenizer_exceptions = update_exc(BASE_EXCEPTIONS, TOKENIZER_EXCEPTIONS)
    stop_words = STOP_WORDS
-    lemma_rules = LEMMA_RULES
-    lemma_index = LEMMA_INDEX
    tag_map = TAG_MAP
    prefixes = TOKENIZER_PREFIXES
    suffixes = TOKENIZER_SUFFIXES
    infixes = TOKENIZER_INFIXES
+    syntax_iterators = SYNTAX_ITERATORS
+
+    @classmethod
+    def create_lemmatizer(cls, nlp=None):
+        lemma_rules = LEMMA_RULES
+        lemma_index = LEMMA_INDEX
+        lemma_exc = LEMMA_EXC
+        return GreekLemmatizer(index=lemma_index, exceptions=lemma_exc,
+                               rules=lemma_rules)


 class Greek(Language):
@ -39,4 +49,3 @@ class Greek(Language):

 # set default export – this allows the language class to be lazy-loaded
 __all__ = ['Greek']
-
--- a/spacy/lang/el/examples.py
+++ b/spacy/lang/el/examples.py
@ -9,11 +9,20 @@ Example sentences to test spaCy and its language models.
 """

 sentences = [
-    "Η άνιση κατανομή του πλούτου και του εισοδήματος, η οποία έχει λάβει τρομερές διαστάσεις, δεν δείχνει τάσεις βελτίωσης.",
-    "Ο στόχος της σύντομης αυτής έκθεσης είναι να συνοψίσει τα κυριότερα συμπεράσματα των επισκοπήσεων κάθε μιας χώρας.",
-    "Μέχρι αργά χθες το βράδυ ο πλοιοκτήτης παρέμενε έξω από το γραφείο του γενικού γραμματέα του υπουργείου, ενώ είχε μόνον τηλεφωνική επικοινωνία με τον υπουργό.",
-    "Σύμφωνα με καλά ενημερωμένη πηγή, από την επεξεργασία του προέκυψε ότι οι δράστες της επίθεσης ήταν δύο, καθώς και ότι προσέγγισαν και αποχώρησαν από το σημείο με μοτοσικλέτα.",
+    '''Η άνιση κατανομή του πλούτου και του εισοδήματος, η οποία έχει λάβει
+    τρομερές διαστάσεις, δεν δείχνει τάσεις βελτίωσης.''',
+    '''Ο στόχος της σύντομης αυτής έκθεσης είναι να συνοψίσει τα κυριότερα
+    συμπεράσματα των επισκοπήσεων κάθε μιας χώρας.''',
+    '''Μέχρι αργά χθες το βράδυ ο πλοιοκτήτης παρέμενε έξω από το γραφείο του
+    γενικού γραμματέα του υπουργείου, ενώ είχε μόνον τηλεφωνική επικοινωνία με
+    τον υπουργό.''',
+    '''Σύμφωνα με καλά ενημερωμένη πηγή, από την επεξεργασία του προέκυψε ότι
+    οι δράστες της επίθεσης ήταν δύο, καθώς και ότι προσέγγισαν και αποχώρησαν
+    από το σημείο με μοτοσικλέτα.''',
    "Η υποδομή καταλυμάτων στην Ελλάδα είναι πλήρης και ανανεώνεται συνεχώς.",
-    "Το επείγον ταχυδρομείο (ήτοι το παραδοτέο εντός 48 ωρών το πολύ) μπορεί να μεταφέρεται αεροπορικώς μόνον εφόσον εφαρμόζονται οι κανόνες ασφαλείας.",
-    "Στις ορεινές περιοχές του νησιού οι χιονοπτώσεις και οι παγετοί είναι περιορισμένοι ενώ στις παραθαλάσσιες περιοχές σημειώνονται σπανίως."
+    '''Το επείγον ταχυδρομείο (ήτοι το παραδοτέο εντός 48 ωρών το πολύ) μπορεί
+    να μεταφέρεται αεροπορικώς μόνον εφόσον εφαρμόζονται οι κανόνες
+    ασφαλείας''',
+    ''''Στις ορεινές περιοχές του νησιού οι χιονοπτώσεις και οι παγετοί είναι
+    περιορισμένοι ενώ στις παραθαλάσσιες περιοχές σημειώνονται σπανίως.'''
 ]
--- a/spacy/lang/el/lemmatizer/_adjectives_irreg.py
+++ b/spacy/lang/el/lemmatizer/_adjectives_irreg.py
@ -5,19 +5,29 @@ from __future__ import unicode_literals
 ADJECTIVES_IRREG = {
    "χειρότερος": ("κακός",),
    "χειρότερη": ("κακός",),
+    "χειρότερης": ("κακός",),
    "χειρότερο": ("κακός",),
+    "χειρότεροι": ("κακός",),
+    "χειρότερων": ("κακός",),
+    "χειρότερου": ("κακός",),
    "βέλτιστος": ("καλός",),
    "βέλτιστη": ("καλός",),
+    "βέλτιστης": ("καλός",),
    "βέλτιστο": ("καλός",),
    "βέλτιστοι": ("καλός",),
    "βέλτιστων": ("καλός",),
+    "βέλτιστου": ("καλός",),
    "ελάχιστος": ("λίγος",),
    "ελάχιστα": ("λίγος",),
    "ελάχιστοι": ("λίγος",),
    "ελάχιστων": ("λίγος",),
    "ελάχιστη": ("λίγος",),
+    "ελάχιστης": ("λίγος",),
    "ελάχιστο": ("λίγος",),
+    "ελάχιστου": ("λίγος",),
    "πλείστος": ("πολύς",),
+    "πλείστου": ("πολύς",),
+    "πλείστων": ("πολύς",),
    "πολλή": ("πολύ",),
    "πολύς": ("πολύ",),
    "πολλύ": ("πολύ",),
--- a/spacy/lang/el/lemmatizer/_lemma_rules.py
+++ b/spacy/lang/el/lemmatizer/_lemma_rules.py
@ -3,94 +3,148 @@ from __future__ import unicode_literals


 ADJECTIVE_RULES = [
-    ["οί","ός"], # καρδιακοί
-    ["ές","ός"], # επιφανειακές
-    ["ές","ος"], # καρδιακές
-    ["ές","ύς"], # πολλές
-    ["οι","ος"],
-    ["αία","ος"], # ωραία
-    ["ωδη","ες"], # δασώδη
-    ["ώδη","ες"],
-    ["ότερη","ός"],
-    ["ότερος","ός"],
-    ["ότεροι", "ός"],
-    ["ότερων","ός"],
-    ["ότερες", "ός"],
+    ["οί", "ός"],  # καρδιακοί -> καρδιακός. Ονομαστική πλ. σε -ός. (m)
+    ["ών", "ός"],  # καρδιακών -> καρδιακός. Γενική πλ. σε -ός. (m)
+    ["ού", "ός"],  # καρδιακού -> καρδιακός. Γενική εν. σε -ός. (m)
+    ["ή", "ός"],  # καρδιακή -> καρδιακός. Ονομαστική εν. σε -ή. (f)
+    ["ής", "ός"],  # καρδιακής -> καρδιακός. Γενική εν. σε -ή. (f)
+    ["ές", "ός"],  # καρδιακές -> καρδιακός. Ονομαστική πλ. σε -ή. (f)
+    ["οι", "ος"],  # ωραίοι -> ωραίος. Ονομαστική πλ. σε -ος. (m)
+    ["ων", "ος"],  # ωραίων -> ωραίος. Γενική πλ. σε -ος. (m)
+    ["ου", "ος"],  # ωραίου -> ωραίος. Γενική εν. σε -ος. (m)
+    ["ο", "ος"],  # ωραίο -> ωραίος. Ονομαστική εν. σε -ο. (n)
+    ["α", "ος"],  # χυδαία -> χυδαίος. Ονομαστική πλ. σε -ο. (n)
+    ["ώδη", "ώδες"],  # δασώδη -> δασώδες. Ονομαστική πλ. σε -ώδες. (n)
+    ["ύτερη", "ός"],  # καλύτερη -> καλός. Συγκριτικός βαθμός σε -ή. (f)
+    ["ύτερης", "ός"],  # καλύτερης -> καλός. (f)
+    ["ύτερων", "ός"],  # καλύτερων -> καλός. (f)
+    ["ύτερος", "ός"],  # καλύτερος -> καλός. Συγκριτικός βαθμός σε -ός. (m)
+    ["ύτερου", "ός"],  # καλύτερου -> καλός. (m)
 ]

-
+# masculine -> m, feminine -> f, neuter -> n.
 NOUN_RULES = [
-    ["ιά","ί"], # παιδιά
-    ["ια","ι"], # ποτήρια
-    ["ες","α"], # κεραμίδες
-    ["ές","ά"],
-    ["ές","ά"],
-    ["ες","α"], # εσπερινές
-    ["ες","η"], # ζάχαρη
-    ["ές","ή"], # φυλακές
-    ["ές","ής"], # καθηγητής
-    ["α","ο"], # πρόβατα
-    ["α","α"], # ζήτημα
-    ["ατα","α"], # στόματα
-    ["άτα","άτα"], # ντομάτα
-    ["άτες","άτα"], # πατάτες
-    ["ία","ία"],
-    ["ιά","ιά"],
-    ["οί","ός"], # υπουργοί
-    ["ίας","ία"], # δικτατορίας, δυσωδείας, τρομοκρατίας
-    ["άτων","ατα"], # δικαιωμάτων
-    ["ώπων","ωπος"], # ανθρώπων
+    ["ιού", "ί"],  # παιδιού -> παιδί. Γενική ενικού σε -ί. (n)
+    ["ιά", "ί"],  # παιδιά -> παιδί. Ονομαστική πληθυντικού σε -ί. (n)
+    ["ιών", "ί"],  # παιδιών -> παιδί. Γενική πληθυντικού σε -ί. (n)
+    ["ηριού", "ήρι"],  # ποτηριού -> ποτήρι. Γενική ενικού σε -ι. (n)
+    ["ια", "ι"],  # ποτήρια -> ποτήρι. Ονομαστική πληθυντικού σε -ι. (n)
+    ["ηριών", "ήρι"],  # ποτηριών -> ποτήρι. Γενική πληθυντικού σε -ι. (n)
+    ["ας", "α"],  # κεραμίδας -> κεραμίδα. Γενική ενικού σε -α. (f)
+    ["ες", "α"],  # κεραμίδες -> κεραμίδα. Ονομαστική πληθυντικού σε -α. (f)
+    ["ων", "α"],  # κεραμίδων -> κεραμίδα. Γενική πληθυντικού σε -α. (f)
+    ["άς", "ά"],  # βελανιδιάς -> βελανιδιά. Γενική ενικού σε -ά. (f)
+    ["ές", "ά"],  # βελανιδιές -> βελανιδιά. Ονομαστική πληθυντικού σε -ά. (f)
+    ["ών", "ά"],  # βελανιδιών -> βελανιδιά. Γενική πληθυντικού σε -ά. (f)
+    ["ής", "ή"],  # φυλακής -> φυλακή. Γενική ενικού σε -ή. (f)
+    ["ές", "ή"],  # φυλακές -> φυλακή. Ονομαστική πληθυντικού σε -ή. (f)
+    ["ών", "ή"],  # φυλακών -> φυλακή. Γενική πληθυντικού σε -ή. (f)
+    ["ές", "ής"],  # καθηγητές -> καθηγητής. Ονομαστική πληθυντικού σε -ής. (m)
+    ["ών", "ής"],  # καθηγητών -> καθηγητής. Γενική πληθυντικού σε -ής. (m)
+    ["ου", "ο"],  # προβάτου -> πρόβατο. Γενική ενικού σε -ο. (n)
+    ["α", "ο"],  # πρόβατα -> πρόβατο. Ονομαστική πληθυντικού σε -o. (n)
+    ["ων", "ο"],  # προβάτων -> πρόβατο. Γενική πληθυντικού σε -ο. (n)
+    ["ητήματος", "ήτημα"],  # ζητήματος -> ζήτημα. Γενική ενικού σε -α (n)
+    # ζητήματα -> ζήτημα. Ονομαστική πληθυντικού σε -α. (n)
+    ["ητήματα", "ήτημα"],
+    # ζητημάτων -> ζήτημα. Γενική πληθυντικού σε -α. (n)
+    ["ητημάτων", "ήτημα"],
+    ["τος", ""],  # στόματος -> στόμα. Γενική ενικού σε -α. (n)
+    ["τα", "α"],  # στόματα -> στόμα. Ονομαστική πληθυντικού σε -α. (n)
+    ["ομάτων", "όμα"],  # στομάτων -> στόμα. Γενική πληθυντικού σε -α. (n)
+    ["ού", "ός"],  # υπουργού -> υπουργός. Γενική ενικού σε -ος. (m)
+    ["οί", "ός"],  # υπουργοί -> υπουργούς. Ονομαστική πληυθυντικού σε -ος. (m)
+    ["ών", "ός"],  # υπουργών -> υπουργός. Γενική πληθυντικού σε -ος. (m)
+    ["ς", ""],  # δικτατορίας -> δικτατορία. Γενική ενικού σε -ας. (f)
+    # δικτατορίες -> δικτατορία. Ονομαστική πληθυντικού σε -ας. (f)
+    ["ες", "α"],
+    ["ιών", "ία"],  # δικτατοριών -> δικτατορία. Γενική πληθυντικού σε -ας. (f)
+    ["α", "ας"],  # βασιλιά -> βασιλιάς. Γενική ενικού σε -άς. (m)
+    ["δων", ""],  # βασιλιάδων -> βασιλιά. Γενική πληθυντικού σε -άς. (m)
 ]


 VERB_RULES = [
-    ["εις", "ω"],
-    ["εις","ώ"],
+    ["εις", "ω"],  # πάρεις -> πάρω. Ενεστώτας ρήματος σε -ω.
    ["ει", "ω"],
-    ["ει","ώ"],
    ["ουμε", "ω"],
-    ["ουμε","ώ"],
-    ["ούμε","ώ"], # θεώρησα
-    ["ούνε","ώ"], # 
    ["ετε", "ω"],
-    ["ετε","ώ"],
+    ["ουνε", "ω"],
    ["ουν", "ω"],
-    ["ουν","ώ"],
-    ["είς","ώ"],
-    ["εί","ώ"],
+    ["είς", "ώ"],  # πονείς -> πονώ. Ενεστώτας ρήματος σε -ώ vol1.
+    ["εί", "ώ"],  # οι κανόνες που λείπουν καλύπτονται από το αγαπώ.
    ["ούν", "ώ"],
-    ["εσαι","ομαι"], #αισθάνεσαι
-    ["εσαι","όμαι"],
-    ["έσαι","ομαι"],
-    ["έσαι","όμαι"],
+    ["εσαι", "ομαι"],  # αισθάνεσαι -> αισθάνομαι. Ενεστώτας ρήματος σε -ομαι.
    ["εται", "ομαι"],
-    ["εται","όμαι"],
-    ["έται","ομαι"],
-    ["έται","όμαι"],
-    ["όμαστε","όμαι"],
-    ["όμαστε","ομαι"],
-    ["έσθε","όμαι"],
-    ["εσθε","όμαι"],
-    ["άς","ώ"], # αγαπάς
+    ["ανόμαστε", "άνομαι"],
+    ["εστε", "ομαι"],
+    ["ονται", "ομαι"],
+    ["άς", "ώ"],  # αγαπάς -> αγαπάω (ή αγαπώ). Ενεστώτας ρήματος σε -ώ vol2.
    ["άει", "ώ"],
    ["άμε", "ώ"],
    ["άτε", "ώ"],
    ["άνε", "ώ"],
    ["άν", "ώ"],
-    ["άμε","ώ"],
-    ["άω","ώ"], # _verbs.py could contain any of the two
+    ["άω", "ώ"],
    ["ώ", "άω"],
-    ["όμουν", "ομαι"], # ζαλιζόμουν
-    ["όμουν", "όμαι"],
-    ["όμουν", "αμαι"], # κοιμόμουν
-    ["όμουν", "αμαι"],
-    ["ούσα", "ώ"], # ζητούσα -> ζητώ
+    # ζαλιζόμουν -> ζαλίζομαι. Παρατατικός ρήματος -ίζομαι.
+    ["ιζόμουν", "ίζομαι"],
+    ["ιζόσουν", "ίζομαι"],
+    ["ιζόταν", "ίζομαι"],
+    ["ιζόμασταν", "ίζομαι"],
+    ["ιζόσασταν", "ίζομαι"],
+    ["ονταν", "ομαι"],
+    ["όμουν", "άμαι"],  # κοιμόμουν -> κοιμάμαι. Παρατατικός ρήματος σε -άμαι.
+    ["όσουν", "άμαι"],
+    ["όταν", "άμαι"],
+    ["όμασταν", "άμαι"],
+    ["όσασταν", "άμαι"],
+    ["όντουσταν", "άμαι"],
+    ["ούσα", "ώ"],  # ζητούσα -> ζητώ. # Παρατατικός ρήματος σε -ώ.
    ["ούσες", "ώ"],
    ["ούσε", "ώ"],
    ["ούσαμε", "ώ"],
    ["ούσατε", "ώ"],
    ["ούσαν", "ώ"],
    ["ούσανε", "ώ"],
+    ["λαμε", "ζω"],  # βγάλαμε -> βγάζω. Αόριστος ρήματος σε -ω vol1.
+    ["λατε", "ζω"],
+    ["ήρα", "άρω"],  # πήρα -> πάρω. Αόριστος ρήματος σε -ω vol2.
+    ["ήρες", "άρω"],
+    ["ήρε", "άρω"],
+    ["ήραμε", "άρω"],
+    ["ήρατε", "άρω"],
+    ["ήρα", "άρω"],
+    ["ένησα", "ενώ"],  # φιλοξένησα -> φιλοξενώ. Αόριστος ρήματος σε -ώ vol1.
+    ["ένησες", "ενώ"],
+    ["ένησε", "ενώ"],
+    ["ενήσαμε", "ενώ"],
+    ["ένησατε", "ενώ"],
+    ["ένησαν", "ενώ"],
+    ["όνεσα", "ονώ"],  # πόνεσα -> πονώ. Αόριστος ρήματος σε -ώ vol2.
+    ["όνεσες", "ονώ"],
+    ["όνεσε", "ονώ"],
+    ["έσαμε", "ώ"],
+    ["έσατε", "ώ"],
+    ["ισα", "ομαι"],  # κάθισα -> κάθομαι. Αόριστος ρήματος σε -ομαι.
+    ["ισες", "ομαι"],
+    ["ισε", "ομαι"],
+    ["αθίσαμε", "άθομαι"],
+    ["αθίσατε", "άθομαι"],
+    ["ισαν", "ομαι"],
+    ["άπα", "απώ"],  # αγάπα -> αγαπώ. Προστακτική ρήματος σε -άω/ώ vol1.
+    ["ά", "ώ"],  # τιμά -> τιμώ. Προστακτική ρήματος σε άω/ώ vol2.
+    ["οντας", "ω"],  # βλέποντας -> βλέπω. Μετοχή.
+    ["ξω", "ζω"],  # παίξω -> παίζω. Μέλλοντας σε -ω.
+    ["ξεις", "ζω"],
+    ["ξουμε", "ζω"],
+    ["ξετε", "ζω"],
+    ["ξουν", "ζω"],
+
+
+
+
+
 ]


--- a/spacy/lang/el/lemmatizer/_verbs_irreg.py
+++ b/spacy/lang/el/lemmatizer/_verbs_irreg.py
@ -21,6 +21,8 @@ VERBS_IRREG = {
     "είπατε": ("λέω",),
     "είπαν": ("λέω",),
     "είπανε": ("λέω",),
+     "πει": ("λέω"),
+     "πω": ("λέω"),
     "πάω": ("πηγαίνω",),
     "πάς": ("πηγαίνω",),
     "πας": ("πηγαίνω",),
@ -52,6 +54,7 @@ VERBS_IRREG = {
     "είχαμε": ("έχω",),
     "είχατε": ("έχω",),
     "είχαν": ("έχω",),
+     "είχανε": ("έχω",),
     "έπαιρνα": ("παίρνω",),
     "έπαιρνες": ("παίρνω",),
     "έπαιρνε": ("παίρνω",),
@ -72,6 +75,12 @@ VERBS_IRREG = {
     "έβλεπες": ("βλέπω",),
     "έβλεπε": ("βλέπω",),
     "έβλεπαν": ("βλέπω",),
+     "είδα": ("βλέπω",),
+     "είδες": ("βλέπω",),
+     "είδε": ("βλέπω",),
+     "είδαμε": ("βλέπω",),
+     "είδατε": ("βλέπω",),
+     "είδαν": ("βλέπω",),
     "έφερνα": ("φέρνω",),
     "έφερνες": ("φέρνω",),
     "έφερνε": ("φέρνω",),
@ -122,6 +131,10 @@ VERBS_IRREG = {
     "έπεφτες": ("πέφτω",),
     "έπεφτε": ("πέφτω",),
     "έπεφταν": ("πέφτω",),
+     "έπεσα": ("πέφτω",),
+     "έπεσες": ("πέφτω",),
+     "έπεσε": ("πέφτω",),
+     "έπεσαν": ("πέφτω",),
     "έστειλα": ("στέλνω",),
     "έστειλες": ("στέλνω",),
     "έστειλε": ("στέλνω",),
@ -142,6 +155,12 @@ VERBS_IRREG = {
     "έπινες": ("πίνω",),
     "έπινε": ("πίνω",),
     "έπιναν": ("πίνω",),
+     "ήπια": ("πίνω",),
+     "ήπιες": ("πίνω",),
+     "ήπιε": ("πίνω",),
+     "ήπιαμε": ("πίνω",),
+     "ήπιατε": ("πίνω",),
+     "ήπιαν": ("πίνω",),
     "ετύχα": ("τυχαίνω",),
     "ετύχες": ("τυχαίνω",),
     "ετύχε": ("τυχαίνω",),
@ -159,4 +178,23 @@ VERBS_IRREG = {
     "τρώγατε": ("τρώω",),
     "τρώγανε": ("τρώω",),
     "τρώγαν": ("τρώω",),
+     "πέρασα": ("περνώ",),
+     "πέρασες": ("περνώ",),
+     "πέρασε": ("περνώ",),
+     "πέρασαμε": ("περνώ",),
+     "πέρασατε": ("περνώ",),
+     "πέρασαν": ("περνώ",),
+     "έγδαρα": ("γδάρω",),
+     "έγδαρες": ("γδάρω",),
+     "έγδαρε": ("γδάρω",),
+     "έγδαραν": ("γδάρω",),
+     "έβγαλα": ("βγάλω",),
+     "έβγαλες": ("βγάλω",),
+     "έβγαλε": ("βγάλω",),
+     "έβγαλαν": ("βγάλω",),
+     "έφθασα": ("φτάνω",),
+     "έφθασες": ("φτάνω",),
+     "έφθασε": ("φτάνω",),
+     "έφθασαν": ("φτάνω",),
+
 }
--- a/spacy/lang/el/lemmatizer/lemmatizer.py
+++ b/spacy/lang/el/lemmatizer/lemmatizer.py
@ -0,0 +1,69 @@
+# coding: utf8
+from __future__ import unicode_literals
+
+from ....symbols import NOUN, VERB, ADJ, PUNCT
+
+'''
+Greek language lemmatizer applies the default rule based lemmatization
+procedure with some modifications for better Greek language support.
+
+The first modification is that it checks if the word for lemmatization is
+already a lemma and if yes, it just returns it.
+The second modification is about removing the base forms function which is
+not applicable for Greek language.
+'''
+
+
+class GreekLemmatizer(object):
+    @classmethod
+    def load(cls, path, index=None, exc=None, rules=None, lookup=None):
+        return cls(index, exc, rules, lookup)
+
+    def __init__(self, index=None, exceptions=None, rules=None, lookup=None):
+        self.index = index
+        self.exc = exceptions
+        self.rules = rules
+        self.lookup_table = lookup if lookup is not None else {}
+
+    def __call__(self, string, univ_pos, morphology=None):
+        if not self.rules:
+            return [self.lookup_table.get(string, string)]
+        if univ_pos in (NOUN, 'NOUN', 'noun'):
+            univ_pos = 'noun'
+        elif univ_pos in (VERB, 'VERB', 'verb'):
+            univ_pos = 'verb'
+        elif univ_pos in (ADJ, 'ADJ', 'adj'):
+            univ_pos = 'adj'
+        elif univ_pos in (PUNCT, 'PUNCT', 'punct'):
+            univ_pos = 'punct'
+        else:
+            return list(set([string.lower()]))
+        lemmas = lemmatize(string, self.index.get(univ_pos, {}),
+                           self.exc.get(univ_pos, {}),
+                           self.rules.get(univ_pos, []))
+        return lemmas
+
+
+def lemmatize(string, index, exceptions, rules):
+    string = string.lower()
+    forms = []
+    if (string in index):
+        forms.append(string)
+        return forms
+    forms.extend(exceptions.get(string, []))
+    oov_forms = []
+    if not forms:
+        for old, new in rules:
+            if string.endswith(old):
+                form = string[:len(string) - len(old)] + new
+                if not form:
+                    pass
+                elif form in index or not form.isalpha():
+                    forms.append(form)
+                else:
+                    oov_forms.append(form)
+    if not forms:
+        forms.extend(oov_forms)
+    if not forms:
+        forms.append(string)
+    return list(set(forms))
--- a/spacy/lang/el/lex_attrs.py
+++ b/spacy/lang/el/lex_attrs.py
@ -4,14 +4,20 @@ from __future__ import unicode_literals

 from ...attrs import LIKE_NUM

-_num_words = ['μηδέν', 'ένας', 'δυο', 'δυό', 'τρεις', 'τέσσερις', 'πέντε', 'έξι', 'εφτά', 'επτά', 'οκτώ', 'οχτώ',
-              'εννιά', 'εννέα', 'δέκα', 'έντεκα', 'ένδεκα', 'δώδεκα', 'δεκατρείς', 'δεκατέσσερις', 'δεκαπέντε',
-              'δεκαέξι', 'δεκαεπτά', 'δεκαοχτώ', 'δεκαεννέα', 'δεκαεννεα', 'είκοσι', 'τριάντα', 'σαράντα', 'πενήντα',
-              'εξήντα', 'εβδομήντα', 'ογδόντα', 'ενενήντα', 'εκατό', 'διακόσιοι', 'διακόσοι', 'τριακόσιοι', 'τριακόσοι',
-              'τετρακόσιοι', 'τετρακόσοι', 'πεντακόσιοι', 'πεντακόσοι', 'εξακόσιοι', 'εξακόσοι', 'εφτακόσιοι',
-              'εφτακόσοι', 'επτακόσιοι', 'επτακόσοι', 'οχτακόσιοι', 'οχτακόσοι', 'οκτακόσιοι', 'οκτακόσοι',
-              'εννιακόσιοι', 'χίλιοι', 'χιλιάδα', 'εκατομμύριο', 'δισεκατομμύριο', 'τρισεκατομμύριο', 'τετράκις',
-              'πεντάκις', 'εξάκις', 'επτάκις', 'οκτάκις', 'εννεάκις', 'ένα', 'δύο', 'τρία', 'τέσσερα', 'δις', 'χιλιάδες']
+_num_words = ['μηδέν', 'ένας', 'δυο', 'δυό', 'τρεις', 'τέσσερις', 'πέντε',
+              'έξι', 'εφτά', 'επτά', 'οκτώ', 'οχτώ',
+              'εννιά', 'εννέα', 'δέκα', 'έντεκα', 'ένδεκα', 'δώδεκα',
+              'δεκατρείς', 'δεκατέσσερις', 'δεκαπέντε', 'δεκαέξι', 'δεκαεπτά',
+              'δεκαοχτώ', 'δεκαεννέα', 'δεκαεννεα', 'είκοσι', 'τριάντα',
+              'σαράντα', 'πενήντα', 'εξήντα', 'εβδομήντα', 'ογδόντα',
+              'ενενήντα', 'εκατό', 'διακόσιοι', 'διακόσοι', 'τριακόσιοι',
+              'τριακόσοι', 'τετρακόσιοι', 'τετρακόσοι', 'πεντακόσιοι',
+              'πεντακόσοι', 'εξακόσιοι', 'εξακόσοι', 'εφτακόσιοι', 'εφτακόσοι',
+              'επτακόσιοι', 'επτακόσοι', 'οχτακόσιοι', 'οχτακόσοι',
+              'οκτακόσιοι', 'οκτακόσοι', 'εννιακόσιοι', 'χίλιοι', 'χιλιάδα',
+              'εκατομμύριο', 'δισεκατομμύριο', 'τρισεκατομμύριο', 'τετράκις',
+              'πεντάκις', 'εξάκις', 'επτάκις', 'οκτάκις', 'εννεάκις', 'ένα',
+              'δύο', 'τρία', 'τέσσερα', 'δις', 'χιλιάδες']


 def like_num(text):
--- a/spacy/lang/el/norm_exceptions.py
+++ b/spacy/lang/el/norm_exceptions.py
@ -11,7 +11,6 @@ _exc={
    "αγιορίτης": "αγιορείτης",
    "αγόρι": "αγώρι",
    "έωλος": "αίολος",
-"αητός": "αϊτός",
    "αλλοίθωρος": "αλλήθωρος",
    "αλλοιώς": "αλλιώς",
    "αλλοιώτικος": "αλλκότικος",
@ -43,17 +42,16 @@ _exc={
    "γκάµα": "γκάµµα",
    "γλύφω": "γλείφω",
    "γλήνα": "γλίνα",
-"γρικώ": "γρθικώ",
    "διαφήµηση": "διαφήµιση",
    "δικλείδα": "δικλίδα",
    "διοξείδιο": "διοξίδιο",
    "διορία": "διωρία",
    "δυόροφος": "διώροφος",
-"δυόµισυ  διόσµος": "δυόµισι",
-"δυσφήµιση": "δυόσµος",
-"δοσίλογος": "δυσφήµηση",
-"εγχείριση": "δωσίλογος",
-"ιδερός": "εγχείρηση",
+    "δυόµισυ": "δυόµισι",
+    "διόσµος": "δυόσμος",
+    "δυσφήμιση": "δυσφήµηση",
+    "δοσίλογος": "δωσίλογος",
+    "εγχείριση": "εγχείρηση",
    "ειδωλολατρεία": "ειδωλολατρία",
    "εληά": "ελιά",
    "ελιξίριο": "ελιξήριο",
@ -69,7 +67,6 @@ _exc={
    "ζηλειάρης": "ζηλιάρης",
    "Θεοφάνεια": "Θεοφάνια",
    "καυγάς": "καβγάς",
-"κάθησα": "κάθίσα",
    "καθίκι": "καθοίκι",
    "καινούριος": "καινούργιος",
    "κακάβι": "κακκάβι",
@ -84,25 +81,20 @@ _exc={
    "κυάλια": "κιάλια",
    "κλύδωνας": "κλήδονας",
    "κλωτσώ": "κλοτσώ",
-"κυττάζω": "κολάζω",
    "κολλιτσίδα": "κολλητσίδα",
-"κολιός": "κολθιός",
    "κουκί": "κουκκί",
    "κουλός": "κουλλός",
-"κώχη": "κόχη",
    "κρεββάτι": "κρεβάτι",
    "κροκόδειλος": "κροκόδιλος",
    "κοβιός": "κωβιός",
    "λάκισα": "λάκησα",
    "λιµέρι": "ληµέρι",
    "λώξυγγας": "λόξυγγας",
-"µαγκώνω": "µαγγώνο",
    "µαγγούρα": "µαγκούρα",
    "µαζή": "μαζί",
    "µακρυά": "µακριά",
    "µαµή": "µαµµή",
    "µαµόθρεφτος": "µαµµόθρεφτος",
-"µάνα": "μάννη",
    "µίγµα": "µείγµα",
    "µίξη": "µείξη",
    "µετώπη": "µετόπη",
@ -126,7 +118,6 @@ _exc={
    "ξυπόλητος": "ξυπόλυτος",
    "ξωκλήσι": "ξωκκλήσι",
    "οξυά": "οξιά",
-"οξείδωση": "οξείδωση",
    "ορθοπεδικός": "ορθοπαιδικός",
    "ωχ": "οχ",
    "παπάς": "παππάς",
@ -176,7 +167,6 @@ _exc={
    "τανίζω": "τανύζω",
    "τέσσερις": "τέσσερεις",
    "τζιτζιφιά": "τζιτζυφιά",
-"τζιριτζάντζουλα": "τζυριτζάντζουλα",
    "τόνος": "τόννος",
    "τοπείο": "τοπίο",
    "τρέλλα": "τρέλα",
@ -214,7 +204,6 @@ _exc={
    "µυλαίδη": "µιλέδη",
    "µποϋκοτάζ": "µποϊκοτάζ",
    "πέναλτυ": "πέναλτι",
-"πλέυ µπόυ": "πλεϊµπόϊ",
    "πορτραίτο": "πορτρέτο",
    "ρεστωράν": "ρεστοράν",
    "ροσµπήφ": "ροσµπίφ",
@ -297,14 +286,8 @@ _exc={
    "αλατένια": "αλάτινη",
    "αλατένιο": "αλάτινο",
    "αλαφραίνω": "ελαφρώνω",
-"αλαφριός": "αλαφρός",
    "αλαφριός": "ελαφρύς",
-"αλαφριός": "ελαφρός",
-"αλαφριά": "αλαφρή",
-"αλαφριά": "ελαφριά",
-"αλαφριό": "αλαφρό",
    "αλαφριό": "ελαφρύ",
-"αλαφριό": "ελαφρό",
    "αλαφρόµυαλος": "ελαφρόµυαλος",
    "αλαφρόμυαλη": "ελαφρόμυαλη",
    "αλαφρόμυαλο": "ελαφρόμυαλο",
@ -349,8 +332,6 @@ _exc={
    "αναπτυγµένος": "ανεπτυγμένος",
    "αναπτυγµένη": "ανεπτυγμένη",
    "αναπτυγµένο": "ανεπτυγμένο",
-"άναστρος": "ανάστερη",
-"άναστρος": "ανάστερο",
    "άναστρος": "ανάστερος",
    "αναστυλώνω": "αναστηλώνω",
    "αναστύλωση": "αναστήλωση",
@ -810,7 +791,6 @@ _exc={
    "κανονιοβολώ": "καννονιοβολώ",
    "κανονιοστάσιο": "καννονιοστάσιο",
    "κανονιοστοιχία": "καννονιοστοιχία",
-"κανονιοφόρος": "καννονιοφόρος",
    "κανονοθυρίδα": "καννονοθυρίδα",
    "κάνουλα": "κάννουλα",
    "κανών": "κανόνας",
@ -1394,7 +1374,6 @@ _exc={
    "πίστοµα": "απίστοµα",
    "πιτσιλάδα": "πιτσυλάδα",
    "πιτσιλιά": "πιτσυλιά",
-"πιτσιλώ": "πιτσυλίζω",
    "πίττα": "πίτα",
    "πίτυρον": "πίτουρο",
    "πλάγι": "πλάι",
@ -1626,7 +1605,6 @@ _exc={
    "σταλαµατιά": "σταλαγµατιά",
    "σταλαξιά": "σταλαγµατιά",
    "σταλίτσα": "σταλιά",
-"σταρέµπορος": "σιταρέµπορος",
    "σταρήθρα": "σιταρήθρα",
    "στάρι": "σιτάρι",
    "σταρότοπος": "σιταρότοπος",
@ -1862,7 +1840,6 @@ _exc={
    "φτηναίνω": "φθηναίνω",
    "φτιασίδι": "φτειασίδι",
    "φτιασιδώνοµαι": "φτειασιδώνοµαι",
-"φτιάχνω": "φτιάχνω",
    "φτωχοκοµείο": "πτωχοκοµείο",
    "φυγάδας": "φυγάς",
    "φύγω": "φεύγω",
@ -1890,7 +1867,6 @@ _exc={
    "χάµου": "χάµω",
    "χαµψίνι": "χαµσίνι",
    "χάνδρα": "χάντρα",
-"χάνος": "χαγάνος",
    "χαντζής": "χανιτζής",
    "χαραµατιά": "χαραγµατιά",
    "χάραξ": "χάρακας",
@ -2465,7 +2441,6 @@ _exc={
    "συχωριανό": "συγχωριανό",
    "ταγκός": "ταγγός",
    "ταγκή": "ταγγή",
-"ταγκό": "ταγγό",
    "ταµιευτικός": "αποταµιευτικός",
    "ταµιευτική": "αποταµιευτική",
    "ταµιευτικό": "αποταµιευτικό",
--- a/spacy/lang/el/punctuation.py
+++ b/spacy/lang/el/punctuation.py
@ -10,7 +10,11 @@ _units = ('km km² km³ m m² m³ dm dm² dm³ cm cm² cm³ mm mm² mm³ ha µm
          'kg g mg µg t lb oz m/s km/h kmh mph hPa Pa mbar mb MB kb KB gb GB tb '
          'TB T G M K км км² км³ м м² м³ дм дм² дм³ см см² см³ мм мм² мм³ нм '
          'кг г мг м/с км/ч кПа Па мбар Кб КБ кб Мб МБ мб Гб ГБ гб Тб ТБ тб')
-merge_chars = lambda char: char.strip().replace(' ', '|')
+
+
+def merge_chars(char): return char.strip().replace(' ', '|')
+
+
 UNITS = merge_chars(_units)

 _prefixes = (['\'\'', '§', '%', '=', r'\+[0-9]+%',  # 90%
@ -42,7 +46,8 @@ _suffixes = (LIST_PUNCT + LIST_ELLIPSES + LIST_QUOTES + LIST_ICONS +
              r'(?<=[Α-Ωα-ωίϊΐόάέύϋΰήώ])\.',
              r'^[Α-Ω]{1}\.',
              r'\ [Α-Ω]{1}\.',
-              r'[ΈΆΊΑΌ-Ωα-ωίϊΐόάέύϋΰήώ]+([\-]([ΈΆΊΑΌ-Ωα-ωίϊΐόάέύϋΰήώ]+))+',  # πρώτος-δεύτερος , πρώτος-δεύτερος-τρίτος
+              # πρώτος-δεύτερος , πρώτος-δεύτερος-τρίτος
+              r'[ΈΆΊΑΌ-Ωα-ωίϊΐόάέύϋΰήώ]+([\-]([ΈΆΊΑΌ-Ωα-ωίϊΐόάέύϋΰήώ]+))+',
              r'([0-9]+)mg',  # 13mg
              r'([0-9]+)\.([0-9]+)m'  # 1.2m
              ])
@ -53,7 +58,8 @@ _infixes = (LIST_ELLIPSES + LIST_ICONS +
             r'([0-9])+(\.([0-9]+))*([\-]([0-9])+)+',  # 10.9 , 10.9.9 , 10.9-6
             r'([0-9])+[,]([0-9])+[\-]([0-9])+[,]([0-9])+',  # 10,11,12
             r'([0-9])+[ης]+([\-]([0-9])+)+',  # 1ης-2
-             r'([0-9]){1,4}[\/]([0-9]){1,2}([\/]([0-9]){0,4}){0,1}',  # 15/2 , 15/2/17 , 2017/2/15
+             # 15/2 , 15/2/17 , 2017/2/15
+             r'([0-9]){1,4}[\/]([0-9]){1,2}([\/]([0-9]){0,4}){0,1}',
             r'[A-Za-z]+\@[A-Za-z]+(\-[A-Za-z]+)*\.[A-Za-z]+',  # abc@cde-fgh.a
             r'([a-zA-Z]+)(\-([a-zA-Z]+))+',  # abc-abc
             r'(?<=[{}])\.(?=[{}])'.format(ALPHA_LOWER, ALPHA_UPPER),
--- a/spacy/lang/el/syntax_iterators.py
+++ b/spacy/lang/el/syntax_iterators.py
@ -0,0 +1,61 @@
+# coding: utf8
+from __future__ import unicode_literals
+
+from ...symbols import NOUN, PROPN, PRON
+
+
+def noun_chunks(obj):
+    """
+    Detect base noun phrases. Works on both Doc and Span.
+    """
+
+    # it follows the logic of the noun chunks finder of English language,
+    # adjusted to some Greek language special characteristics.
+
+    # obj tag corrects some DEP tagger mistakes.
+    # Further improvement of the models will eliminate the need for this tag.
+    labels = ['nsubj', 'obj', 'iobj', 'appos', 'ROOT', 'obl']
+    doc = obj.doc  # Ensure works on both Doc and Span.
+    np_deps = [doc.vocab.strings.add(label) for label in labels]
+    conj = doc.vocab.strings.add('conj')
+    nmod = doc.vocab.strings.add('nmod')
+    np_label = doc.vocab.strings.add('NP')
+    seen = set()
+    for i, word in enumerate(obj):
+        if word.pos not in (NOUN, PROPN, PRON):
+            continue
+        # Prevent nested chunks from being produced
+        if word.i in seen:
+            continue
+        if word.dep in np_deps:
+            if any(w.i in seen for w in word.subtree):
+                continue
+            flag = False
+            if (word.pos == NOUN):
+                #  check for patterns such as γραμμή παραγωγής
+                for potential_nmod in word.rights:
+                    if (potential_nmod.dep == nmod):
+                        seen.update(j for j in range(
+                            word.left_edge.i, potential_nmod.i + 1))
+                        yield word.left_edge.i, potential_nmod.i + 1, np_label
+                        flag = True
+                        break
+            if (flag is False):
+                seen.update(j for j in range(word.left_edge.i, word.i + 1))
+                yield word.left_edge.i, word.i + 1, np_label
+        elif word.dep == conj:
+            # covers the case: έχει όμορφα και έξυπνα παιδιά
+            head = word.head
+            while head.dep == conj and head.head.i < head.i:
+                head = head.head
+            # If the head is an NP, and we're coordinated to it, we're an NP
+            if head.dep in np_deps:
+                if any(w.i in seen for w in word.subtree):
+                    continue
+                seen.update(j for j in range(word.left_edge.i, word.i + 1))
+                yield word.left_edge.i, word.i + 1, np_label
+
+
+SYNTAX_ITERATORS = {
+    'noun_chunks': noun_chunks
+}
--- a/spacy/lang/el/tag_map.py
+++ b/spacy/lang/el/tag_map.py
@ -2,7 +2,7 @@

 from __future__ import unicode_literals
 from ...symbols import POS, PUNCT, SYM, ADJ, CCONJ, SCONJ, NUM, DET, ADV, ADP, X, VERB
-from ...symbols import NOUN, PROPN, PART, INTJ,SPACE,PRON
+from ...symbols import NOUN, PROPN, PART, INTJ, PRON

 TAG_MAP = {
    "ABBR":    {POS: NOUN, "Abbr": "Yes"},
@ -596,4 +596,3 @@ TAG_MAP = {
    "VbMnPpXxXxSgNePePvVo":    {POS: VERB, "VerbForm": "Part", "Mood": "", "Tense": "Pres|Past", "Person": "1|2|3", "Number": "Sing", "Gender": "Neut", "Aspect": "Perf", "Voice": "Pass", "Case": "Voc"},
    "VbMnPpXxXxXxXxIpAvXx":    {POS: VERB, "VerbForm": "Conv", "Mood": "", "Tense": "Pres|Past", "Person": "1|2|3", "Number": "Sing|Plur", "Gender": "Masc|Fem|Neut", "Aspect": "Imp", "Voice": "Act", "Case": "Nom|Gen|Dat|Acc|Voc"}
 }
-
--- a/spacy/lang/el/tag_map_general.py
+++ b/spacy/lang/el/tag_map_general.py
@ -1,8 +1,7 @@
 from __future__ import unicode_literals

 from ...symbols import POS, ADV, NOUN, ADP, PRON, SCONJ, PROPN, DET, SYM, INTJ
-from ...symbols import PUNCT, NUM, AUX, X, CONJ, ADJ, VERB, PART, SPACE, CCONJ
-
+from ...symbols import PUNCT, NUM, AUX, X, ADJ, VERB, PART, SPACE, CCONJ


 TAG_MAP = {
--- a/spacy/lang/el/tokenizer_exceptions.py
+++ b/spacy/lang/el/tokenizer_exceptions.py
@ -2,7 +2,7 @@

 from __future__ import unicode_literals

-from ...symbols import ORTH, LEMMA, TAG, NORM, ADP, DET
+from ...symbols import ORTH, LEMMA, NORM

 _exc = {}

--- a/website/usage/_vectors-similarity/_custom.jade
+++ b/website/usage/_vectors-similarity/_custom.jade
@ -62,8 +62,8 @@ p

 +code.
    nlp_latin = spacy.load('/tmp/la_vectors_wiki_lg')
-    doc1 = nlp(u"Caecilius est in horto")
-    doc2 = nlp(u"servus est in atrio")
+    doc1 = nlp_latin(u"Caecilius est in horto")
+    doc2 = nlp_latin(u"servus est in atrio")
    doc1.similarity(doc2)

 p