mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-11 20:28:20 +03:00
54 lines
2.0 KiB
Python
54 lines
2.0 KiB
Python
# coding: utf8
|
|
from __future__ import unicode_literals
|
|
|
|
# Adjectives extracted from Mojgan Seraji's Persian Universal Dependencies Corpus
|
|
# Below adjectives are exceptions for current adjective lemmatization rules
|
|
ADJECTIVES_EXC = {
|
|
"بهترین": ("بهتر",),
|
|
"بهتر": ("بهتر",),
|
|
"سنگین": ("سنگین",),
|
|
"بیشترین": ("بیشتر",),
|
|
"برتر": ("برتر",),
|
|
"بدبین": ("بدبین",),
|
|
"متین": ("متین",),
|
|
"شیرین": ("شیرین",),
|
|
"معین": ("معین",),
|
|
"دلنشین": ("دلنشین",),
|
|
"امین": ("امین",),
|
|
"متدین": ("متدین",),
|
|
"تیزبین": ("تیزبین",),
|
|
"بنیادین": ("بنیادین",),
|
|
"دروغین": ("دروغین",),
|
|
"واپسین": ("واپسین",),
|
|
"خونین": ("خونین",),
|
|
"مزین": ("مزین",),
|
|
"خوشبین": ("خوشبین",),
|
|
"عطرآگین": ("عطرآگین",),
|
|
"زرین": ("زرین",),
|
|
"فرجامین": ("فرجامین",),
|
|
"فقیرنشین": ("فقیرنشین",),
|
|
"مستتر": ("مستتر",),
|
|
"چوبین": ("چوبین",),
|
|
"آغازین": ("آغازین",),
|
|
"سخنچین": ("سخنچین",),
|
|
"مرمرین": ("مرمرین",),
|
|
"زندهتر": ("زندهتر",),
|
|
"صفرکیلومتر": ("صفرکیلومتر",),
|
|
"غمگین": ("غمگین",),
|
|
"نازنین": ("نازنین",),
|
|
"مثبت": ("مثبت",),
|
|
"شرمگین": ("شرمگین",),
|
|
"قرین": ("قرین",),
|
|
"سوتر": ("سوتر",),
|
|
"بیزین": ("بیزین",),
|
|
"سیمین": ("سیمین",),
|
|
"رنگین": ("رنگین",),
|
|
"روشنبین": ("روشنبین",),
|
|
"اندوهگین": ("اندوهگین",),
|
|
"فیمابین": ("فیمابین",),
|
|
"لاجوردین": ("لاجوردین",),
|
|
"برنجین": ("برنجین",),
|
|
"مشکلآفرین": ("مشکلآفرین",),
|
|
"خبرچین": ("خبرچین",),
|
|
}
|