# coding: utf8 from __future__ import unicode_literals # Adjectives extracted from Mojgan Seraji's Persian Universal Dependencies Corpus # Below adjectives are exceptions for current adjective lemmatization rules ADJECTIVES_EXC = { "بهترین": ("بهتر",), "بهتر": ("بهتر",), "سنگین": ("سنگین",), "بیشترین": ("بیشتر",), "برتر": ("برتر",), "بدبین": ("بدبین",), "متین": ("متین",), "شیرین": ("شیرین",), "معین": ("معین",), "دلنشین": ("دلنشین",), "امین": ("امین",), "متدین": ("متدین",), "تیزبین": ("تیزبین",), "بنیادین": ("بنیادین",), "دروغین": ("دروغین",), "واپسین": ("واپسین",), "خونین": ("خونین",), "مزین": ("مزین",), "خوشبین": ("خوشبین",), "عطرآگین": ("عطرآگین",), "زرین": ("زرین",), "فرجامین": ("فرجامین",), "فقیرنشین": ("فقیرنشین",), "مستتر": ("مستتر",), "چوبین": ("چوبین",), "آغازین": ("آغازین",), "سخن‌چین": ("سخن‌چین",), "مرمرین": ("مرمرین",), "زنده‌تر": ("زنده‌تر",), "صفر‌کیلومتر": ("صفر‌کیلومتر",), "غمگین": ("غمگین",), "نازنین": ("نازنین",), "مثبت": ("مثبت",), "شرمگین": ("شرمگین",), "قرین": ("قرین",), "سوتر": ("سوتر",), "بی‌زین": ("بی‌زین",), "سیمین": ("سیمین",), "رنگین": ("رنگین",), "روشن‌بین": ("روشن‌بین",), "اندوهگین": ("اندوهگین",), "فی‌مابین": ("فی‌مابین",), "لاجوردین": ("لاجوردین",), "برنجین": ("برنجین",), "مشکل‌آفرین": ("مشکل‌آفرین",), "خبرچین": ("خبرچین",), }