# coding: utf8 from __future__ import unicode_literals ADJECTIVE_RULES = [ ["ین", ""], ["\u200cترین", ""], ["ترین", ""], ["\u200cتر", ""], ["تر", ""], ["\u200cای", ""], # ["ایی", "ا"], # ["ویی", "و"], # ["ی", ""], # ["مند", ""], # ["گین", ""], # ["مین", ""], # ["ناک", ""], # ["سار", ""], # ["\u200cوار", ""], # ["وار", ""] ] NOUN_RULES = [ ['ایان', 'ا'], ['ویان', 'و'], ['ایانی', 'ا'], ['ویانی', 'و'], ['گان', 'ه'], ['گانی', 'ه'], ['گان', ''], ['گانی', ''], ['ان', ''], ['انی', ''], ['ات', ''], ['ات', 'ه'], ['ات', 'ت'], ['اتی', ''], ['اتی', 'ه'], ['اتی', 'ت'], # ['ین', ''], # ['ینی', ''], # ['ون', ''], # ['ونی', ''], ['\u200cها', ''], ['ها', ''], ['\u200cهای', ''], ['های', ''], ['\u200cهایی', ''], ['هایی', ''], ] VERB_RULES = [ ] PUNCT_RULES = [ ["“", "\""], ["”", "\""], ["\u2018", "'"], ["\u2019", "'"] ]