mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-13 21:26:58 +03:00
65 lines
1.1 KiB
Python
65 lines
1.1 KiB
Python
|
# coding: utf8
|
|||
|
from __future__ import unicode_literals
|
|||
|
|
|||
|
|
|||
|
ADJECTIVE_RULES = [
|
|||
|
["ین", ""],
|
|||
|
["\u200cترین", ""],
|
|||
|
["ترین", ""],
|
|||
|
["\u200cتر", ""],
|
|||
|
["تر", ""],
|
|||
|
["\u200cای", ""],
|
|||
|
# ["ایی", "ا"],
|
|||
|
# ["ویی", "و"],
|
|||
|
# ["ی", ""],
|
|||
|
# ["مند", ""],
|
|||
|
# ["گین", ""],
|
|||
|
# ["مین", ""],
|
|||
|
# ["ناک", ""],
|
|||
|
# ["سار", ""],
|
|||
|
# ["\u200cوار", ""],
|
|||
|
# ["وار", ""]
|
|||
|
]
|
|||
|
|
|||
|
|
|||
|
NOUN_RULES = [
|
|||
|
['ایان', 'ا'],
|
|||
|
['ویان', 'و'],
|
|||
|
['ایانی', 'ا'],
|
|||
|
['ویانی', 'و'],
|
|||
|
['گان', 'ه'],
|
|||
|
['گانی', 'ه'],
|
|||
|
['گان', ''],
|
|||
|
['گانی', ''],
|
|||
|
['ان', ''],
|
|||
|
['انی', ''],
|
|||
|
['ات', ''],
|
|||
|
['ات', 'ه'],
|
|||
|
['ات', 'ت'],
|
|||
|
['اتی', ''],
|
|||
|
['اتی', 'ه'],
|
|||
|
['اتی', 'ت'],
|
|||
|
# ['ین', ''],
|
|||
|
# ['ینی', ''],
|
|||
|
# ['ون', ''],
|
|||
|
# ['ونی', ''],
|
|||
|
['\u200cها', ''],
|
|||
|
['ها', ''],
|
|||
|
['\u200cهای', ''],
|
|||
|
['های', ''],
|
|||
|
['\u200cهایی', ''],
|
|||
|
['هایی', ''],
|
|||
|
]
|
|||
|
|
|||
|
|
|||
|
VERB_RULES = [
|
|||
|
]
|
|||
|
|
|||
|
|
|||
|
PUNCT_RULES = [
|
|||
|
["“", "\""],
|
|||
|
["”", "\""],
|
|||
|
["\u2018", "'"],
|
|||
|
["\u2019", "'"]
|
|||
|
]
|