mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-14 21:57:15 +03:00
65 lines
1.1 KiB
Python
65 lines
1.1 KiB
Python
# coding: utf8
|
||
from __future__ import unicode_literals
|
||
|
||
|
||
ADJECTIVE_RULES = [
|
||
["ین", ""],
|
||
["\u200cترین", ""],
|
||
["ترین", ""],
|
||
["\u200cتر", ""],
|
||
["تر", ""],
|
||
["\u200cای", ""],
|
||
# ["ایی", "ا"],
|
||
# ["ویی", "و"],
|
||
# ["ی", ""],
|
||
# ["مند", ""],
|
||
# ["گین", ""],
|
||
# ["مین", ""],
|
||
# ["ناک", ""],
|
||
# ["سار", ""],
|
||
# ["\u200cوار", ""],
|
||
# ["وار", ""]
|
||
]
|
||
|
||
|
||
NOUN_RULES = [
|
||
['ایان', 'ا'],
|
||
['ویان', 'و'],
|
||
['ایانی', 'ا'],
|
||
['ویانی', 'و'],
|
||
['گان', 'ه'],
|
||
['گانی', 'ه'],
|
||
['گان', ''],
|
||
['گانی', ''],
|
||
['ان', ''],
|
||
['انی', ''],
|
||
['ات', ''],
|
||
['ات', 'ه'],
|
||
['ات', 'ت'],
|
||
['اتی', ''],
|
||
['اتی', 'ه'],
|
||
['اتی', 'ت'],
|
||
# ['ین', ''],
|
||
# ['ینی', ''],
|
||
# ['ون', ''],
|
||
# ['ونی', ''],
|
||
['\u200cها', ''],
|
||
['ها', ''],
|
||
['\u200cهای', ''],
|
||
['های', ''],
|
||
['\u200cهایی', ''],
|
||
['هایی', ''],
|
||
]
|
||
|
||
|
||
VERB_RULES = [
|
||
]
|
||
|
||
|
||
PUNCT_RULES = [
|
||
["“", "\""],
|
||
["”", "\""],
|
||
["\u2018", "'"],
|
||
["\u2019", "'"]
|
||
]
|