mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-25 17:36:30 +03:00
added some widespread written jargon & dialectizms (#2584)
This jargon is not offencive but emotionally colored as funny due to its deviation from the norm for various reasons: immitating a dialect, deliberately wrong spelling emphasizing its low colloquial nature, obsolete form, foreign borrowing with native flections, etc. Dmitry Briukhanov, Linguist & Pythonist
This commit is contained in:
parent
4ad7de6ca9
commit
27160b1516
|
@ -5,15 +5,27 @@ from __future__ import unicode_literals
|
|||
_exc = {
|
||||
# Slang
|
||||
'прив': 'привет',
|
||||
'дарова': 'привет',
|
||||
'дак': 'так',
|
||||
'дык': 'так',
|
||||
'здарова': 'привет',
|
||||
'пакедава': 'пока',
|
||||
'пакедаво': 'пока',
|
||||
'ща': 'сейчас',
|
||||
'спс': 'спасибо',
|
||||
'пжлст': 'пожалуйста',
|
||||
'плиз': 'пожалуйста',
|
||||
'ладненько': 'ладно',
|
||||
'лады': 'ладно',
|
||||
'лан': 'ладно',
|
||||
'ясн': 'ясно',
|
||||
'всм': 'всмысле',
|
||||
'хош': 'хочешь',
|
||||
'оч': 'очень'
|
||||
'хаюшки': 'привет',
|
||||
'оч': 'очень',
|
||||
'че': 'что',
|
||||
'чо': 'что',
|
||||
'шо': 'что'
|
||||
}
|
||||
|
||||
|
||||
|
|
Loading…
Reference in New Issue
Block a user