from __future__ import unicode_literals from ...attrs import LIKE_NUM _num_words = [ "զրօ", "մէկ", "երկու", "երեք", "չորս", "հինգ", "վեց", "յոթ", "ութ", "ինը", "տասը", "տասնմեկ", "տասներկու", "տասն­երեք", "տասն­չորս", "տասն­հինգ", "տասն­վեց", "տասն­յոթ", "տասն­ութ", "տասն­ինը", "քսան" "երեսուն", "քառասուն", "հիսուն", "վաթցսուն", "յոթանասուն", "ութսուն", "ինիսուն", "հարյուր", "հազար", "միլիոն", "միլիարդ", "տրիլիոն", "քվինտիլիոն", ] def like_num(text): if text.startswith(("+", "-", "±", "~")): text = text[1:] text = text.replace(",", "").replace(".", "") if text.isdigit(): return True if text.count("/") == 1: num, denom = text.split("/") if num.isdigit() and denom.isdigit(): return True if text.lower() in _num_words: return True return False LEX_ATTRS = {LIKE_NUM: like_num}