mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-25 17:36:30 +03:00
Add numbers and definitions (#10665)
This commit is contained in:
parent
d622883a42
commit
229ecaf0ea
|
@ -2,22 +2,29 @@ from ...attrs import LIKE_NUM
|
||||||
|
|
||||||
|
|
||||||
_num_words = [
|
_num_words = [
|
||||||
"không",
|
"không", # Zero
|
||||||
"một",
|
"một", # One
|
||||||
"hai",
|
"mốt", # Also one, irreplacable in niché cases for unit digit such as "51"="năm mươi mốt"
|
||||||
"ba",
|
"hai", # Two
|
||||||
"bốn",
|
"ba", # Three
|
||||||
"năm",
|
"bốn", # Four
|
||||||
"sáu",
|
"tư", # Also four, used in certain cases for unit digit such as "54"="năm mươi tư"
|
||||||
"bảy",
|
"năm", # Five
|
||||||
"bẩy",
|
"lăm", # Also five, irreplacable in niché cases for unit digit such as "55"="năm mươi lăm"
|
||||||
"tám",
|
"sáu", # Six
|
||||||
"chín",
|
"bảy", # Seven
|
||||||
"mười",
|
"bẩy", # Also seven, old fashioned
|
||||||
"chục",
|
"tám", # Eight
|
||||||
"trăm",
|
"chín", # Nine
|
||||||
"nghìn",
|
"mười", # Ten
|
||||||
"tỷ",
|
"chục", # Also ten, used for counting in tens such as "20 eggs"="hai chục trứng"
|
||||||
|
"trăm", # Hundred
|
||||||
|
"nghìn", # Thousand
|
||||||
|
"ngàn", # Also thousand, used in the south
|
||||||
|
"vạn", # Ten thousand
|
||||||
|
"triệu", # Million
|
||||||
|
"tỷ", # Billion
|
||||||
|
"tỉ" # Also billion, used in combinatorics such as "tỉ_phú"="billionaire"
|
||||||
]
|
]
|
||||||
|
|
||||||
|
|
||||||
|
|
Loading…
Reference in New Issue
Block a user