mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-27 10:26:35 +03:00
5ca7dd0f94
* Improve load_language_data helper * WIP: Add Lookups implementation * Start moving lemma data over to JSON * WIP: move data over for more languages * Convert more languages * Fix lemmatizer fixtures in tests * Finish conversion * Auto-format JSON files * Fix test for now * Make sure tables are stored on instance
103 lines
2.2 KiB
JSON
103 lines
2.2 KiB
JSON
{
|
||
"noun": [
|
||
["t", ""],
|
||
["n", ""],
|
||
["na", ""],
|
||
["na", "e"],
|
||
["or", "a"],
|
||
["orna", "a"],
|
||
["et", ""],
|
||
["en", ""],
|
||
["en", "e"],
|
||
["er", ""],
|
||
["erna", ""],
|
||
["ar", "e"],
|
||
["ar", ""],
|
||
["lar", "el"],
|
||
["arna", "e"],
|
||
["arna", ""],
|
||
["larna", "el"]
|
||
],
|
||
"verb": [
|
||
["r", ""],
|
||
["de", ""],
|
||
["t", ""],
|
||
["er", ""],
|
||
["te", ""],
|
||
["a", ""],
|
||
["e", ""],
|
||
["t", "d"],
|
||
["tt", "d"],
|
||
["tt", ""],
|
||
["ev", "iv"],
|
||
["ack", "ick"],
|
||
["ög", "yg"],
|
||
["it", ""],
|
||
["uckit", "ick"],
|
||
["ugit", "yg"],
|
||
["it", "et"],
|
||
["id", "ed"],
|
||
["ip", "ep"],
|
||
["iv", "ev"],
|
||
["in", "en"],
|
||
["ik", "ek"],
|
||
["ig", "eg"],
|
||
["ind", ""],
|
||
["inn", "ann"],
|
||
["nder", "nd"],
|
||
["inner", "inn"],
|
||
["and", "ind"],
|
||
["ann", "inn"],
|
||
["s", ""],
|
||
["anns", "inn"],
|
||
["undit", "ind"],
|
||
["unnit", "inn"],
|
||
["unnits", "inn"],
|
||
["uppit", "ipp"],
|
||
["ungit", "ing"],
|
||
["öd", "ud"],
|
||
["öt", "jut"],
|
||
["öt", "ut"],
|
||
["ög", "ug"],
|
||
["ögg", "ugg"],
|
||
["öng", "ung"],
|
||
["önk", "unk"],
|
||
["öt", "yt"],
|
||
["utit", "yt"],
|
||
["ös", "ys"],
|
||
["öv", "yv"],
|
||
["uvit", "yv"],
|
||
["öp", "yp"],
|
||
["upit", "yp"],
|
||
["ök", "yk"],
|
||
["ukit", "yk"],
|
||
["or", "ar"],
|
||
["öll", "all"],
|
||
["ät", "åt"],
|
||
["öll", "åll"],
|
||
["or", "är"],
|
||
["urit", "är"],
|
||
["åt", "ät"],
|
||
["ar", "är"],
|
||
["alt", "ält"],
|
||
["ultit", "ält"]
|
||
],
|
||
"adj": [
|
||
["are", ""],
|
||
["ast", ""],
|
||
["re", ""],
|
||
["st", ""],
|
||
["ägre", "åg"],
|
||
["ägst", "åg"],
|
||
["ängre", "ång"],
|
||
["ängst", "ång"],
|
||
["örre", "or"],
|
||
["örst", "or"]
|
||
],
|
||
"punct": [
|
||
["“", "\""],
|
||
["”", "\""],
|
||
["‘", "'"],
|
||
["’", "'"]
|
||
]
|
||
} |