mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-26 18:06:29 +03:00
* Expand gazetteer with some of the errors from the reddit parse
This commit is contained in:
parent
832896ea6c
commit
6fcc3df989
|
@ -70,5 +70,111 @@
|
||||||
[{"lower": "html5"}]
|
[{"lower": "html5"}]
|
||||||
]
|
]
|
||||||
]
|
]
|
||||||
|
"Python": [
|
||||||
|
"PRODUCT",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"orth": "Python"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Ruby": [
|
||||||
|
"PRODUCT",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"orth": "Ruby"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Digg": [
|
||||||
|
"PRODUCT",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"lower": "digg"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Fox": [
|
||||||
|
"ORG",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"orth": "Fox"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Google": [
|
||||||
|
"ORG",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"lower": "google"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Mac": [
|
||||||
|
"PRODUCT",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"lower": "mac"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Wikipedia": [
|
||||||
|
"PRODUCT",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"lower": "wikipedia"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Windows": [
|
||||||
|
"PRODUCT",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"orth": "Windows"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Dell": [
|
||||||
|
"ORG",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"lower": "dell"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Facebook": [
|
||||||
|
"ORG",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"lower": "facebook"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Blizzard": [
|
||||||
|
"ORG",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"orth": "Facebook"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Ubuntu": [
|
||||||
|
"ORG",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"orth": "Ubuntu"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"Youtube": [
|
||||||
|
"PRODUCT",
|
||||||
|
{},
|
||||||
|
[
|
||||||
|
[{"lower": "youtube"}]
|
||||||
|
]
|
||||||
|
],
|
||||||
|
"false_positives": [
|
||||||
|
null,
|
||||||
|
{},
|
||||||
|
[{"orth": "Shit"}],
|
||||||
|
[{"orth": "Weed"}],
|
||||||
|
[{"orth": "Cool"}],
|
||||||
|
[{"orth": "Btw"}],
|
||||||
|
[{"orth": "Bah"}],
|
||||||
|
[{"orth": "Bullshit"}],
|
||||||
|
[{"orth": "Lol"}],
|
||||||
|
[{"orth": "Yo"}, {"orth": "dawg"}],
|
||||||
|
[{"orth": "Yay"}],
|
||||||
|
[{"orth": "Ahh"}],
|
||||||
|
[{"orth": "Yea"}],
|
||||||
|
[{"orth": "Bah"}]
|
||||||
|
]
|
||||||
}
|
}
|
||||||
|
|
Loading…
Reference in New Issue
Block a user