mirror of
https://github.com/explosion/spaCy.git
synced 2025-08-07 13:44:55 +03:00
Remove la stop words
This commit is contained in:
parent
9a8864db84
commit
cfb5dccbb6
|
@ -1,37 +0,0 @@
|
||||||
# Corrected Perseus list, cf. https://wiki.digitalclassicist.org/Stopwords_for_Greek_and_Latin
|
|
||||||
|
|
||||||
STOP_WORDS = set(
|
|
||||||
"""
|
|
||||||
ab ac ad adhuc aliqui aliquis an ante apud at atque aut autem
|
|
||||||
|
|
||||||
cum cur
|
|
||||||
|
|
||||||
de deinde dum
|
|
||||||
|
|
||||||
ego enim ergo es est et etiam etsi ex
|
|
||||||
|
|
||||||
fio
|
|
||||||
|
|
||||||
haud hic
|
|
||||||
|
|
||||||
iam idem igitur ille in infra inter interim ipse is ita
|
|
||||||
|
|
||||||
magis modo mox
|
|
||||||
|
|
||||||
nam ne nec necque neque nisi non nos
|
|
||||||
|
|
||||||
o ob
|
|
||||||
|
|
||||||
per possum post pro
|
|
||||||
|
|
||||||
quae quam quare qui quia quicumque quidem quilibet quis quisnam quisquam quisque quisquis quo quoniam
|
|
||||||
|
|
||||||
sed si sic sive sub sui sum super suus
|
|
||||||
|
|
||||||
tam tamen trans tu tum
|
|
||||||
|
|
||||||
ubi uel uero
|
|
||||||
|
|
||||||
vel vero
|
|
||||||
""".split()
|
|
||||||
)
|
|
Loading…
Reference in New Issue
Block a user