mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-30 20:06:30 +03:00
38 lines
619 B
Python
38 lines
619 B
Python
|
# Corrected Perseus list, cf. https://wiki.digitalclassicist.org/Stopwords_for_Greek_and_Latin
|
||
|
|
||
|
STOP_WORDS = set(
|
||
|
"""
|
||
|
ab ac ad adhuc aliqui aliquis an ante apud at atque aut autem
|
||
|
|
||
|
cum cur
|
||
|
|
||
|
de deinde dum
|
||
|
|
||
|
ego enim ergo es est et etiam etsi ex
|
||
|
|
||
|
fio
|
||
|
|
||
|
haud hic
|
||
|
|
||
|
iam idem igitur ille in infra inter interim ipse is ita
|
||
|
|
||
|
magis modo mox
|
||
|
|
||
|
nam ne nec necque neque nisi non nos
|
||
|
|
||
|
o ob
|
||
|
|
||
|
per possum post pro
|
||
|
|
||
|
quae quam quare qui quia quicumque quidem quilibet quis quisnam quisquam quisque quisquis quo quoniam
|
||
|
|
||
|
sed si sic sive sub sui sum super suus
|
||
|
|
||
|
tam tamen trans tu tum
|
||
|
|
||
|
ubi uel uero
|
||
|
|
||
|
vel vero
|
||
|
""".split()
|
||
|
)
|