mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-30 20:06:30 +03:00
db55577c45
* Remove unicode declarations * Remove Python 3.5 and 2.7 from CI * Don't require pathlib * Replace compat helpers * Remove OrderedDict * Use f-strings * Set Cython compiler language level * Fix typo * Re-add OrderedDict for Table * Update setup.cfg * Revert CONTRIBUTING.md * Revert lookups.md * Revert top-level.md * Small adjustments and docs [ci skip]
212 lines
1.1 KiB
Python
212 lines
1.1 KiB
Python
STOP_WORDS = set(
|
|
"""
|
|
a
|
|
à
|
|
äis
|
|
är
|
|
ärt
|
|
äert
|
|
ären
|
|
all
|
|
allem
|
|
alles
|
|
alleguer
|
|
als
|
|
also
|
|
am
|
|
an
|
|
anerefalls
|
|
ass
|
|
aus
|
|
awer
|
|
bei
|
|
beim
|
|
bis
|
|
bis
|
|
d'
|
|
dach
|
|
datt
|
|
däin
|
|
där
|
|
dat
|
|
de
|
|
dee
|
|
den
|
|
deel
|
|
deem
|
|
deen
|
|
deene
|
|
déi
|
|
den
|
|
deng
|
|
denger
|
|
dem
|
|
der
|
|
dësem
|
|
di
|
|
dir
|
|
do
|
|
da
|
|
dann
|
|
domat
|
|
dozou
|
|
drop
|
|
du
|
|
duerch
|
|
duerno
|
|
e
|
|
ee
|
|
em
|
|
een
|
|
eent
|
|
ë
|
|
en
|
|
ënner
|
|
ëm
|
|
ech
|
|
eis
|
|
eise
|
|
eisen
|
|
eiser
|
|
eises
|
|
eisereen
|
|
esou
|
|
een
|
|
eng
|
|
enger
|
|
engem
|
|
entweder
|
|
et
|
|
eréischt
|
|
falls
|
|
fir
|
|
géint
|
|
géif
|
|
gëtt
|
|
gët
|
|
geet
|
|
gi
|
|
ginn
|
|
gouf
|
|
gouff
|
|
goung
|
|
hat
|
|
haten
|
|
hatt
|
|
hätt
|
|
hei
|
|
hu
|
|
huet
|
|
hun
|
|
hunn
|
|
hiren
|
|
hien
|
|
hin
|
|
hier
|
|
hir
|
|
jidderen
|
|
jiddereen
|
|
jiddwereen
|
|
jiddereng
|
|
jiddwerengen
|
|
jo
|
|
ins
|
|
iech
|
|
iwwer
|
|
kann
|
|
kee
|
|
keen
|
|
kënne
|
|
kënnt
|
|
kéng
|
|
kéngen
|
|
kéngem
|
|
koum
|
|
kuckt
|
|
mam
|
|
mat
|
|
ma
|
|
mä
|
|
mech
|
|
méi
|
|
mécht
|
|
meng
|
|
menger
|
|
mer
|
|
mir
|
|
muss
|
|
nach
|
|
nämmlech
|
|
nämmelech
|
|
näischt
|
|
nawell
|
|
nëmme
|
|
nëmmen
|
|
net
|
|
nees
|
|
nee
|
|
no
|
|
nu
|
|
nom
|
|
och
|
|
oder
|
|
ons
|
|
onsen
|
|
onser
|
|
onsereen
|
|
onst
|
|
om
|
|
op
|
|
ouni
|
|
säi
|
|
säin
|
|
schonn
|
|
schonns
|
|
si
|
|
sid
|
|
sie
|
|
se
|
|
sech
|
|
seng
|
|
senge
|
|
sengem
|
|
senger
|
|
selwecht
|
|
selwer
|
|
sinn
|
|
sollten
|
|
souguer
|
|
sou
|
|
soss
|
|
sot
|
|
't
|
|
tëscht
|
|
u
|
|
un
|
|
um
|
|
virdrun
|
|
vu
|
|
vum
|
|
vun
|
|
wann
|
|
war
|
|
waren
|
|
was
|
|
wat
|
|
wëllt
|
|
weider
|
|
wéi
|
|
wéini
|
|
wéinst
|
|
wi
|
|
wollt
|
|
wou
|
|
wouhin
|
|
zanter
|
|
ze
|
|
zu
|
|
zum
|
|
zwar
|
|
""".split()
|
|
)
|