spaCy/spacy/lang/sv/stop_words.py
2020-02-18 15:38:18 +01:00

67 lines
2.5 KiB
Python

STOP_WORDS = set(
"""
aderton adertonde adjö aldrig alla allas allt alltid alltsÄ Àn andra andras
annan annat Ànnu artonde arton Ätminstone att Ätta Ättio Ättionde Ättonde av
Ă€ven
bÄda bÄdas bakom bara bÀst bÀttre behöva behövas behövde behövt beslut beslutat
beslutit bland blev bli blir blivit bort borta bra
dÄ dag dagar dagarna dagen dÀr dÀrför de del delen dem den deras dess det detta
dig din dina dit ditt dock du
efter eftersom elfte eller elva en enkel enkelt enkla enligt er era ert ett
ettusen
fÄ fanns fÄr fÄtt fem femte femtio femtionde femton femtonde fick fin finnas
finns fjÀrde fjorton fjortonde fler flera flesta följande för före förlÄt förra
första fram framför frÄn fyra fyrtio fyrtionde
gÄ gÀlla gÀller gÀllt gÄr gÀrna gÄtt genast genom gick gjorde gjort god goda
godare godast gör göra gott
ha hade haft han hans har hÀr heller hellre helst helt henne hennes hit hög
höger högre högst hon honom hundra hundraen hundraett hur
i ibland idag igÄr igen imorgon in inför inga ingen ingenting inget innan inne
inom inte inuti
ja jag jÀmfört
kan kanske knappast kom komma kommer kommit kr kunde kunna kunnat kvar
lÀnge lÀngre lÄngsam lÄngsammare lÄngsammast lÄngsamt lÀngst lÄngt lÀtt lÀttare
lÀttast legat ligga ligger lika likstÀlld likstÀllda lilla lite liten litet
man mÄnga mÄste med mellan men mer mera mest mig min mina mindre minst mitt
mittemot möjlig möjligen möjligt möjligtvis mot mycket
nÄgon nÄgonting nÄgot nÄgra nÀr nÀsta ned nederst nedersta nedre nej ner ni nio
nionde nittio nittionde nitton nittonde nödvÀndig nödvÀndiga nödvÀndigt
nödvÀndigtvis nog noll nr nu nummer
och ocksÄ ofta oftast olika olikt om oss
över övermorgon överst övre
pÄ
rakt rÀtt redan
sÄ sade sÀga sÀger sagt samma sÀmre sÀmst sedan senare senast sent sex sextio
sextionde sexton sextonde sig sin sina sist sista siste sitt sjÀtte sju sjunde
sjuttio sjuttionde sjutton sjuttonde ska skall skulle slutligen smÄ smÄtt snart
som stor stora större störst stort
tack tidig tidigare tidigast tidigt till tills tillsammans tio tionde tjugo
tjugoen tjugoett tjugonde tjugotre tjugotvÄ tjungo tolfte tolv tre tredje
trettio trettionde tretton trettonde tvÄ tvÄhundra
under upp ur ursÀkt ut utan utanför ute
vad vÀnster vÀnstra var vÄr vara vÄra varför varifrÄn varit varken vÀrre
varsÄgod vart vÄrt vem vems verkligen vi vid vidare viktig viktigare viktigast
viktigt vilka vilken vilket vill
""".split()
)