mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-27 02:16:32 +03:00
48 lines
979 B
Python
48 lines
979 B
Python
# encoding: utf8
|
|
from __future__ import unicode_literals
|
|
|
|
|
|
# Source: https://github.com/stopwords-iso/stopwords-da
|
|
|
|
STOP_WORDS = set("""
|
|
ad af aldrig alle alt anden andet andre at
|
|
|
|
bare begge blev blive bliver
|
|
|
|
da de dem den denne der deres det dette dig din dine disse dit dog du
|
|
|
|
efter ej eller en end ene eneste enhver er et
|
|
|
|
far fem fik fire flere fleste for fordi forrige fra få får før
|
|
|
|
god godt
|
|
|
|
ham han hans har havde have hej helt hende hendes her hos hun hvad hvem hver
|
|
hvilken hvis hvor hvordan hvorfor hvornår
|
|
|
|
i ikke ind ingen intet
|
|
|
|
ja jeg jer jeres jo
|
|
|
|
kan kom komme kommer kun kunne
|
|
|
|
lad lav lidt lige lille
|
|
|
|
man mand mange med meget men mens mere mig min mine mit mod må
|
|
|
|
ned nej ni nogen noget nogle nu ny nyt når nær næste næsten
|
|
|
|
og også okay om op os otte over
|
|
|
|
på
|
|
|
|
se seks selv ser ses sig sige sin sine sit skal skulle som stor store syv så
|
|
sådan
|
|
|
|
tag tage thi ti til to tre
|
|
|
|
ud under
|
|
|
|
var ved vi vil ville vor vores være været
|
|
""".split())
|