mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-27 18:36:36 +03:00
48 lines
979 B
Python
48 lines
979 B
Python
|
# encoding: utf8
|
||
|
from __future__ import unicode_literals
|
||
|
|
||
|
|
||
|
# Source: https://github.com/stopwords-iso/stopwords-da
|
||
|
|
||
|
STOP_WORDS = set("""
|
||
|
ad af aldrig alle alt anden andet andre at
|
||
|
|
||
|
bare begge blev blive bliver
|
||
|
|
||
|
da de dem den denne der deres det dette dig din dine disse dit dog du
|
||
|
|
||
|
efter ej eller en end ene eneste enhver er et
|
||
|
|
||
|
far fem fik fire flere fleste for fordi forrige fra få får før
|
||
|
|
||
|
god godt
|
||
|
|
||
|
ham han hans har havde have hej helt hende hendes her hos hun hvad hvem hver
|
||
|
hvilken hvis hvor hvordan hvorfor hvornår
|
||
|
|
||
|
i ikke ind ingen intet
|
||
|
|
||
|
ja jeg jer jeres jo
|
||
|
|
||
|
kan kom komme kommer kun kunne
|
||
|
|
||
|
lad lav lidt lige lille
|
||
|
|
||
|
man mand mange med meget men mens mere mig min mine mit mod må
|
||
|
|
||
|
ned nej ni nogen noget nogle nu ny nyt når nær næste næsten
|
||
|
|
||
|
og også okay om op os otte over
|
||
|
|
||
|
på
|
||
|
|
||
|
se seks selv ser ses sig sige sin sine sit skal skulle som stor store syv så
|
||
|
sådan
|
||
|
|
||
|
tag tage thi ti til to tre
|
||
|
|
||
|
ud under
|
||
|
|
||
|
var ved vi vil ville vor vores være været
|
||
|
""".split())
|