spaCy/spacy/lang/da/stop_words.py
Ines Montani eddeb36c96
💫 Tidy up and auto-format .py files (#2983)
<!--- Provide a general summary of your changes in the title. -->

## Description
- [x] Use [`black`](https://github.com/ambv/black) to auto-format all `.py` files.
- [x] Update flake8 config to exclude very large files (lemmatization tables etc.)
- [x] Update code to be compatible with flake8 rules
- [x] Fix various small bugs, inconsistencies and messy stuff in the language data
- [x] Update docs to explain new code style (`black`, `flake8`, when to use `# fmt: off` and `# fmt: on` and what `# noqa` means)

Once #2932 is merged, which auto-formats and tidies up the CLI, we'll be able to run `flake8 spacy` actually get meaningful results.

At the moment, the code style and linting isn't applied automatically, but I'm hoping that the new [GitHub Actions](https://github.com/features/actions) will let us auto-format pull requests and post comments with relevant linting information.

### Types of change
enhancement, code style

## Checklist
<!--- Before you submit the PR, go over this checklist and make sure you can
tick off all the boxes. [] -> [x] -->
- [x] I have submitted the spaCy Contributor Agreement.
- [x] I ran the tests, and all new and existing tests passed.
- [x] My changes don't require a change to the documentation, or if they do, I've added all required information.
2018-11-30 17:03:03 +01:00

49 lines
1.4 KiB
Python

# encoding: utf8
from __future__ import unicode_literals
# Source: Handpicked by Jens Dahl Møllerhøj.
STOP_WORDS = set(
"""
af aldrig alene alle allerede alligevel alt altid anden andet andre at
bag begge blandt blev blive bliver burde bør
da de dem den denne dens der derefter deres derfor derfra deri dermed derpå derved det dette dig din dine disse dog du
efter egen eller ellers en end endnu ene eneste enhver ens enten er et
flere flest fleste for foran fordi forrige fra få før først
gennem gjorde gjort god gør gøre gørende
ham han hans har havde have hel heller hen hende hendes henover her herefter heri hermed herpå hun hvad hvem hver hvilke hvilken hvilkes hvis hvor hvordan hvorefter hvorfor hvorfra hvorhen hvori hvorimod hvornår hvorved
i igen igennem ikke imellem imens imod ind indtil ingen intet
jeg jer jeres jo
kan kom kommer kun kunne
lad langs lav lave lavet lidt lige ligesom lille længere
man mange med meget mellem men mens mere mest mig min mindre mindst mine mit må måske
ned nemlig nogen nogensinde noget nogle nok nu ny nyt nær næste næsten
og også om omkring op os over overalt
samme sammen selv selvom senere ses siden sig sige skal skulle som stadig synes syntes så sådan således
temmelig tidligere til tilbage tit
ud uden udover under undtagen
var ved vi via vil ville vore vores vær være været
øvrigt
""".split()
)