mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-11 04:08:09 +03:00
eddeb36c96
<!--- Provide a general summary of your changes in the title. --> ## Description - [x] Use [`black`](https://github.com/ambv/black) to auto-format all `.py` files. - [x] Update flake8 config to exclude very large files (lemmatization tables etc.) - [x] Update code to be compatible with flake8 rules - [x] Fix various small bugs, inconsistencies and messy stuff in the language data - [x] Update docs to explain new code style (`black`, `flake8`, when to use `# fmt: off` and `# fmt: on` and what `# noqa` means) Once #2932 is merged, which auto-formats and tidies up the CLI, we'll be able to run `flake8 spacy` actually get meaningful results. At the moment, the code style and linting isn't applied automatically, but I'm hoping that the new [GitHub Actions](https://github.com/features/actions) will let us auto-format pull requests and post comments with relevant linting information. ### Types of change enhancement, code style ## Checklist <!--- Before you submit the PR, go over this checklist and make sure you can tick off all the boxes. [] -> [x] --> - [x] I have submitted the spaCy Contributor Agreement. - [x] I ran the tests, and all new and existing tests passed. - [x] My changes don't require a change to the documentation, or if they do, I've added all required information.
49 lines
1.4 KiB
Python
49 lines
1.4 KiB
Python
# encoding: utf8
|
|
from __future__ import unicode_literals
|
|
|
|
# Source: Handpicked by Jens Dahl Møllerhøj.
|
|
|
|
STOP_WORDS = set(
|
|
"""
|
|
af aldrig alene alle allerede alligevel alt altid anden andet andre at
|
|
|
|
bag begge blandt blev blive bliver burde bør
|
|
|
|
da de dem den denne dens der derefter deres derfor derfra deri dermed derpå derved det dette dig din dine disse dog du
|
|
|
|
efter egen eller ellers en end endnu ene eneste enhver ens enten er et
|
|
|
|
flere flest fleste for foran fordi forrige fra få før først
|
|
|
|
gennem gjorde gjort god gør gøre gørende
|
|
|
|
ham han hans har havde have hel heller hen hende hendes henover her herefter heri hermed herpå hun hvad hvem hver hvilke hvilken hvilkes hvis hvor hvordan hvorefter hvorfor hvorfra hvorhen hvori hvorimod hvornår hvorved
|
|
|
|
i igen igennem ikke imellem imens imod ind indtil ingen intet
|
|
|
|
jeg jer jeres jo
|
|
|
|
kan kom kommer kun kunne
|
|
|
|
lad langs lav lave lavet lidt lige ligesom lille længere
|
|
|
|
man mange med meget mellem men mens mere mest mig min mindre mindst mine mit må måske
|
|
|
|
ned nemlig nogen nogensinde noget nogle nok nu ny nyt nær næste næsten
|
|
|
|
og også om omkring op os over overalt
|
|
|
|
på
|
|
|
|
samme sammen selv selvom senere ses siden sig sige skal skulle som stadig synes syntes så sådan således
|
|
|
|
temmelig tidligere til tilbage tit
|
|
|
|
ud uden udover under undtagen
|
|
|
|
var ved vi via vil ville vore vores vær være været
|
|
|
|
øvrigt
|
|
""".split()
|
|
)
|