mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-14 05:37:03 +03:00
44 lines
664 B
Python
44 lines
664 B
Python
|
# encoding: utf8
|
||
|
from __future__ import unicode_literals
|
||
|
|
||
|
|
||
|
# Stop words are retrieved from http://www.damienvanholten.com/downloads/dutch-stop-words.txt
|
||
|
|
||
|
STOP_WORDS = set("""
|
||
|
aan af al alles als altijd andere
|
||
|
|
||
|
ben bij
|
||
|
|
||
|
daar dan dat de der deze die dit doch doen door dus
|
||
|
|
||
|
een eens en er
|
||
|
|
||
|
ge geen geweest
|
||
|
|
||
|
haar had heb hebben heeft hem het hier hij hoe hun
|
||
|
|
||
|
iemand iets ik in is
|
||
|
|
||
|
ja je
|
||
|
|
||
|
kan kon kunnen
|
||
|
|
||
|
maar me meer men met mij mijn moet
|
||
|
|
||
|
na naar niet niets nog nu
|
||
|
|
||
|
of om omdat ons ook op over
|
||
|
|
||
|
reeds
|
||
|
|
||
|
te tegen toch toen tot
|
||
|
|
||
|
u uit uw
|
||
|
|
||
|
van veel voor
|
||
|
|
||
|
want waren was wat we wel werd wezen wie wij wil worden
|
||
|
|
||
|
zal ze zei zelf zich zij zijn zo zonder zou
|
||
|
""".split())
|