mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-11 04:08:09 +03:00
44 lines
662 B
Python
44 lines
662 B
Python
# coding: utf8
|
|
from __future__ import unicode_literals
|
|
|
|
|
|
# Stop words are retrieved from http://www.damienvanholten.com/downloads/dutch-stop-words.txt
|
|
|
|
STOP_WORDS = set("""
|
|
aan af al alles als altijd andere
|
|
|
|
ben bij
|
|
|
|
daar dan dat de der deze die dit doch doen door dus
|
|
|
|
een eens en er
|
|
|
|
ge geen geweest
|
|
|
|
haar had heb hebben heeft hem het hier hij hoe hun
|
|
|
|
iemand iets ik in is
|
|
|
|
ja je
|
|
|
|
kan kon kunnen
|
|
|
|
maar me meer men met mij mijn moet
|
|
|
|
na naar niet niets nog nu
|
|
|
|
of om omdat ons ook op over
|
|
|
|
reeds
|
|
|
|
te tegen toch toen tot
|
|
|
|
u uit uw
|
|
|
|
van veel voor
|
|
|
|
want waren was wat we wel werd wezen wie wij wil worden
|
|
|
|
zal ze zei zelf zich zij zijn zo zonder zou
|
|
""".split())
|