mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-28 02:46:35 +03:00
951825532c
* Improved Dutch language resources and Dutch lemmatization * Fix conftest * Update punctuation.py * Auto-format * Format and fix tests * Remove unused test file * Re-add deleted test * removed redundant infix regex pattern for ','; note: brackets + simple hyphen remains * Cleaner lemmatization files
25 lines
1.5 KiB
Python
25 lines
1.5 KiB
Python
# coding: utf8
|
|
from __future__ import unicode_literals
|
|
|
|
|
|
ADPOSITIONS = set(
|
|
('aan aangaande aanwezig achter af afgezien al als an annex anno anti '
|
|
'behalve behoudens beneden benevens benoorden beoosten betreffende bewesten '
|
|
'bezijden bezuiden bij binnen binnenuit binst bladzij blijkens boven bovenop '
|
|
'buiten conform contra cq daaraan daarbij daarbuiten daarin daarnaar '
|
|
'daaronder daartegenover daarvan dankzij deure dichtbij door doordat doorheen '
|
|
'echter eraf erop erover errond eruit ervoor evenals exclusief gedaan '
|
|
'gedurende gegeven getuige gezien halfweg halverwege heen hierdoorheen hierop '
|
|
'houdende in inclusief indien ingaande ingevolge inzake jegens kortweg '
|
|
'krachtens kralj langs langsheen langst lastens linksom lopende luidens mede '
|
|
'mee met middels midden middenop mits na naan naar naartoe naast naat nabij '
|
|
'nadat namens neer neffe neffen neven nevenst niettegenstaande nopens '
|
|
'officieel om omheen omstreeks omtrent onafgezien ondanks onder onderaan '
|
|
'ondere ongeacht ooit op open over per plus pro qua rechtover rond rondom '
|
|
"sedert sinds spijts strekkende te tegen tegenaan tegenop tegenover telde "
|
|
'teneinde terug tijdens toe tot totdat trots tussen tégen uit uitgenomen '
|
|
'ultimo van vanaf vandaan vandoor vanop vanuit vanwege versus via vinnen '
|
|
'vlakbij volgens voor voor- voorbij voordat voort voren vòòr vóór waaraan '
|
|
'waarbij waardoor waaronder weg wegens weleens zijdens zoals zodat zonder '
|
|
'zónder à').split())
|