spaCy/spacy/lang/ga/stop_words.py

46 lines
661 B
Python
Raw Normal View History

2017-06-26 23:24:55 +03:00
# encoding: utf8
from __future__ import unicode_literals
STOP_WORDS = set("""
a ach ag agus an aon ar arna as
ba beirt bhúr
caoga ceathair ceathrar chomh chuig chun cois céad cúig cúigear
daichead dar de deich deichniúr den dhá do don dtí dár
faoi faoin faoina faoinár fara fiche
gach gan go gur
haon hocht
i iad idir in ina ins inár is
le leis lena lenár
mar mo muid
na nach naoi naonúr níor nócha
ocht ochtar ochtó os
roimh
sa seacht seachtar seachtó seasca seisear siad sibh sinn sna
tar thar thú triúr trí trína trínár tríocha
um
ár
é éis
í
ó ón óna ónár
""".split())