spaCy/spacy/lang/ht/stop_words.py

STOP_WORDS = set(
    """
a ak an ankò ant apre ap atò avan avanlè
byen bò byenke

chak

de depi deja deja

e en epi èske

fò fòk

gen genyen

ki kisa kilès kote koukou konsa konbyen konn konnen kounye kouman

la l laa le lè li lye lò

m m' mwen

nan nap nou n'

ou oumenm

pa paske pami pandan pito pou pral preske pwiske

se selman si sou sòt

ta tap tankou te toujou tou tan tout toutotan twòp tèl

w w' wi wè

y y' yo yon yonn

non o oh eh

sa san si swa si

men mèsi oswa osinon

"""
.split()
)

# Add common contractions, with and without apostrophe variants
contractions = ["m'", "n'", "w'", "y'", "l'", "t'", "k'"]
for apostrophe in ["'", "’", "‘"]:
    for word in contractions:
        STOP_WORDS.add(word.replace("'", apostrophe))