spaCy/spacy/lang/uk/stop_words.py
2019-02-08 14:14:49 +01:00

399 lines
4.2 KiB
Python
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# encoding: utf8
from __future__ import unicode_literals
STOP_WORDS = set(
"""а
або
адже
але
алло
багато
без
безперервно
би
більш
більше
біля
близько
був
буває
буде
будемо
будете
будеш
буду
будуть
будь
була
були
було
бути
бывь
в
важлива
важливе
важливий
важливі
вам
вами
вас
ваш
ваша
ваше
ваші
вгорі
вгору
вдалині
вже
ви
від
відсотків
він
вісім
вісімнадцятий
вісімнадцять
вниз
внизу
вона
вони
воно
восьмий
всього
втім
г
геть
говорив
говорить
давно
далеко
далі
дарма
два
двадцятий
двадцять
дванадцятий
дванадцять
дві
двох
де
дев'ятий
дев'ятнадцятий
дев'ятнадцять
дев'ять
декілька
день
десятий
десять
дійсно
для
дня
до
добре
довго
доки
досить
другий
дуже
же
життя
з
за
завжди
зазвичай
зайнята
зайнятий
зайняті
зайнято
занадто
зараз
зате
звичайно
звідси
звідусіль
здається
значить
знову
зовсім
ім'я
іноді
інша
інше
інший
інших
інші
її
їй
їх
його
йому
ким
кого
кожен
кожна
кожне
кожні
коли
кому
краще
крейдуючи
кругом
куди
ласка
лише
люди
людина
майже
мало
мати
мене
мені
менш
менше
ми
мимо
міг
між
мій
мільйонів
мною
могти
моє
мож
може
можна
можно
можуть
можхо
мої
мор
моя
на
навіть
навіщо
навкруги
нагорі
над
назад
найбільш
нам
нами
нарешті
нас
наш
наша
наше
наші
не
небагато
недалеко
немає
нерідко
нещодавно
нею
нибудь
нижче
низько
ним
ними
них
ні
ніби
ніколи
нікуди
нічого
ну
нх
нього
о
обоє
один
одинадцятий
одинадцять
однієї
одній
одного
означає
окрім
он
особливо
ось
перед
перший
під
пізніше
пір
по
повинно
подів
поки
пора
поруч
посеред
потім
потрібно
почала
прекрасне
прекрасно
при
про
просто
проте
проти
п'ятий
п'ятнадцятий
п'ятнадцять
п'ять
раз
раніше
рано
раптом
рік
роки
років
року
сам
сама
саме
самим
самими
самих
самі
самій
само
самого
самому
саму
світу
свого
своє
свої
своїй
своїх
свою
сеаой
себе
сім
сімнадцятий
сімнадцять
сказав
сказала
сказати
скільки
скрізь
собі
собою
спасибі
спочатку
справ
став
суть
сьогодні
сьомий
т
та
так
така
таке
такий
такі
також
там
твій
твоє
твоя
те
тебе
теж
тепер
ти
тим
тими
тисяч
тих
ті
тією
тільки
тобі
тобою
того
тоді
той
том
тому
треба
третій
три
тринадцятий
тринадцять
трохи
ту
туди
тут
у
увесь
уміти
усе
усі
усім
усіма
усіх
усію
усього
усьому
усю
усюди
уся
хіба
хотіти
хоч
хоча
хочеш
хто
це
цей
цим
цими
цих
ці
цій
цього
цьому
цю
ця
час
частіше
часто
часу
через
четвертий
чи
чим
численна
численне
численний
численні
чого
чому
чотири
чотирнадцятий
чотирнадцять
шістнадцятий
шістнадцять
шість
шостий
ще
що
щоб
я
як
яка
який
яких
які
якій
якого
якщо
""".split()
)