spaCy/spacy/lang/kn/stop_words.py
2019-02-14 12:25:19 +01:00

70 lines
1.1 KiB
Python

# coding: utf8
from __future__ import unicode_literals
# Stop words
STOP_WORDS = set("""
ಮತ್ತು
ಹಾಗೂ
ಅವರು
ಅವರ
ಬಗ್ಗೆ
ಎಂಬ
ಆದರೆ
ಅವರನ್ನು
ಆದರೆ
ತಮ್ಮ
ಒಂದು
ಎಂದರು
ಮೇಲೆ
ಹೇಳಿದರು
ಸೇರಿದಂತೆ
ಬಳಿಕ
ಯಾವುದೇ
ಅವರಿಗೆ
ನಡೆದ
ಕುರಿತು
ಇದು
ಅವರು
ಕಳೆದ
ಇದೇ
ತಿಳಿಸಿದರು
ಹೀಗಾಗಿ
ಕೂಡ
ತನ್ನ
ತಿಳಿಸಿದ್ದಾರೆ
ನಾನು
ಹೇಳಿದ್ದಾರೆ
ಈಗ
ಎಲ್ಲ
ನನ್ನ
ನಮ್ಮ
ಈಗಾಗಲೇ
ಇದಕ್ಕೆ
ಹಲವು
ಇದೆ
ಮತ್ತೆ
ಮಾಡುವ
ನೀಡಿದರು
ನಾವು
ನೀಡಿದ
ಇದರಿಂದ
ಅದು
ಇದನ್ನು
ನೀಡಿದ್ದಾರೆ
ಅದನ್ನು
ಇಲ್ಲಿ
ಆಗ
ಬಂದಿದೆ.
ಅದೇ
ಇರುವ
ಅಲ್ಲದೆ
ಕೆಲವು
ನೀಡಿದೆ
ಇದರ
ಇನ್ನು
ನಡೆದಿದೆ
""".split())