Updating the stop word list for Sinhala language (#9270)

This commit is contained in:
Rumesh Madhusanka 2021-09-23 00:13:42 +05:30 committed by GitHub
parent 2f0bb77920
commit 68264b4cee
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -1,47 +1,195 @@
STOP_WORDS = set(
"""
අතර
එචචර
එපමණ
එල
එව
කට
කද
නම
පමණ
පමණ
චර
පමණ
ලද
සහ
සමග
සමඟ
අහ
ආහ
ඕහ
අන
අඳ
අප
අප
අය
ආය
ඌය
බඳ
වන
අය
අය
වග
බවට
බව
බව
නම
මහ
මහ
පමණ
පමණ
පමන
වන
තර
වත
වද
සමඟ
ඇත
වශය
යන
සඳහ
මග
ඉත
එම
අතර
සමග
බඳව
බඳ
බව
මහ
තට
වට
අන
නව
බඳ
නට
එහ
එහ
තවත
තව
සහ
දක
බවත
බවද
මත
ඇත
ඇත
වඩ
වඩ
තර
ඉක
යල
ඉත
ටන
පටන
දක
වක
පව
වත
ඇය
මන
වත
පත
තව
ඉත
වහ
හන
එම
එමබල
නම
වන
කල
ඉඳ
අන
ඔන
උද
සඳහ
අරබය
එන
එබ
අන
පර
වට
නම
එනම
වස
පර
එහ
""".split()
)