mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-24 00:46:28 +03:00
Updating the stop word list for Sinhala language (#9270)
This commit is contained in:
parent
2f0bb77920
commit
68264b4cee
|
@ -1,47 +1,195 @@
|
|||
STOP_WORDS = set(
|
||||
"""
|
||||
අතර
|
||||
එච්චර
|
||||
එපමණ
|
||||
එලෙස
|
||||
එවිට
|
||||
ඒ
|
||||
කට
|
||||
කදී
|
||||
කින්
|
||||
ක්
|
||||
ට
|
||||
තුර
|
||||
ත්
|
||||
ද
|
||||
නමුත්
|
||||
නොහොත්
|
||||
පමණ
|
||||
පමණි
|
||||
ම
|
||||
මෙච්චර
|
||||
මෙපමණ
|
||||
මෙලෙස
|
||||
මෙවිට
|
||||
මේ
|
||||
ය
|
||||
යි
|
||||
ලදී
|
||||
සහ
|
||||
සමග
|
||||
සමඟ
|
||||
අහා
|
||||
ආහ්
|
||||
ආ
|
||||
ඕහෝ
|
||||
අනේ
|
||||
අඳෝ
|
||||
අපොයි
|
||||
අපෝ
|
||||
අයියෝ
|
||||
ආයි
|
||||
ඌයි
|
||||
චී
|
||||
චිහ්
|
||||
චික්
|
||||
හෝ
|
||||
දෝ
|
||||
දෝහෝ
|
||||
මෙන්
|
||||
සේ
|
||||
වැනි
|
||||
බඳු
|
||||
වන්
|
||||
අයුරු
|
||||
අයුරින්
|
||||
ලෙස
|
||||
වගේ
|
||||
වැඩි
|
||||
ශ්රී
|
||||
හා
|
||||
ය
|
||||
නිසා
|
||||
නිසාවෙන්
|
||||
බවට
|
||||
බව
|
||||
බවෙන්
|
||||
නම්
|
||||
වැඩි
|
||||
සිට
|
||||
දී
|
||||
මහා
|
||||
මහ
|
||||
පමණ
|
||||
පමණින්
|
||||
පමන
|
||||
වන
|
||||
විට
|
||||
විටෙක
|
||||
විතර
|
||||
විය
|
||||
වුව
|
||||
වුවත්
|
||||
වුවද
|
||||
වූ
|
||||
සමඟ
|
||||
විටින්
|
||||
මේ
|
||||
මෙලෙස
|
||||
මෙයින්
|
||||
ඇති
|
||||
ලෙස
|
||||
සිදු
|
||||
වශයෙන්
|
||||
යන
|
||||
සඳහා
|
||||
මගින්
|
||||
හෝ
|
||||
ඉතා
|
||||
ඒ
|
||||
එම
|
||||
ද
|
||||
අතර
|
||||
විසින්
|
||||
සමග
|
||||
පිළිබඳව
|
||||
පිළිබඳ
|
||||
තුළ
|
||||
බව
|
||||
වැනි
|
||||
මහ
|
||||
මෙම
|
||||
මෙහි
|
||||
මේ
|
||||
වෙත
|
||||
වෙතින්
|
||||
වෙතට
|
||||
වෙනුවෙන්
|
||||
වෙනුවට
|
||||
වෙන
|
||||
ගැන
|
||||
නෑ
|
||||
අනුව
|
||||
නව
|
||||
පිළිබඳ
|
||||
විශේෂ
|
||||
දැනට
|
||||
එහෙන්
|
||||
මෙහෙන්
|
||||
එහේ
|
||||
මෙහේ
|
||||
ම
|
||||
තවත්
|
||||
තව
|
||||
සහ
|
||||
හා
|
||||
දක්වා
|
||||
ට
|
||||
ගේ
|
||||
එ
|
||||
ක
|
||||
ක්
|
||||
බවත්
|
||||
බවද
|
||||
මත
|
||||
ඇතුලු
|
||||
ඇතුළු
|
||||
මෙසේ
|
||||
වඩා
|
||||
වඩාත්ම
|
||||
නිති
|
||||
නිතිත්
|
||||
නිතොර
|
||||
නිතර
|
||||
ඉක්බිති
|
||||
දැන්
|
||||
යලි
|
||||
පුන
|
||||
ඉතින්
|
||||
සිට
|
||||
සිටන්
|
||||
පටන්
|
||||
තෙක්
|
||||
දක්වා
|
||||
සා
|
||||
තාක්
|
||||
තුවක්
|
||||
පවා
|
||||
ද
|
||||
හෝ
|
||||
වත්
|
||||
විනා
|
||||
හැර
|
||||
මිස
|
||||
මුත්
|
||||
කිම
|
||||
කිම්
|
||||
ඇයි
|
||||
මන්ද
|
||||
හෙවත්
|
||||
හෝ
|
||||
නොහොත්
|
||||
පතා
|
||||
පාසා
|
||||
ගානෙ
|
||||
තව
|
||||
ඉතා
|
||||
බොහෝ
|
||||
වහා
|
||||
සෙද
|
||||
සැනින්
|
||||
හනික
|
||||
එම්බා
|
||||
එම්බල
|
||||
බොල
|
||||
නම්
|
||||
වනාහි
|
||||
කලී
|
||||
ඉඳුරා
|
||||
අන්න
|
||||
ඔන්න
|
||||
මෙන්න
|
||||
උදෙසා
|
||||
පිණිස
|
||||
සඳහා
|
||||
අරබයා
|
||||
නිසා
|
||||
එනිසා
|
||||
එබැවින්
|
||||
බැවින්
|
||||
හෙයින්
|
||||
සේක්
|
||||
සේක
|
||||
ගැන
|
||||
අනුව
|
||||
පරිදි
|
||||
විට
|
||||
තෙක්
|
||||
මෙතෙක්
|
||||
මේතාක්
|
||||
තුරු
|
||||
තුරා
|
||||
තුරාවට
|
||||
තුලින්
|
||||
නමුත්
|
||||
එනමුත්
|
||||
වස්
|
||||
මෙන්
|
||||
ලෙස
|
||||
පරිදි
|
||||
එහෙත්
|
||||
""".split()
|
||||
)
|
||||
|
|
Loading…
Reference in New Issue
Block a user