mirror of
				https://github.com/explosion/spaCy.git
				synced 2025-11-04 01:48:04 +03:00 
			
		
		
		
	* Remove unicode declarations * Remove Python 3.5 and 2.7 from CI * Don't require pathlib * Replace compat helpers * Remove OrderedDict * Use f-strings * Set Cython compiler language level * Fix typo * Re-add OrderedDict for Table * Update setup.cfg * Revert CONTRIBUTING.md * Revert lookups.md * Revert top-level.md * Small adjustments and docs [ci skip]
		
			
				
	
	
		
			152 lines
		
	
	
		
			965 B
		
	
	
	
		
			Python
		
	
	
	
	
	
			
		
		
	
	
			152 lines
		
	
	
		
			965 B
		
	
	
	
		
			Python
		
	
	
	
	
	
STOP_WORDS = set(
 | 
						|
    """
 | 
						|
akin
 | 
						|
aking
 | 
						|
ako
 | 
						|
alin
 | 
						|
am
 | 
						|
amin
 | 
						|
aming
 | 
						|
ang
 | 
						|
ano
 | 
						|
anumang
 | 
						|
apat
 | 
						|
at
 | 
						|
atin
 | 
						|
ating
 | 
						|
ay
 | 
						|
bababa
 | 
						|
bago
 | 
						|
bakit
 | 
						|
bawat
 | 
						|
bilang
 | 
						|
dahil
 | 
						|
dalawa
 | 
						|
dapat
 | 
						|
din
 | 
						|
dito
 | 
						|
doon
 | 
						|
gagawin
 | 
						|
gayunman
 | 
						|
ginagawa
 | 
						|
ginawa
 | 
						|
ginawang
 | 
						|
gumawa
 | 
						|
gusto
 | 
						|
habang
 | 
						|
hanggang
 | 
						|
hindi
 | 
						|
huwag
 | 
						|
iba
 | 
						|
ibaba
 | 
						|
ibabaw
 | 
						|
ibig
 | 
						|
ikaw
 | 
						|
ilagay
 | 
						|
ilalim
 | 
						|
ilan
 | 
						|
inyong
 | 
						|
isa
 | 
						|
isang
 | 
						|
itaas
 | 
						|
ito
 | 
						|
iyo
 | 
						|
iyon
 | 
						|
iyong
 | 
						|
ka
 | 
						|
kahit
 | 
						|
kailangan
 | 
						|
kailanman
 | 
						|
kami
 | 
						|
kanila
 | 
						|
kanilang
 | 
						|
kanino
 | 
						|
kanya
 | 
						|
kanyang
 | 
						|
kapag
 | 
						|
kapwa
 | 
						|
karamihan
 | 
						|
katiyakan
 | 
						|
katulad
 | 
						|
kaya
 | 
						|
kaysa
 | 
						|
ko
 | 
						|
kong
 | 
						|
kulang
 | 
						|
kumuha
 | 
						|
kung
 | 
						|
laban
 | 
						|
lahat
 | 
						|
lamang
 | 
						|
likod
 | 
						|
lima
 | 
						|
maaari
 | 
						|
maaaring
 | 
						|
maging
 | 
						|
mahusay
 | 
						|
makita
 | 
						|
marami
 | 
						|
marapat
 | 
						|
masyado
 | 
						|
may
 | 
						|
mayroon
 | 
						|
mga
 | 
						|
minsan
 | 
						|
mismo
 | 
						|
mula
 | 
						|
muli
 | 
						|
na
 | 
						|
nabanggit
 | 
						|
naging
 | 
						|
nagkaroon
 | 
						|
nais
 | 
						|
nakita
 | 
						|
namin
 | 
						|
napaka
 | 
						|
narito
 | 
						|
nasaan
 | 
						|
ng
 | 
						|
ngayon
 | 
						|
ni
 | 
						|
nila
 | 
						|
nilang
 | 
						|
nito
 | 
						|
niya
 | 
						|
niyang
 | 
						|
noon
 | 
						|
o
 | 
						|
pa
 | 
						|
paano
 | 
						|
pababa
 | 
						|
paggawa
 | 
						|
pagitan
 | 
						|
pagkakaroon
 | 
						|
pagkatapos
 | 
						|
palabas
 | 
						|
pamamagitan
 | 
						|
panahon
 | 
						|
pangalawa
 | 
						|
para
 | 
						|
paraan
 | 
						|
pareho
 | 
						|
pataas
 | 
						|
pero
 | 
						|
pumunta
 | 
						|
pumupunta
 | 
						|
sa
 | 
						|
saan
 | 
						|
sabi
 | 
						|
sabihin
 | 
						|
sarili
 | 
						|
sila
 | 
						|
sino
 | 
						|
siya
 | 
						|
tatlo
 | 
						|
tayo
 | 
						|
tulad
 | 
						|
tungkol
 | 
						|
una
 | 
						|
walang
 | 
						|
""".split()
 | 
						|
)
 |