mirror of
				https://github.com/explosion/spaCy.git
				synced 2025-11-01 00:17:44 +03:00 
			
		
		
		
	* Remove unicode declarations * Remove Python 3.5 and 2.7 from CI * Don't require pathlib * Replace compat helpers * Remove OrderedDict * Use f-strings * Set Cython compiler language level * Fix typo * Re-add OrderedDict for Table * Update setup.cfg * Revert CONTRIBUTING.md * Revert lookups.md * Revert top-level.md * Small adjustments and docs [ci skip]
		
			
				
	
	
		
			152 lines
		
	
	
		
			965 B
		
	
	
	
		
			Python
		
	
	
	
	
	
			
		
		
	
	
			152 lines
		
	
	
		
			965 B
		
	
	
	
		
			Python
		
	
	
	
	
	
| STOP_WORDS = set(
 | |
|     """
 | |
| akin
 | |
| aking
 | |
| ako
 | |
| alin
 | |
| am
 | |
| amin
 | |
| aming
 | |
| ang
 | |
| ano
 | |
| anumang
 | |
| apat
 | |
| at
 | |
| atin
 | |
| ating
 | |
| ay
 | |
| bababa
 | |
| bago
 | |
| bakit
 | |
| bawat
 | |
| bilang
 | |
| dahil
 | |
| dalawa
 | |
| dapat
 | |
| din
 | |
| dito
 | |
| doon
 | |
| gagawin
 | |
| gayunman
 | |
| ginagawa
 | |
| ginawa
 | |
| ginawang
 | |
| gumawa
 | |
| gusto
 | |
| habang
 | |
| hanggang
 | |
| hindi
 | |
| huwag
 | |
| iba
 | |
| ibaba
 | |
| ibabaw
 | |
| ibig
 | |
| ikaw
 | |
| ilagay
 | |
| ilalim
 | |
| ilan
 | |
| inyong
 | |
| isa
 | |
| isang
 | |
| itaas
 | |
| ito
 | |
| iyo
 | |
| iyon
 | |
| iyong
 | |
| ka
 | |
| kahit
 | |
| kailangan
 | |
| kailanman
 | |
| kami
 | |
| kanila
 | |
| kanilang
 | |
| kanino
 | |
| kanya
 | |
| kanyang
 | |
| kapag
 | |
| kapwa
 | |
| karamihan
 | |
| katiyakan
 | |
| katulad
 | |
| kaya
 | |
| kaysa
 | |
| ko
 | |
| kong
 | |
| kulang
 | |
| kumuha
 | |
| kung
 | |
| laban
 | |
| lahat
 | |
| lamang
 | |
| likod
 | |
| lima
 | |
| maaari
 | |
| maaaring
 | |
| maging
 | |
| mahusay
 | |
| makita
 | |
| marami
 | |
| marapat
 | |
| masyado
 | |
| may
 | |
| mayroon
 | |
| mga
 | |
| minsan
 | |
| mismo
 | |
| mula
 | |
| muli
 | |
| na
 | |
| nabanggit
 | |
| naging
 | |
| nagkaroon
 | |
| nais
 | |
| nakita
 | |
| namin
 | |
| napaka
 | |
| narito
 | |
| nasaan
 | |
| ng
 | |
| ngayon
 | |
| ni
 | |
| nila
 | |
| nilang
 | |
| nito
 | |
| niya
 | |
| niyang
 | |
| noon
 | |
| o
 | |
| pa
 | |
| paano
 | |
| pababa
 | |
| paggawa
 | |
| pagitan
 | |
| pagkakaroon
 | |
| pagkatapos
 | |
| palabas
 | |
| pamamagitan
 | |
| panahon
 | |
| pangalawa
 | |
| para
 | |
| paraan
 | |
| pareho
 | |
| pataas
 | |
| pero
 | |
| pumunta
 | |
| pumupunta
 | |
| sa
 | |
| saan
 | |
| sabi
 | |
| sabihin
 | |
| sarili
 | |
| sila
 | |
| sino
 | |
| siya
 | |
| tatlo
 | |
| tayo
 | |
| tulad
 | |
| tungkol
 | |
| una
 | |
| walang
 | |
| """.split()
 | |
| )
 |