mirror of
				https://github.com/explosion/spaCy.git
				synced 2025-11-04 01:48:04 +03:00 
			
		
		
		
	
		
			
				
	
	
		
			48 lines
		
	
	
		
			979 B
		
	
	
	
		
			Python
		
	
	
	
	
	
			
		
		
	
	
			48 lines
		
	
	
		
			979 B
		
	
	
	
		
			Python
		
	
	
	
	
	
# encoding: utf8
 | 
						|
from __future__ import unicode_literals
 | 
						|
 | 
						|
 | 
						|
# Source: https://github.com/stopwords-iso/stopwords-da
 | 
						|
 | 
						|
STOP_WORDS = set("""
 | 
						|
ad af aldrig alle alt anden andet andre at
 | 
						|
 | 
						|
bare begge blev blive bliver
 | 
						|
 | 
						|
da de dem den denne der deres det dette dig din dine disse dit dog du
 | 
						|
 | 
						|
efter ej eller en end ene eneste enhver er et
 | 
						|
 | 
						|
far fem fik fire flere fleste for fordi forrige fra få får før
 | 
						|
 | 
						|
god godt
 | 
						|
 | 
						|
ham han hans har havde have hej helt hende hendes her hos hun hvad hvem hver
 | 
						|
hvilken hvis hvor hvordan hvorfor hvornår
 | 
						|
 | 
						|
i ikke ind ingen intet
 | 
						|
 | 
						|
ja jeg jer jeres jo
 | 
						|
 | 
						|
kan kom komme kommer kun kunne
 | 
						|
 | 
						|
lad lav lidt lige lille
 | 
						|
 | 
						|
man mand mange med meget men mens mere mig min mine mit mod må
 | 
						|
 | 
						|
ned nej ni nogen noget nogle nu ny nyt når nær næste næsten
 | 
						|
 | 
						|
og også okay om op os otte over
 | 
						|
 | 
						|
på
 | 
						|
 | 
						|
se seks selv ser ses sig sige sin sine sit skal skulle som stor store syv så
 | 
						|
sådan
 | 
						|
 | 
						|
tag tage thi ti til to tre
 | 
						|
 | 
						|
ud under
 | 
						|
 | 
						|
var ved vi vil ville vor vores være været
 | 
						|
""".split())
 |