mirror of
				https://github.com/explosion/spaCy.git
				synced 2025-10-31 16:07:41 +03:00 
			
		
		
		
	* Serbian stopwords added. (cyrillic alphabet) * spaCy Contribution agreement included. * Test initialize updated * Serbian language code update. --bugfix * Tokenizer exceptions added. Init file updated. * Norm exceptions and lexical attributes added. * Examples added. * Tests added. * sr_lang examples update. * Tokenizer exceptions updated. (Serbian) * Lemmatizer created. Licence included. * Test updated. * Tag map basic added. * tag_map.py file removed since it uses default spacy tags.
		
			
				
	
	
		
			26 lines
		
	
	
		
			967 B
		
	
	
	
		
			Python
		
	
	
	
	
	
			
		
		
	
	
			26 lines
		
	
	
		
			967 B
		
	
	
	
		
			Python
		
	
	
	
	
	
| # coding: utf8
 | ||
| from __future__ import unicode_literals
 | ||
| 
 | ||
| 
 | ||
| """
 | ||
| Example sentences to test spaCy and its language models.
 | ||
| 
 | ||
| >>> from spacy.lang.sr.examples import sentences
 | ||
| >>> docs = nlp.pipe(sentences)
 | ||
| """
 | ||
| 
 | ||
| 
 | ||
| sentences = [
 | ||
|     # Translations from English
 | ||
|     "Apple планира куповину америчког стартапа за $1 милијарду.",
 | ||
|     "Беспилотни аутомобили пребацују одговорност осигурања на произвођаче.",
 | ||
|     "Лондон је велики град у Уједињеном Краљевству.",
 | ||
|     "Где си ти?",
 | ||
|     "Ко је председник Француске?",
 | ||
|     # Serbian common and slang
 | ||
|     "Moj ћале је инжењер!",
 | ||
|     "Новак Ђоковић је најбољи тенисер света.",
 | ||
|     "У Пироту има добрих кафана!",
 | ||
|     "Музеј Николе Тесле се налази у Београду.",
 | ||
| ]
 |