mirror of
				https://github.com/explosion/spaCy.git
				synced 2025-11-04 01:48:04 +03:00 
			
		
		
		
	* Serbian stopwords added. (cyrillic alphabet) * spaCy Contribution agreement included. * Test initialize updated * Serbian language code update. --bugfix * Tokenizer exceptions added. Init file updated. * Norm exceptions and lexical attributes added. * Examples added. * Tests added. * sr_lang examples update. * Tokenizer exceptions updated. (Serbian) * Lemmatizer created. Licence included. * Test updated. * Tag map basic added. * tag_map.py file removed since it uses default spacy tags.
		
			
				
	
	
		
			26 lines
		
	
	
		
			967 B
		
	
	
	
		
			Python
		
	
	
	
	
	
			
		
		
	
	
			26 lines
		
	
	
		
			967 B
		
	
	
	
		
			Python
		
	
	
	
	
	
# coding: utf8
 | 
						||
from __future__ import unicode_literals
 | 
						||
 | 
						||
 | 
						||
"""
 | 
						||
Example sentences to test spaCy and its language models.
 | 
						||
 | 
						||
>>> from spacy.lang.sr.examples import sentences
 | 
						||
>>> docs = nlp.pipe(sentences)
 | 
						||
"""
 | 
						||
 | 
						||
 | 
						||
sentences = [
 | 
						||
    # Translations from English
 | 
						||
    "Apple планира куповину америчког стартапа за $1 милијарду.",
 | 
						||
    "Беспилотни аутомобили пребацују одговорност осигурања на произвођаче.",
 | 
						||
    "Лондон је велики град у Уједињеном Краљевству.",
 | 
						||
    "Где си ти?",
 | 
						||
    "Ко је председник Француске?",
 | 
						||
    # Serbian common and slang
 | 
						||
    "Moj ћале је инжењер!",
 | 
						||
    "Новак Ђоковић је најбољи тенисер света.",
 | 
						||
    "У Пироту има добрих кафана!",
 | 
						||
    "Музеј Николе Тесле се налази у Београду.",
 | 
						||
]
 |