mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-16 06:37:04 +03:00
d03401f532
* Serbian stopwords added. (cyrillic alphabet) * spaCy Contribution agreement included. * Test initialize updated * Serbian language code update. --bugfix * Tokenizer exceptions added. Init file updated. * Norm exceptions and lexical attributes added. * Examples added. * Tests added. * sr_lang examples update. * Tokenizer exceptions updated. (Serbian) * Lemmatizer created. Licence included. * Test updated. * Tag map basic added. * tag_map.py file removed since it uses default spacy tags.
26 lines
967 B
Python
26 lines
967 B
Python
# coding: utf8
|
||
from __future__ import unicode_literals
|
||
|
||
|
||
"""
|
||
Example sentences to test spaCy and its language models.
|
||
|
||
>>> from spacy.lang.sr.examples import sentences
|
||
>>> docs = nlp.pipe(sentences)
|
||
"""
|
||
|
||
|
||
sentences = [
|
||
# Translations from English
|
||
"Apple планира куповину америчког стартапа за $1 милијарду.",
|
||
"Беспилотни аутомобили пребацују одговорност осигурања на произвођаче.",
|
||
"Лондон је велики град у Уједињеном Краљевству.",
|
||
"Где си ти?",
|
||
"Ко је председник Француске?",
|
||
# Serbian common and slang
|
||
"Moj ћале је инжењер!",
|
||
"Новак Ђоковић је најбољи тенисер света.",
|
||
"У Пироту има добрих кафана!",
|
||
"Музеј Николе Тесле се налази у Београду.",
|
||
]
|