mirror of
https://github.com/explosion/spaCy.git
synced 2024-11-14 21:57:15 +03:00
b2b7e1f37a
* This PR adds Gujarati Language class along with - stop words * Add test for gu tokenizer
23 lines
1.2 KiB
Python
23 lines
1.2 KiB
Python
# coding: utf8
|
|
from __future__ import unicode_literals
|
|
|
|
|
|
"""
|
|
Example sentences to test spaCy and its language models.
|
|
|
|
>>> from spacy.lang.gu.examples import sentences
|
|
>>> docs = nlp.pipe(sentences)
|
|
"""
|
|
|
|
|
|
sentences = [
|
|
"લોકશાહી એ સરકારનું એક એવું તંત્ર છે જ્યાં નાગરિકો મત દ્વારા સત્તાનો ઉપયોગ કરે છે.",
|
|
"તે ગુજરાત રાજ્યના ધરમપુર શહેરમાં આવેલું હતું",
|
|
"કર્ણદેવ પહેલો સોલંકી વંશનો રાજા હતો",
|
|
"તેજપાળને બે પત્ની હતી",
|
|
"ગુજરાતમાં ભારતીય જનતા પક્ષનો ઉદય આ સમયગાળા દરમિયાન થયો",
|
|
"આંદોલનકારીઓએ ચીમનભાઇ પટેલના રાજીનામાની માંગણી કરી.",
|
|
"અહિયાં શું જોડાય છે?",
|
|
"મંદિરનો પૂર્વાભિમુખ ભાગ નાના મંડપ સાથે થોડો લંબચોરસ આકારનો છે.",
|
|
]
|