mirror of
https://github.com/explosion/spaCy.git
synced 2024-12-25 17:36:30 +03:00
21 lines
849 B
Python
21 lines
849 B
Python
# coding: utf8
|
|
from __future__ import unicode_literals
|
|
|
|
|
|
"""
|
|
Example sentences to test spaCy and its language models.
|
|
|
|
>>> from spacy.lang.zh.examples import sentences
|
|
>>> docs = nlp.pipe(sentences)
|
|
"""
|
|
|
|
# from https://zh.wikipedia.org/wiki/汉语
|
|
sentences = [
|
|
"作为语言而言,为世界使用人数最多的语言,目前世界有五分之一人口做为母语。",
|
|
"汉语有多种分支,当中官话最为流行,为中华人民共和国的国家通用语言(又称为普通话)、以及中华民国的国语。",
|
|
"此外,中文还是联合国正式语文,并被上海合作组织等国际组织采用为官方语言。",
|
|
"在中国大陆,汉语通称为“汉语”。",
|
|
"在联合国、台湾、香港及澳门,通称为“中文”。",
|
|
"在新加坡及马来西亚,通称为“华语”。",
|
|
]
|