mirror of
				https://github.com/explosion/spaCy.git
				synced 2025-10-25 21:21:10 +03:00 
			
		
		
		
	
		
			
				
	
	
		
			21 lines
		
	
	
		
			849 B
		
	
	
	
		
			Python
		
	
	
	
	
	
			
		
		
	
	
			21 lines
		
	
	
		
			849 B
		
	
	
	
		
			Python
		
	
	
	
	
	
| # coding: utf8
 | |
| from __future__ import unicode_literals
 | |
| 
 | |
| 
 | |
| """
 | |
| Example sentences to test spaCy and its language models.
 | |
| 
 | |
| >>> from spacy.lang.zh.examples import sentences
 | |
| >>> docs = nlp.pipe(sentences)
 | |
| """
 | |
| 
 | |
| # from https://zh.wikipedia.org/wiki/汉语
 | |
| sentences = [
 | |
|     "作为语言而言,为世界使用人数最多的语言,目前世界有五分之一人口做为母语。",
 | |
|     "汉语有多种分支,当中官话最为流行,为中华人民共和国的国家通用语言(又称为普通话)、以及中华民国的国语。",
 | |
|     "此外,中文还是联合国正式语文,并被上海合作组织等国际组织采用为官方语言。",
 | |
|     "在中国大陆,汉语通称为“汉语”。",
 | |
|     "在联合国、台湾、香港及澳门,通称为“中文”。",
 | |
|     "在新加坡及马来西亚,通称为“华语”。",
 | |
| ]
 |