mirror of
				https://github.com/explosion/spaCy.git
				synced 2025-11-04 09:57:26 +03:00 
			
		
		
		
	Update docs [ci skip]
This commit is contained in:
		
							parent
							
								
									f976bab710
								
							
						
					
					
						commit
						d8f661c910
					
				| 
						 | 
					@ -8,7 +8,7 @@ be used in real products.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
spaCy comes with
 | 
					spaCy comes with
 | 
				
			||||||
[pretrained pipelines](https://spacy.io/models) and vectors, and
 | 
					[pretrained pipelines](https://spacy.io/models) and vectors, and
 | 
				
			||||||
currently supports tokenization for **59+ languages**. It features
 | 
					currently supports tokenization for **60+ languages**. It features
 | 
				
			||||||
state-of-the-art speed, convolutional **neural network models** for tagging,
 | 
					state-of-the-art speed, convolutional **neural network models** for tagging,
 | 
				
			||||||
parsing, **named entity recognition**, **text classification** and more, multi-task learning with pretrained **transformers** like BERT, as well as a production-ready training system and easy model packaging, deployment and workflow management.
 | 
					parsing, **named entity recognition**, **text classification** and more, multi-task learning with pretrained **transformers** like BERT, as well as a production-ready training system and easy model packaging, deployment and workflow management.
 | 
				
			||||||
spaCy is commercial open-source software, released under the MIT license.
 | 
					spaCy is commercial open-source software, released under the MIT license.
 | 
				
			||||||
| 
						 | 
					@ -69,7 +69,7 @@ it.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
## Features
 | 
					## Features
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- Support for **59+ languages**
 | 
					- Support for **60+ languages**
 | 
				
			||||||
- **Trained pipelines**
 | 
					- **Trained pipelines**
 | 
				
			||||||
- Multi-task learning with pretrained **transformers** like BERT
 | 
					- Multi-task learning with pretrained **transformers** like BERT
 | 
				
			||||||
- Pretrained **word vectors**
 | 
					- Pretrained **word vectors**
 | 
				
			||||||
| 
						 | 
					
 | 
				
			||||||
| 
						 | 
					@ -1,21 +1,11 @@
 | 
				
			||||||
{
 | 
					{
 | 
				
			||||||
    "languages": [
 | 
					    "languages": [
 | 
				
			||||||
        {
 | 
					        { "code": "af", "name": "Afrikaans" },
 | 
				
			||||||
            "code": "zh",
 | 
					        { "code": "ar", "name": "Arabic", "example": "هذه جملة", "has_examples": true },
 | 
				
			||||||
            "name": "Chinese",
 | 
					        { "code": "bg", "name": "Bulgarian", "example": "Това е изречение", "has_examples": true },
 | 
				
			||||||
            "models": ["zh_core_web_sm", "zh_core_web_md", "zh_core_web_lg"],
 | 
					        { "code": "bn", "name": "Bengali", "has_examples": true },
 | 
				
			||||||
            "dependencies": [
 | 
					        { "code": "ca", "name": "Catalan", "example": "Això és una frase.", "has_examples": true },
 | 
				
			||||||
                {
 | 
					        { "code": "cs", "name": "Czech", "has_examples": true },
 | 
				
			||||||
                    "name": "Jieba",
 | 
					 | 
				
			||||||
                    "url": "https://github.com/fxsjy/jieba"
 | 
					 | 
				
			||||||
                },
 | 
					 | 
				
			||||||
                {
 | 
					 | 
				
			||||||
                    "name": "PKUSeg",
 | 
					 | 
				
			||||||
                    "url": "https://github.com/lancopku/PKUSeg-python"
 | 
					 | 
				
			||||||
                }
 | 
					 | 
				
			||||||
            ],
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "da",
 | 
					            "code": "da",
 | 
				
			||||||
            "name": "Danish",
 | 
					            "name": "Danish",
 | 
				
			||||||
| 
						 | 
					@ -23,39 +13,10 @@
 | 
				
			||||||
            "has_examples": true,
 | 
					            "has_examples": true,
 | 
				
			||||||
            "models": ["da_core_news_sm", "da_core_news_md", "da_core_news_lg"]
 | 
					            "models": ["da_core_news_sm", "da_core_news_md", "da_core_news_lg"]
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "nl",
 | 
					 | 
				
			||||||
            "name": "Dutch",
 | 
					 | 
				
			||||||
            "models": ["nl_core_news_sm", "nl_core_news_md", "nl_core_news_lg"],
 | 
					 | 
				
			||||||
            "example": "Dit is een zin.",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "en",
 | 
					 | 
				
			||||||
            "name": "English",
 | 
					 | 
				
			||||||
            "models": ["en_core_web_sm", "en_core_web_md", "en_core_web_lg"],
 | 
					 | 
				
			||||||
            "starters": [
 | 
					 | 
				
			||||||
                "en_vectors_web_lg",
 | 
					 | 
				
			||||||
                "en_trf_bertbaseuncased_lg",
 | 
					 | 
				
			||||||
                "en_trf_robertabase_lg",
 | 
					 | 
				
			||||||
                "en_trf_distilbertbaseuncased_lg",
 | 
					 | 
				
			||||||
                "en_trf_xlnetbasecased_lg"
 | 
					 | 
				
			||||||
            ],
 | 
					 | 
				
			||||||
            "example": "This is a sentence.",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "fr",
 | 
					 | 
				
			||||||
            "name": "French",
 | 
					 | 
				
			||||||
            "models": ["fr_core_news_sm", "fr_core_news_md", "fr_core_news_lg"],
 | 
					 | 
				
			||||||
            "example": "C'est une phrase.",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "de",
 | 
					            "code": "de",
 | 
				
			||||||
            "name": "German",
 | 
					            "name": "German",
 | 
				
			||||||
            "models": ["de_core_news_sm", "de_core_news_md", "de_core_news_lg"],
 | 
					            "models": ["de_core_news_sm", "de_core_news_md", "de_core_news_lg", "de_dep_news_trf"],
 | 
				
			||||||
            "starters": ["de_trf_bertbasecased_lg"],
 | 
					 | 
				
			||||||
            "example": "Dies ist ein Satz.",
 | 
					            "example": "Dies ist ein Satz.",
 | 
				
			||||||
            "has_examples": true
 | 
					            "has_examples": true
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
| 
						 | 
					@ -66,6 +27,46 @@
 | 
				
			||||||
            "example": "Αυτή είναι μια πρόταση.",
 | 
					            "example": "Αυτή είναι μια πρόταση.",
 | 
				
			||||||
            "has_examples": true
 | 
					            "has_examples": true
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "en",
 | 
				
			||||||
 | 
					            "name": "English",
 | 
				
			||||||
 | 
					            "models": ["en_core_web_sm", "en_core_web_md", "en_core_web_lg", "en_core_web_trf"],
 | 
				
			||||||
 | 
					            "starters": ["en_vectors_web_lg"],
 | 
				
			||||||
 | 
					            "example": "This is a sentence.",
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "es",
 | 
				
			||||||
 | 
					            "name": "Spanish",
 | 
				
			||||||
 | 
					            "models": ["es_core_news_sm", "es_core_news_md", "es_core_news_lg", "es_dep_news_trf"],
 | 
				
			||||||
 | 
					            "example": "Esto es una frase.",
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "et", "name": "Estonian" },
 | 
				
			||||||
 | 
					        { "code": "eu", "name": "Basque", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "fa", "name": "Persian", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "fi", "name": "Finnish", "has_examples": true },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "fr",
 | 
				
			||||||
 | 
					            "name": "French",
 | 
				
			||||||
 | 
					            "models": ["fr_core_news_sm", "fr_core_news_md", "fr_core_news_lg", "fr_dep_news_trf"],
 | 
				
			||||||
 | 
					            "example": "C'est une phrase.",
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "ga", "name": "Irish" },
 | 
				
			||||||
 | 
					        { "code": "gu", "name": "Gujarati", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "he", "name": "Hebrew", "example": "זהו משפט.", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "hi", "name": "Hindi", "example": "यह एक वाक्य है।", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "hr", "name": "Croatian", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "hu", "name": "Hungarian", "example": "Ez egy mondat.", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "hy", "name": "Armenian", "has_examples": true },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "id",
 | 
				
			||||||
 | 
					            "name": "Indonesian",
 | 
				
			||||||
 | 
					            "example": "Ini adalah sebuah kalimat.",
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "is", "name": "Icelandic" },
 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "it",
 | 
					            "code": "it",
 | 
				
			||||||
            "name": "Italian",
 | 
					            "name": "Italian",
 | 
				
			||||||
| 
						 | 
					@ -88,12 +89,37 @@
 | 
				
			||||||
            "example": "これは文章です。",
 | 
					            "example": "これは文章です。",
 | 
				
			||||||
            "has_examples": true
 | 
					            "has_examples": true
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "kn", "name": "Kannada", "has_examples": true },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "ko",
 | 
				
			||||||
 | 
					            "name": "Korean",
 | 
				
			||||||
 | 
					            "dependencies": [
 | 
				
			||||||
 | 
					                {
 | 
				
			||||||
 | 
					                    "name": "mecab-ko",
 | 
				
			||||||
 | 
					                    "url": "https://bitbucket.org/eunjeon/mecab-ko/src/master/README.md"
 | 
				
			||||||
 | 
					                },
 | 
				
			||||||
 | 
					                { "name": "mecab-ko-dic", "url": "https://bitbucket.org/eunjeon/mecab-ko-dic" },
 | 
				
			||||||
 | 
					                { "name": "natto-py", "url": "https://github.com/buruzaemon/natto-py" }
 | 
				
			||||||
 | 
					            ],
 | 
				
			||||||
 | 
					            "example": "이것은 문장입니다.",
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "lb", "name": "Luxembourgish", "has_examples": true },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "lij",
 | 
				
			||||||
 | 
					            "name": "Ligurian",
 | 
				
			||||||
 | 
					            "example": "Sta chì a l'é unna fraxe.",
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "lt",
 | 
					            "code": "lt",
 | 
				
			||||||
            "name": "Lithuanian",
 | 
					            "name": "Lithuanian",
 | 
				
			||||||
            "has_examples": true,
 | 
					            "has_examples": true,
 | 
				
			||||||
            "models": ["lt_core_news_sm", "lt_core_news_md", "lt_core_news_lg"]
 | 
					            "models": ["lt_core_news_sm", "lt_core_news_md", "lt_core_news_lg"]
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "lv", "name": "Latvian" },
 | 
				
			||||||
 | 
					        { "code": "ml", "name": "Malayalam", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "mr", "name": "Marathi" },
 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "nb",
 | 
					            "code": "nb",
 | 
				
			||||||
            "name": "Norwegian Bokmål",
 | 
					            "name": "Norwegian Bokmål",
 | 
				
			||||||
| 
						 | 
					@ -101,6 +127,14 @@
 | 
				
			||||||
            "has_examples": true,
 | 
					            "has_examples": true,
 | 
				
			||||||
            "models": ["nb_core_news_sm", "nb_core_news_md", "nb_core_news_lg"]
 | 
					            "models": ["nb_core_news_sm", "nb_core_news_md", "nb_core_news_lg"]
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "ne", "name": "Nepali", "has_examples": true },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "nl",
 | 
				
			||||||
 | 
					            "name": "Dutch",
 | 
				
			||||||
 | 
					            "models": ["nl_core_news_sm", "nl_core_news_md", "nl_core_news_lg"],
 | 
				
			||||||
 | 
					            "example": "Dit is een zin.",
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "pl",
 | 
					            "code": "pl",
 | 
				
			||||||
            "name": "Polish",
 | 
					            "name": "Polish",
 | 
				
			||||||
| 
						 | 
					@ -122,69 +156,26 @@
 | 
				
			||||||
            "has_examples": true,
 | 
					            "has_examples": true,
 | 
				
			||||||
            "models": ["ro_core_news_sm", "ro_core_news_md", "ro_core_news_lg"]
 | 
					            "models": ["ro_core_news_sm", "ro_core_news_md", "ro_core_news_lg"]
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "es",
 | 
					 | 
				
			||||||
            "name": "Spanish",
 | 
					 | 
				
			||||||
            "models": ["es_core_news_sm", "es_core_news_md", "es_core_news_lg"],
 | 
					 | 
				
			||||||
            "example": "Esto es una frase.",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        { "code": "sv", "name": "Swedish", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "fi", "name": "Finnish", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "hu", "name": "Hungarian", "example": "Ez egy mondat.", "has_examples": true },
 | 
					 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "ru",
 | 
					            "code": "ru",
 | 
				
			||||||
            "name": "Russian",
 | 
					            "name": "Russian",
 | 
				
			||||||
            "has_examples": true,
 | 
					            "has_examples": true,
 | 
				
			||||||
            "dependencies": [{ "name": "pymorphy2", "url": "https://github.com/kmike/pymorphy2" }]
 | 
					            "dependencies": [{ "name": "pymorphy2", "url": "https://github.com/kmike/pymorphy2" }]
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
        {
 | 
					        { "code": "sa", "name": "Sanskrit", "has_examples": true },
 | 
				
			||||||
            "code": "uk",
 | 
					 | 
				
			||||||
            "name": "Ukrainian",
 | 
					 | 
				
			||||||
            "has_examples": true,
 | 
					 | 
				
			||||||
            "dependencies": [{ "name": "pymorphy2", "url": "https://github.com/kmike/pymorphy2" }]
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        { "code": "hr", "name": "Croatian", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "eu", "name": "Basque", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "yo", "name": "Yoruba", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "tr", "name": "Turkish", "example": "Bu bir cümledir.", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "ca", "name": "Catalan", "example": "Això és una frase.", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "he", "name": "Hebrew", "example": "זהו משפט.", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "ar", "name": "Arabic", "example": "هذه جملة", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "fa", "name": "Persian", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "ur", "name": "Urdu", "example": "یہ ایک جملہ ہے", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "tt", "name": "Tatar", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "te", "name": "Telugu", "example": "ఇది ఒక వాక్యం.", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "si", "name": "Sinhala", "example": "මෙය වාක්යයකි.", "has_examples": true },
 | 
					        { "code": "si", "name": "Sinhala", "example": "මෙය වාක්යයකි.", "has_examples": true },
 | 
				
			||||||
        { "code": "ga", "name": "Irish" },
 | 
					        { "code": "sk", "name": "Slovak", "has_examples": true },
 | 
				
			||||||
        { "code": "bn", "name": "Bengali", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "hi", "name": "Hindi", "example": "यह एक वाक्य है।", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "mr", "name": "Marathi" },
 | 
					 | 
				
			||||||
        { "code": "kn", "name": "Kannada" },
 | 
					 | 
				
			||||||
        { "code": "ta", "name": "Tamil", "has_examples": true },
 | 
					 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "id",
 | 
					 | 
				
			||||||
            "name": "Indonesian",
 | 
					 | 
				
			||||||
            "example": "Ini adalah sebuah kalimat.",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        { "code": "tl", "name": "Tagalog" },
 | 
					 | 
				
			||||||
        { "code": "af", "name": "Afrikaans" },
 | 
					 | 
				
			||||||
        { "code": "bg", "name": "Bulgarian", "example": "Това е изречение", "has_examples": true },
 | 
					 | 
				
			||||||
        { "code": "cs", "name": "Czech" },
 | 
					 | 
				
			||||||
        { "code": "is", "name": "Icelandic" },
 | 
					 | 
				
			||||||
        { "code": "lv", "name": "Latvian" },
 | 
					 | 
				
			||||||
        { "code": "sr", "name": "Serbian" },
 | 
					 | 
				
			||||||
        { "code": "sk", "name": "Slovak" },
 | 
					 | 
				
			||||||
        { "code": "sl", "name": "Slovenian" },
 | 
					        { "code": "sl", "name": "Slovenian" },
 | 
				
			||||||
        { "code": "lb", "name": "Luxembourgish" },
 | 
					 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "sq",
 | 
					            "code": "sq",
 | 
				
			||||||
            "name": "Albanian",
 | 
					            "name": "Albanian",
 | 
				
			||||||
            "example": "Kjo është një fjali.",
 | 
					            "example": "Kjo është një fjali.",
 | 
				
			||||||
            "has_examples": true
 | 
					            "has_examples": true
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
        { "code": "et", "name": "Estonian" },
 | 
					        { "code": "sr", "name": "Serbian", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "sv", "name": "Swedish", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "ta", "name": "Tamil", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "te", "name": "Telugu", "example": "ఇది ఒక వాక్యం.", "has_examples": true },
 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "th",
 | 
					            "code": "th",
 | 
				
			||||||
            "name": "Thai",
 | 
					            "name": "Thai",
 | 
				
			||||||
| 
						 | 
					@ -194,51 +185,43 @@
 | 
				
			||||||
            "example": "นี่คือประโยค",
 | 
					            "example": "นี่คือประโยค",
 | 
				
			||||||
            "has_examples": true
 | 
					            "has_examples": true
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "tl", "name": "Tagalog" },
 | 
				
			||||||
 | 
					        { "code": "tr", "name": "Turkish", "example": "Bu bir cümledir.", "has_examples": true },
 | 
				
			||||||
 | 
					        { "code": "tt", "name": "Tatar", "has_examples": true },
 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "ko",
 | 
					            "code": "uk",
 | 
				
			||||||
            "name": "Korean",
 | 
					            "name": "Ukrainian",
 | 
				
			||||||
            "dependencies": [
 | 
					            "has_examples": true,
 | 
				
			||||||
                {
 | 
					            "dependencies": [{ "name": "pymorphy2", "url": "https://github.com/kmike/pymorphy2" }]
 | 
				
			||||||
                    "name": "mecab-ko",
 | 
					 | 
				
			||||||
                    "url": "https://bitbucket.org/eunjeon/mecab-ko/src/master/README.md"
 | 
					 | 
				
			||||||
                },
 | 
					 | 
				
			||||||
                { "name": "mecab-ko-dic", "url": "https://bitbucket.org/eunjeon/mecab-ko-dic" },
 | 
					 | 
				
			||||||
                { "name": "natto-py", "url": "https://github.com/buruzaemon/natto-py" }
 | 
					 | 
				
			||||||
            ],
 | 
					 | 
				
			||||||
            "example": "이것은 문장입니다.",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "ur", "name": "Urdu", "example": "یہ ایک جملہ ہے", "has_examples": true },
 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "vi",
 | 
					            "code": "vi",
 | 
				
			||||||
            "name": "Vietnamese",
 | 
					            "name": "Vietnamese",
 | 
				
			||||||
            "dependencies": [{ "name": "Pyvi", "url": "https://github.com/trungtv/pyvi" }]
 | 
					            "dependencies": [{ "name": "Pyvi", "url": "https://github.com/trungtv/pyvi" }]
 | 
				
			||||||
        },
 | 
					        },
 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "lij",
 | 
					 | 
				
			||||||
            "name": "Ligurian",
 | 
					 | 
				
			||||||
            "example": "Sta chì a l'é unna fraxe.",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "hy",
 | 
					 | 
				
			||||||
            "name": "Armenian",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "gu",
 | 
					 | 
				
			||||||
            "name": "Gujarati",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					 | 
				
			||||||
            "code": "ml",
 | 
					 | 
				
			||||||
            "name": "Malayalam",
 | 
					 | 
				
			||||||
            "has_examples": true
 | 
					 | 
				
			||||||
        },
 | 
					 | 
				
			||||||
        {
 | 
					        {
 | 
				
			||||||
            "code": "xx",
 | 
					            "code": "xx",
 | 
				
			||||||
            "name": "Multi-language",
 | 
					            "name": "Multi-language",
 | 
				
			||||||
            "models": ["xx_ent_wiki_sm"],
 | 
					            "models": ["xx_ent_wiki_sm"],
 | 
				
			||||||
            "example": "This is a sentence about Facebook."
 | 
					            "example": "This is a sentence about Facebook."
 | 
				
			||||||
 | 
					        },
 | 
				
			||||||
 | 
					        { "code": "yo", "name": "Yoruba", "has_examples": true },
 | 
				
			||||||
 | 
					        {
 | 
				
			||||||
 | 
					            "code": "zh",
 | 
				
			||||||
 | 
					            "name": "Chinese",
 | 
				
			||||||
 | 
					            "models": ["zh_core_web_sm", "zh_core_web_md", "zh_core_web_lg"],
 | 
				
			||||||
 | 
					            "dependencies": [
 | 
				
			||||||
 | 
					                {
 | 
				
			||||||
 | 
					                    "name": "Jieba",
 | 
				
			||||||
 | 
					                    "url": "https://github.com/fxsjy/jieba"
 | 
				
			||||||
 | 
					                },
 | 
				
			||||||
 | 
					                {
 | 
				
			||||||
 | 
					                    "name": "PKUSeg",
 | 
				
			||||||
 | 
					                    "url": "https://github.com/lancopku/PKUSeg-python"
 | 
				
			||||||
 | 
					                }
 | 
				
			||||||
 | 
					            ],
 | 
				
			||||||
 | 
					            "has_examples": true
 | 
				
			||||||
        }
 | 
					        }
 | 
				
			||||||
    ],
 | 
					    ],
 | 
				
			||||||
    "licenses": [
 | 
					    "licenses": [
 | 
				
			||||||
| 
						 | 
					
 | 
				
			||||||
		Loading…
	
		Reference in New Issue
	
	Block a user