spaCy/spacy/tests/ja/test_tokenizer.py

mirror of https://github.com/explosion/spaCy.git synced 2024-09-22 20:09:18 +03:00
# coding: utf-8
from __future__ import unicode_literals

import pytest

def test_japanese_tokenizer(ja_tokenizer):
    tokens = ja_tokenizer("日本語だよ")
    assert len(tokens) == 3
Add basic Japanese tokenizer test 2017-06-27 19:24:25 +03:00			`# coding: utf-8`
			`from __future__ import unicode_literals`

			`import pytest`

			`def test_japanese_tokenizer(ja_tokenizer):`
			`tokens = ja_tokenizer("日本語だよ")`
			`assert len(tokens) == 3`