spaCy/spacy/language_data/tokenizer_exceptions.py

from __future__ import unicode_literals

import re

_URL_PATTERN = r'''
^((([A-Za-z]{3,9}:(?:\/\/)?)(?:[-;:&=\+\$,\w]+@)?[A-Za-z0-9.-]+|(?:www.|[-;:&=\+\$,\w]+@)[A-Za-z0-9.-]+)((?:\/[\+~%\/.\w\-_]*)?\??(?:[-\+=&;%@.\w_]*)#?(?:[\w]*))?)$
'''.strip()

TOKEN_MATCH = re.compile(_URL_PATTERN).match

__all__ = ['TOKEN_MATCH']
Revert "Revert "Merge remote-tracking branch 'origin/master'"" This reverts commit fb9d3bb022e89f2cd63f2dd61efcac2eeb65cff9. 2017-01-03 20:17:57 +03:00			`from __future__ import unicode_literals`

			`import re`

Reversed accidental changes. 2017-01-14 17:56:41 +03:00			`_URL_PATTERN = r'''`
			`^((([A-Za-z]{3,9}:(?:\/\/)?)(?:[-;:&=\+\$,\w]+@)?[A-Za-z0-9.-]+\|(?:www.\|[-;:&=\+\$,\w]+@)[A-Za-z0-9.-]+)((?:\/[\+~%\/.\w\-_])?\??(?:[-\+=&;%@.\w_])#?(?:[\w]*))?)$`
Revert "Revert "Merge remote-tracking branch 'origin/master'"" This reverts commit fb9d3bb022e89f2cd63f2dd61efcac2eeb65cff9. 2017-01-03 20:17:57 +03:00			`'''.strip()`

Reversed accidental changes. 2017-01-14 17:56:41 +03:00			`TOKEN_MATCH = re.compile(_URL_PATTERN).match`
Revert "Revert "Merge remote-tracking branch 'origin/master'"" This reverts commit fb9d3bb022e89f2cd63f2dd61efcac2eeb65cff9. 2017-01-03 20:17:57 +03:00
			`__all__ = ['TOKEN_MATCH']`