python正则如何匹配中文汉字 |
您所在的位置:网站首页 › 正则表达式只能是汉字 › python正则如何匹配中文汉字 |
正则表达式匹配中文汉字,在实际应用中十分常见。 比如:爬虫网页文本提取、验证用户输入标准等。 以下面文本字符串为例,匹配出astr这个字符串中的所有汉字。 import re astr = '''aaaaa何时when 杖尔看see南雪snow,我me与梅花plum blossom两白头'''下面介绍两种方法(本文环境为python3) 一、使用Unicode编码来匹配中文 常见的中文Unicode编码范围:\u4e00-\u9fa5 实现匹配代码:re.findall(’[\u4e00-\u9fa5]’, astr) import re astr = '''aaaaa何时when 杖尔看see南雪snow,我me与梅花plum blossom两白头''' res = re.findall('[\u4e00-\u9fa5]', astr) print(res)匹配结果: 匹配结果: 常见非英文字符Unicode编码范围: u4e00-u9fa5 (中文) u0800-u4e00 (日文) uac00-ud7ff(韩文) |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |