扫码关注官方订阅号
我的str="【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网",使用re.split('【|】|-')分割该字符串,结果不是想象中的(红豆杉、红豆杉作用与功效、红豆杉抗癌药品、健客网四部分),而是出现乱码,请问对于中文字符的分割,应该采用什么办法?
欢迎选择我的课程,让我们一起见证您的进步~~
# -*- coding: UTF-8 -*- import re str=u"【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网" re.split(u'【|】|-|_', str) for i in re.split(u'【|】|-|_', str): print i
你该去了解一下unicode
乱码是什么?如果你是Py2.x版本的话,直接print list或者dict是会显示乱码,而print list[1]这样打印就不会。 这是Python print对于字符串处理时做出的判断,而不能代表程序本身获取到的是乱码。 建议贴代码 贴结果。
使用 unicode
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
你该去了解一下unicode
乱码是什么?如果你是Py2.x版本的话,直接print list或者dict是会显示乱码,而print list[1]这样打印就不会。
这是Python print对于字符串处理时做出的判断,而不能代表程序本身获取到的是乱码。
建议贴代码 贴结果。
使用 unicode