正则表达式 - python 正则 中文网页
阿神
阿神 2017-04-17 15:15:21
[Python讨论组]
<span class="pl">制片国家/地区:</span> 美国 / 澳大利亚<br/>

如上网页中的字符串,如何用正则提取出美国和澳大利亚。
初学,研究了半天没头绪。。。。

阿神
阿神

闭关修行中......

全部回复(1)
天蓬老师
Python 2.7.6 (default, Sep  9 2014, 15:04:36) 
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.39)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>> html = '<span class="pl">制片国家/地区:</span> 美国 / 澳大利亚<br/>'
>>> re.findall(r'制片国家/地区:</span>(.*?)<br/>', html)
[' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a']
>>> re.findall(r'制片国家/地区:</span>(.*?)<br/>', html)[0]
' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a'

试一下,这种

In[5]: re.findall(ur'制片国家/地区:</span>(.*?)<br/>', html)
Out[5]: [u' \u7f8e\u56fd / \u6fb3\u5927\u5229\u4e9a']
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号