扫码关注官方订阅号
<span class="pl">制片国家/地区:</span> 美国 / 澳大利亚<br/>
如上网页中的字符串,如何用正则提取出美国和澳大利亚。 初学,研究了半天没头绪。。。。
闭关修行中......
Python 2.7.6 (default, Sep 9 2014, 15:04:36) [GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.39)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> import re >>> html = '<span class="pl">制片国家/地区:</span> 美国 / 澳大利亚<br/>' >>> re.findall(r'制片国家/地区:</span>(.*?)<br/>', html) [' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a'] >>> re.findall(r'制片国家/地区:</span>(.*?)<br/>', html)[0] ' \xe7\xbe\x8e\xe5\x9b\xbd / \xe6\xbe\xb3\xe5\xa4\xa7\xe5\x88\xa9\xe4\xba\x9a'
试一下,这种
In[5]: re.findall(ur'制片国家/地区:</span>(.*?)<br/>', html) Out[5]: [u' \u7f8e\u56fd / \u6fb3\u5927\u5229\u4e9a']
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
试一下,这种