扫码关注官方订阅号
人生最曼妙的风景,竟是内心的淡定与从容!
之前仔细翻阅过bs4的官方文档,发现了几个小问题。
你的用法还是bs3的用法,新调用语句是soup = BeautifulSoup(html, 'html5lib');
soup = BeautifulSoup(html, 'html5lib')
最重要的是,你用了urlopen(),但是没有用read()读出源码。。。
urlopen()
read()
有时候输不出东西或者输错东西时候,绝大多数是bs4的编码问题,它除了几个特定的IO之外几乎都是unicode编码
写程序,功能分步骤来嘛。就像走路,想'走'到街对面至少得一步步的'走'。那么对于你的代码
request=urllib2.Request(url,headers=headers) response=urllib2.urlopen(request) content=BeautifulSoup(response)
3行代码,分割即为两部分。1、页面请求2、结果分析
那么就找问题点一个个分析排除好了,盯着最终的结果是得不到答案的。
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
之前仔细翻阅过bs4的官方文档,发现了几个小问题。
你的用法还是bs3的用法,新调用语句是
soup = BeautifulSoup(html, 'html5lib');最重要的是,你用了
urlopen(),但是没有用read()读出源码。。。有时候输不出东西或者输错东西时候,绝大多数是bs4的编码问题,它除了几个特定的IO之外几乎都是unicode编码
写程序,功能分步骤来嘛。
就像走路,想'走'到街对面至少得一步步的'走'。
那么对于你的代码
3行代码,分割即为两部分。
1、页面请求
2、结果分析
那么就找问题点一个个分析排除好了,盯着最终的结果是得不到答案的。