python - Beautiful Soup这个库有没有人使用？使用的人多吗？-PHP中文网问答

微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程

python - Beautiful Soup这个库有没有人使用？使用的人多吗？

怪我咯 2017-04-17 15:42:39

[Python讨论组]

478

f=open('zbl.html','r')
htm=f.read()
htm=unicode(htm,chardet.detect(htm)['encoding'])
soup=bs(htm,'lxml')
content=soup.select('.viewbox .content')[0]
imgs=content.find_all('img')
for img in imgs:
    print(img.get('src'))

zbl.html是我复制这个网页内容的源http://www.centoscn.com/CentOS/2015/0813/5995.html，
网页的内容里面有两个图片，我无论使用find_all方法还是select方法，始终都只能得到一个图片，不知道是怎么回事？
我的环境是win7+python2.7+bs4，不知是这个库不成熟，还是我的代码有点问题，求帮忙看看。

下面是命令行的输出，只有一个URL。

怪我咯

走同样的路，发现不同的人生

全部回复(1)

巴扎黑2017-04-17 15:44:39 1楼

这个库用的人还不少吧应该，我也是初学者不少人都有推荐过这个库，我给出我自己刚刚看文档写的

import urllib.request
from bs4 import BeautifulSoup
url='http://www.centoscn.com/CentOS/2015/0813/5995.html'
content=urllib.request.urlopen(url).read().decode('gbk')
soup=BeautifulSoup(content)
contents=soup.find_all('img',attrs={'src':True,'style':True})
for content in contents:
    print(content.get('src'))

我用的是python3.4
你的代码在我的环境下是没有问题的

import urllib.request
from bs4 import BeautifulSoup
url='http://www.centoscn.com/CentOS/2015/0813/5995.html'
content=urllib.request.urlopen(url).read().decode('gbk')
soup=BeautifulSoup(content)
content=soup.select('.viewbox .content')[0]
imgs=content.find_all('img')
for img in imgs:
    print(img.get('src'))

可能是你的解析器的问题，将lxml换成默认的解析器看看

赞 +0

添加回复

专题推荐

更多>

热门话题

热门教程

更多>