python - 使用BeautifulSoup时对于overflow为hidden的怎么获取?
怪我咯
怪我咯 2017-04-18 09:45:39
[Python讨论组]

如果直接用requests,get以后,再用BeautifulSoup去处理,是找不到hidden的内容的。
如图所示:


我想获取openBacklog里的内容,求教!

本人不是做前端的,所以对前端的东东不是很专业,还望各位大神不吝赐教。

怪我咯
怪我咯

走同样的路,发现不同的人生

全部回复(3)
天蓬老师

如果仅仅是获取内容,我觉得最好的方式是用正则的方式提取:

import re

string = soup.prettify()
match = re.search('openBacklog\("(.*?)"\)', string)
print(match.group(1)) 
ringa_lee

有可能是, gets得到的源码本身就不全,有一些源码是js生成的,所以跟你查看dom的不一样。


两种方式吧

  1. 分析js产生的机制,主要是抓包,看看数据怎么通过哪些请求到js的,然后去模拟请求

  2. 使用selenium+plantomjs傻瓜式的抓取

高洛峰

给源地址才好帮你测试,

你右键点页面,选察看网页源代码,看看有没有你想要的内容在里面?
如果没有,说明是js动态生成的。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号