python - scrapy 如何抓js渲染出来的内容?
黄舟
黄舟 2017-04-18 10:10:37
[Python讨论组]

最近在写一个项目,要放到服务器上每天定时自己爬数据,然后放到数据库。在用scrapy抓的时候,发现js解析不了,查了文档,发现scrapy本身不能解析js。
然后查了一些模块,资料不多,也是一直半解。
现在需要解决以下几个问题:

1.可以在linux服务器上运行,不要再装个浏览器,然后通过打开浏览器解析。
2.如果能解决爬取时候阻塞问题更好。

另外相关的模块也查到了几个,但是搞不清用哪个能解决上面两个问题,麻烦各位求解。

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全部回复(1)
伊谢尔伦

使用phantomjs。安装selenium模块,然后

from selenium import webdriver
driver = webdriver.PhantomJS() 
driver.get(url)
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号