javascript - 如何用scrapy 抓取js生成的页面?
高洛峰
高洛峰 2017-04-10 14:54:06
[JavaScript讨论组]

有些页面通过诸如js的writeline生成,数据都是来自后台,在前台的“查看源代码”中无法看到。

像这些页面如果直接抓取,是行不通的。

通过在sf上查找,发现需要加scrapy的中间件,在分析之前,先要把js的内容解析出来。

网上说的比较多的是webkit,但都通通指向同一个内容:链接不一样,内容基本一样,而且说的比较简单,这里想请教大家,能不能说的具体一点?

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全部回复(1)
黄舟

尝试抓包获取数据api接口 直接对api接口 scrapy 基本百发百中...
真不行再webkit模拟...

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号