扫码关注官方订阅号
比如我爬去了豆瓣的Top100页面,将每本书的详情页面的URL存入MongoDB中,然后我用Redis去重。然后从Redis中获取url去爬详细的数据。现在有个问题
在Scrapy中,怎么处理MongoDB中url字段的值进入Redis。或许说。Scrapy怎么从数据库中获取url。
谢谢
认证0级讲师
在start_requests写不行吗?比如
def start_requests(self):
r = Redis.Redis() while true: url = r.lpop('xxxx') yield scrapy.Request(url)
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
在start_requests写不行吗?
比如
def start_requests(self):