python - scrapy 在爬取携程时,被重定向到了一个有验证码的页面怎么办?
大家讲道理
大家讲道理 2017-04-18 10:11:24
[Python讨论组]

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全部回复(2)
巴扎黑

降低你的爬去频率,或者使用多IP 代理。

ringa_lee

如果验证码比较复杂的话,可以使用各种打码平台提供的验证码识别API(可能收费)。
比较简单的可以使用pytesseract库进行识别(可参考https://www.waitalone.cn/pyth...)。
主要思路就是将验证码下载下来,注意保存cookie或session,然后识别验证码,提交结果带上相关cookie或session。
想要减少验证的次数可以试着更换代理IP,设置爬虫间隔,更换User-Agent等操作。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号