扫码关注官方订阅号
最近用python写了一个爬虫模拟登陆后爬取某网站的信息,一开始是可以成功抓取到信息的,但抓了几百条之后发现又变成未登陆状态了(通过print抓取页面的内容发现不是想要抓取的页面,而是跳转的登陆页面)。请问有人遇到过这种情况么?怎么解决的?多谢~~
人生最曼妙的风景,竟是内心的淡定与从容!
1.cookies或seesion过期了。那就过一会重新登陆下。2.频率过快被发现了。调慢些。
说个通用的方法:判断输出的内容是登陆页就是重新登陆,继续抓取。
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
1.cookies或seesion过期了。那就过一会重新登陆下。
2.频率过快被发现了。调慢些。
说个通用的方法:
判断输出的内容是登陆页就是重新登陆,继续抓取。