java - QQ空间爬虫总是被封号
黄舟
黄舟 2017-07-07 10:34:12
[Java讨论组]

抓取QQ空间说说但是 总是被封号 可以给提出一些解决方案吗?如何既可以快速 又可以不封号!谢谢啦!

代码在github上地址
https://github.com/20100507/Q...

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全部回复(1)
我想大声告诉你

反爬虫策略:

1

2

3

4

5

<code>1、识别请求头,判断是否是爬虫

2、记录请求频率、路径和访问ip,判断是否是爬虫

3、请求参数中进行加密或复杂加密,增加爬虫开发的难度(如淘宝的ua算法)

4、复杂验证码

</code>

应对反爬虫策略:

1

2

3

4

5

<code>1、在爬取过程中,适当切换代理ip

2、适当降低请求频率

3、请求头模拟成浏览器的请求,也就是用户正常访问的请求

 

</code>

你的问题,主要可以通过定时切换ip,或一旦被封再切换ip,来解决,可以考虑去“站大爷”等代理ip网站付费获取,或者去多用几个电信账号,用ASDL拨号来切换ip。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号