网页爬虫 - python爬虫模拟登陆，post后如何返回retUrl-PHP中文网问答

微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

网页爬虫 - python爬虫模拟登陆，post后如何返回retUrl

天蓬老师 2017-04-17 15:44:04

[Python讨论组]

553

想模拟登陆网站，但登陆网站的页面post发送的密码是经过加密的，并且每次都不重复，post会得到retUrl，里面含有get所需要的信息，但是通过爬虫所获取的并没有retUrl，请问如何获取所需信息

ps：菜鸟一枚，发问题时候才发现了都是随机的，所以代码不对，请勿吐槽，只是想问如何获取到retUrl，而不是图上信息

天蓬老师

欢迎选择我的课程，让我们一起见证您的进步~~

全部回复(1)

伊谢尔伦2017-04-17 15:46:04 1楼

你说的restUrl是你request的data啊，不是response的data，你搞错了。

你说得每次登录都不同，其实是因为它的js中有一个checkcode变量，每次登录失败，都会重置checkcode， js在发起post请求前，都会把密码加密下。你把html爬下来，看里面的源码，在js中有一个checkcode的变量，值用正则匹配出来(存下来)，然后把你的密码 + checkcode 用md5 加密下。加密后的十六进制结果就是post的UserPw参数值。如果登录失败了，在response中有一个checkcode字段，把你存的checkcode用返回来的那个替换掉。

我是参考了那网站的js源代码得出的。部分代码

password = hex_md5(hex_md5(password) + logincheckcode);

   if (data.code == 0)
                        location.href = data.retUrl;
                    else {
                        logincheckcode = data.checkcode;
                        showvcodep(data.logincount);
                        var msgstr = data.code == 1 ? "密码或用户名错误" : "操作已超时或验证码错误，请重新登录！";
                        $("#loginmsg").text(msgstr); //alert();
                        refreshcode2();
                    }

赞 +0

添加回复

专题推荐

更多>

热门话题

热门教程

更多>