网页爬虫 - 学习python爬虫程序需要熟悉js吗?
PHP中文网
PHP中文网 2017-04-17 13:26:21
[Python讨论组]

额,是这样的,因为有时候抓取某些网址的数据,需要登陆,所以,这段时间我在弄python模拟登陆网址的问题,但是我发现,有些网址,在python提交的post数据中,有些事js计算出来的,看不懂js那就没办法了把?
举一个例子把.这两天我在为 IP地址查询 - 站长工具 写程序,内容是用python抓取这ip查询网址的查询结果,使用query string的程序我已经写出来了,但是当我想要用python发送post的方法来获取数据时我发现,点击页面中的"查询"后浏览器没有post,那么这个我输入的ip地址是怎么发送到服务器并返回呢?这应该就用到js了吧?(我只是猜测)
最近我的学习已经卡顿了,因为我发现好像不懂js就难以继续学习,学习js并不是一个问题,主要是因为我学python不久,我不知道这时候分出时间来学js是不是一个明智的选择.
对于上面那个ip查询的网址,今晚我刚刚分析过js代码,但是实在弄不懂输入的ip地址是怎么返回给服务器的,,,,,,,,,,,,,,,,,,,,,
大家给点建议吧..............python

PHP中文网
PHP中文网

认证0级讲师

全部回复(4)
ringa_lee

如果页面的有些部分是通过js生成的,需要用引擎把他解析出来。如果js里面用了ajax取数据的话,会更慢。

巴扎黑

写爬虫,很多时候是要了解页面上 JS 的,所以 JS 是需要了解的,好在这东西很好上手,不需要精通,了解一下就好了。

大家讲道理

如果只是为了玩爬虫,可能你只需要了解一下js,重点了解下ajax就可以了。因为很多页面是ajax请求加载的。

PHPz

不需要,因为python不能解析js,懂js也没用。你只需要在chrome里面看一下你需要的数据是通过请求哪个网址返回的就行了。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号