扫码关注官方订阅号
走同样的路,发现不同的人生
<span>里面不是有onclick="javascript:window.location.href=xxxx"吗?这句就是跳转啊,你给的例子里就是跳转到List.asp?Keywords=....写爬虫的话,建议你学学HTML和JS。
<span>
onclick="javascript:window.location.href=xxxx"
List.asp?Keywords=....
更新:抓取下一页的URL
next_page_tag = soup.find(title='后翻一页') next_page_onclick = next_page_tag['onclick'] next_page_url = re.search("'(.+)'", next_page_onclick).group(1) next_page_url = 'http://gdemba.gicp.net:82/interunit/' + next_page_url
就像楼上说的,那个onclick里面已经有了下一页的地址,使用beautifulsoup提取出来,加上host,应该就可以了
我是先抓到总的页数,然后用while循环来做。。。。
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
<span>里面不是有onclick="javascript:window.location.href=xxxx"吗?这句就是跳转啊,你给的例子里就是跳转到
List.asp?Keywords=....写爬虫的话,建议你学学HTML和JS。
更新:抓取下一页的URL
PageNo就是页码啊!!
就像楼上说的,那个onclick里面已经有了下一页的地址,使用beautifulsoup提取出来,加上host,应该就可以了
我是先抓到总的页数,然后用while循环来做。。。。