扫码关注官方订阅号
已经把爬取到的成绩单存成html文件了,但是格式和在网页里显示的不一样,排版很乱,请问还要爬取什么类型的文件来调整格式呢?
闭关修行中......
notepad++ 搭配 Tidy2 插件
排版乱不是什么大问题,主要是只找到你想要的数据并抓取就可以了。
缺少css吧
应该是没有爬去到css样式表,你可以拿到基本的数据之后,使用正则或者jsoup进行过滤,将数据保存到数据库或者缓存中,自己重新编写网页,从数据库中取出来数据。
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
notepad++ 搭配 Tidy2 插件
排版乱不是什么大问题,主要是只找到你想要的数据并抓取就可以了。
缺少css吧
应该是没有爬去到css样式表,你可以拿到基本的数据之后,使用正则或者jsoup进行过滤,将数据保存到数据库或者缓存中,自己重新编写网页,从数据库中取出来数据。