php - 带分页接口循环读取的最优方案是哪种
怪我咯
怪我咯 2017-04-11 10:06:27
[PHP讨论组]

目前需要读取第三方接口数据,数据量比较大,第三方才用了分页的方式,目前我的方案是,在循环中调用curl读取接口的方法,再把json数据转换为数组,在拼接数组,进行数据筛选过滤入库操作,但是由于第三方接口不稳定,可能会造成读取失败。请问是否有更好的方案?

怪我咯
怪我咯

走同样的路,发现不同的人生

全部回复(2)
高洛峰

1,建议建立抓取原数据库,id也好md5也好,确保单数据抓取唯一性
2,接口不稳定,通过异常处理 curl失败处理等方式,尽可能确保抓取数据成功
3,做好重复抓取数据的准备,基于1,确保数据不会被重复处理

PHP中文网

如果数据量很大的话,可以采用定时脚本去拉取。
拉取的时候首先按照一个比如自增id的字段排序,这样避免分页数据变动的问题。
然后脚本执行的时候或者循环一次结束的时候,把最大的id记下来,然后下次执行的时候带上大于这个值的条件咯。

然后脚本执行的时候,出现接口调用失败,可以尝试重新拉取几次,失败的话,同样停止脚本执行,然后记下id,然后给预警信息,人工干预。
额,简单的想法

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号