node.js - nodejs写爬虫做微博搜索有比较好的资源推荐吗?
高洛峰
高洛峰 2017-04-17 11:27:13
[Node.js讨论组]

nodejs写爬虫做微博搜索有比较好的资源推荐吗?

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全部回复(2)
高洛峰
  • 组织请求 request 首先你得模拟HTTP请求,偶尔还需要cookie容器来登录
  • 页面分析 cheerio 用熟悉的jQuery的美刀API来抓页面内容,无需gyp编译
  • 异步处理 bluebird 很多时候爬虫并不是一个请求就能拿到所有想要的数据,串行,并行,一个请求出发多个等等各种情况决定了一个异步库是必备的 promise风格的bluebird是更泛用的选择,单就爬虫的场景来说,async也不坏
  • 组织数据 lodash 如果数据复杂的话,lodash可以帮你理清整理数据结构的代码,但这不是必备,如果只是简单的数组操作,那原生的 map forEach等也足够好了

四大金刚,居家旅行,偷鸡摸狗必备佳品,直接npm install,文档都在一页之内

巴扎黑

http://www.cnblogs.com/hustskyking/p/spider-with-node.html

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号