算法复杂度 - Python 爬虫复杂度是如何进行计算的?
ringa_lee
ringa_lee 2017-04-17 15:54:49
[Python讨论组]

设想全网有N个网站,那么分析一下判重的复杂度就是N*log(N),因为所有网页要遍历一次,而每次判重用set的话需要log(N)的复杂度。

为什么复杂度就是N*log(N),求各位知乎大神指点下!!!

ringa_lee
ringa_lee

ringa_lee

全部回复(2)
大家讲道理

有点偏题..
记得<数学之美>一书中, 有提到使用布隆过滤器实现判重
链接: pybloom

高洛峰

这里要使用限制策略,相同参数的URL爬取最大数,网站目录爬取最大数,网站URL爬取最大数

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号