python - 关于爬取网站,下载图片的时候碰到网址结构问题卡住
天蓬老师
天蓬老师 2017-04-18 10:18:33
[Python讨论组]

下载图片的时候很容易碰到下载了几张之后碰到图片的链接里面含有/时会出现:
FileNotFoundError: [Errno 2] No such file or directory:

例如:
图一:http://gnondgnoqnioandiofnas_swn_ssy_mhtng.jpg
图二:http://asnoqenconvoqenripetn_swn_ssy_mhtng.jpg
图三:http://asdnioqnoqwrqwenoqwr/12345/123/1256.gif

 
for item in download_link:
    urllib.request.urlretrieve(item,folder_path + item[-19:])
    time.sleep(2)
    print('Done')
    

运行到图三的时候就中断了,我的理解是因为图三的地址有/,造成文件夹之后再次进入子文件夹进不去,所以出错。

(1)想请问下怎么样能跳过这个文件,继续下载后面的图片
(2)或者说有什么办法能直接把这个图三直接下载了

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

全部回复(2)
高洛峰

urlretrieve第二个参数是文件名,文件名里面是不允许有斜杠的,可以这样做:

urllib.request.urlretrieve(item,folder_path + item.split('/')[-1])
大家讲道理

粗暴一点,你可以try一下。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号