python - 爬虫中的图片该怎么处理?-PHP中文网问答

微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

python - 爬虫中的图片该怎么处理?

PHPz 2017-04-17 17:53:05

[Python讨论组]

0

6

591

举报

如题，比如爬取新闻类，该新闻中含图片,图片该怎么处理，如果有多张图片呢

类似

     [文字]  
     [图片]  
     [文字]

或者

     [文字]  
     [图片]  
     [文字]
     [图片]
     [文字]

需要下载图片到本地?还是直接用该网站的图片源,如果要下载到本地,文字内容上又该怎么处理。

多谢各位的回答，其实我想问得一点是怎么将图片保持在原位置，比如scrapy中可以使用

p.xpath('p/text()').extract()

得到文字内容

p.xpath('p/img/@src').extract()

定位图片，那么怎么保证图片的位置和原来的位置一样呢

PHPz

学习是最好的投资！

全部回复(6)

ringa_lee2017-04-17 17:55:05 6楼

如果沒有保存或收藏的必要(比如說害怕該網站關閉或是原圖失效)，直接使用該網站的圖片源即可，空間上，管理上，或是版權上都比較沒有問題．當然這樣做的難度也比較低．

赞 +0

添加回复

黄舟2017-04-17 17:55:05 5楼

如果能外链就外链，但是注意防盗链。最稳妥还是下载到本地

赞 +0

添加回复

ringa_lee2017-04-17 17:55:05 4楼

你可以用Bs4选择对应的节点就可以了啊，xpath也可以，可以提取任何你想要的东西

赞 +0

添加回复

迷茫2017-04-17 17:55:05 3楼

下载到本地，然后将网页中的src替换为本地的相对目录

赞 +0

添加回复

ringa_lee2017-04-17 17:55:05 2楼

新闻？门户类站点基本上都有反盗链吧

还是伪造Referer先下载到本地，然后把原文中的图片地址替换成本地地址吧

赞 +0

添加回复

巴扎黑

巴扎黑2017-04-17 17:55:05 1楼

http://blog.csdn.net/qq_34844199/article/details/51468841 把这个看了，一切都明白了

赞 +0

添加回复

专题推荐

更多>

热门话题

热门教程

更多>

相关教程

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部