python爬虫 - python 爬虫 文字和图片如何保存为一种文件格式
高洛峰
高洛峰 2017-04-17 16:03:18
[Python讨论组]

大概设想是这样的
爬虫爬取的文字和图片一起保存为哪种格式,能看到文字和图片。
比如pdf 文字和图片共存,但是图片的位置如何控制,还请大神指点。
或者有其他更好的方法,欢迎指点。

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全部回复(3)
高洛峰

提供一个方式,使用html来展示。

黄舟

可以试试这个,web-html-to-pdf-python

先保存成html,然后再转成pdf

你可能的意思是提取一些有用的信息和图片,然后转成pdf,这样的话可以先试试生成html,然后转成pdf。但是生成html的过程应该很麻烦。

高洛峰

爬下来先保存成 HTML,给 img 标签定义为 block 元素,这样在保证性能的同时基本能适应绝大部分情况。有了 HTML 想转成别的格式就很简单了。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号