如何用python把返回的html提取相应的内容到excel
高洛峰
高洛峰 2017-04-17 17:15:42
[Python讨论组]
高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全部回复(3)
巴扎黑

正则提取出多个列表,然后利用 Pandas 的 DataFrame 数据类型写入 excel,具体格式你自己安排,这里给出个基本示例:

text = """<td height="20" align="center">1</td>
<td align="center">产品</td>
<td align="center">red</td>
<td align="center">单价</td>
<td align="center">价格</td>
<td align="center">备注</td>
-----
<td height="20" align="center">2</td>
<td align="center">产品</td>
<td align="center">red</td>
<td align="center">单价</td>
<td align="center">价格</td>
<td align="center">备注</td>
"""

import pandas as pd
import re

p = re.compile('>(\S+)</td>')
q = p.findall(text)
table = pd.read_excel(r'D:\test.xlsx')    #事先在D盘建立该空excel
table['your title'] = pd.Series(q)
table.to_excel(r'D:\test.xlsx')

结果:

一个 Series 就是一列,你可以根据需要提取出多个不同属性列的数据,然后写入table 最终导入excel。

黄舟

抓取网页上的内容,正则匹配,然后操作execl,python都有第三方扩展的嘛

高洛峰

Python可以调用 xlwt 库,写excel

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号