sublime-text - python+selenium+PhantomJS抓取网页数据时,数据保存为csv,有的网页数据没问题,有的成为乱码,求解?
天蓬老师
天蓬老师 2017-04-18 09:15:15
[Python讨论组]

问题

抓取IT之家评论时,将评论数据以csv格式保存,每条新闻的评论保存为一个csv文件,前13条新闻全部没问题,中文正常显示,但是后面的每条新闻的评论数据却变成了乱码。在运行的时候我查看保存的文件发现在数据开始写入csv文件时(未写完),显示正常,但是第二次点开文件时却发现变成了乱码。

开始写入时

数据保存完毕后

之后的数据都无法正常保存了。这到底是怎么回事?

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

全部回复(1)
大家讲道理

试一下这样行不行

import codecs
with codecs.open(fname, 'w', 'utf-8') as fp

还有一个可能是你抓到数据的encoding被系统认为是iso-8859-1
如果是的话,改成utf-8就可以了

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号