python urllib2 字符乱码的问题
高洛峰
高洛峰 2017-04-17 17:08:49
[Python讨论组]
r1=urllib2.Request(url,None,headers)
opener = urllib2.build_opener()
opener.addheaders.append(('Cookie', cookie_str))
response=opener.open(r1)
if response.info().get('Content-Encoding') == 'gzip':
    d = zlib.decompressobj(16+zlib.MAX_WBITS)
    #buf = StringIO( response.read())
    #f = gzip.GzipFile(fileobj=buf)
    #text = f.read()
    READ_BLOCK_SIZE = 1024*8
    stre=''
    while True:
        data = response.read(READ_BLOCK_SIZE)
        if not data: break
        stre+=data

    text = d.decompress(stre)
else :
    text=response.read()

将text写入文件后发现个别字符乱码,其他的都是正常的,不知道是怎么回事?
�t鱼养殖前景效益看好,莫失时机
鮰鱼养殖前景效益看好,莫失时机
所有的“鮰”都是乱码“�t”
环境是python 2.7,windows下,不知道该怎么解决呢?

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全部回复(2)
ringa_lee

需要设置字符集为utf8

黄舟
  1. 请求还是建议使用现在比较好用的requests了。代码清晰且书写方便。

  2. 是什么编码的看看,这种情况可能是gbk编码的 先使用decode将编码转回unicode 再使用encode成utf-8即可。

  3. 还要就要要问问题。。问题和代码能详细一点吗。。

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号