扫码关注官方订阅号
认证0级讲师
经过探究我发现问题在于大多数网页都是gzip压缩过的,只要导入gzip模块将html数据就压缩就行了。
加上#--coding:utf-8,建议使用python3
#--coding:utf-8
首先你需要在文件头部定义文件的编码
# coding: utf-8
其次你需要导入sys这个模块并设置默认的编码
import sys reload(sys) sys.setdefaultencoding('utf8')
这行是解码为unicodevim = response.read().decode('utf-8',errors = 'ignore')但写入文件时unicode必须要编码的,比如utf-8所以要f.write(vim.encode('utf-8'),或者开始就不要解码.
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
经过探究我发现问题在于大多数网页都是gzip压缩过的,只要导入gzip模块将html数据就压缩就行了。
加上
#--coding:utf-8,建议使用python3首先你需要在文件头部定义文件的编码
其次你需要导入sys这个模块并设置默认的编码
这行是解码为unicode
vim = response.read().decode('utf-8',errors = 'ignore')
但写入文件时unicode必须要编码的,比如utf-8
所以要f.write(vim.encode('utf-8'),或者开始就不要解码.