扫码关注官方订阅号
问题如题.
闭关修行中......
http://stackoverflow.com/questions/18337407/saving-utf-8-texts-in-json-dumps-as-utf8-not-as-u-escape-sequence 里面有提到,将 JSONEncoder 的 ensure_ascii 参数设为 False 即可。
ensure_ascii
而 scrapy 的 item export 文档里有提到
The additional constructor arguments are passed to the BaseItemExporter constructor, and the leftover arguments to the JSONEncoder constructor, so you can use any JSONEncoder constructor argument to customize this exporter.
因此就在调用 scrapy.contrib.exporter.JsonItemExporter 的时候额外指定 ensure_ascii=False 就可以啦。
scrapy.contrib.exporter.JsonItemExporter
ensure_ascii=False
存储为中为编码的问题可能较多,一般处理编码的问题在下列地方 json要实现对文件的encode 下载的时候吸入数据到item时要decode 最关键的是在解析为后获得为列表数据时,还不能对列表decode 详细中文编码问题可以参考博客http://www.addbook.cn/blog/scrapy%E4%B8%AD%E6%96%87%E7%BC%96%E7%A0%81%E9%97%AE%E9%A2%98
可以试试
cat xxx.json | json_pp| less
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
http://stackoverflow.com/questions/18337407/saving-utf-8-texts-in-json-dumps-as-utf8-not-as-u-escape-sequence 里面有提到,将 JSONEncoder 的
ensure_ascii参数设为 False 即可。而 scrapy 的 item export 文档里有提到
因此就在调用
scrapy.contrib.exporter.JsonItemExporter的时候额外指定ensure_ascii=False就可以啦。存储为中为编码的问题可能较多,一般处理编码的问题在下列地方
json要实现对文件的encode
下载的时候吸入数据到item时要decode
最关键的是在解析为后获得为列表数据时,还不能对列表decode
详细中文编码问题可以参考博客
http://www.addbook.cn/blog/scrapy%E4%B8%AD%E6%96%87%E7%BC%96%E7%A0%81%E9%97%AE%E9%A2%98
可以试试
cat xxx.json | json_pp| less