python - 如何将 JSON 转换为 CSV?(支持 UTF-8)
问题描述
之前有一个问题如何将 JSON 转换为 CSV?并且有很多答案,但是没有一个解释如何转换非 latin1 数据。
假设我有一个 JSON 文件,如下所示:
[
{"id":123,"FullName":"Иванов Иван Иванович"},
{"id":124,"FullName":"Петров Петр Петрович"}
]
我尝试使用这样的脚本:
#!/usr/bin/env python2.7
# -*- coding: utf-8 -*-
import sys
import codecs
import json
import unicodecsv as csv
if __name__ == '__main__':
fin = codecs.open(sys.argv[1], encoding='utf-8')
data = json.load(fin)
fin.close()
with codecs.open('test.csv', encoding='utf-8', mode='wb') as csv_file:
w = csv.writer(csv_file, encoding='utf-8')
w.writerow(data[0].keys()) # header row
for row in data:
w.writerow(row.values())
这给了我以下错误:
UnicodeDecodeError:“ascii”编解码器无法解码位置 32 中的字节 0xd0:序数不在范围内(128)
首先不清楚位置 32 有什么,但最有趣的问题是是否有办法将 UTF-8 编码的字符串保存到 CSV 文件。
解决方案
给定test.json
(在评论中使用引号和逗号):
[
{"id":123,"FullName":"Иванов, \"Иван\" Иванович"},
{"id":124,"FullName":"Петров Петр Петрович"}
]
这有效:
#!/usr/bin/env python2.7
import json
import unicodecsv as csv
with open('test.json','rb') as fin:
data = json.load(fin)
with open('test.csv','wb') as csv_file:
w = csv.writer(csv_file, encoding='utf-8-sig')
w.writerow(data[0].keys()) # header row
for row in data:
w.writerow(row.values())
该json
模块采用 UTF-8 编码。
unicodecsv
writer
获取以二进制模式打开的文件,并使用实例化时指定的编码进行解码。
utf-8-sig
如果 .CSV 将在 Excel 中打开,则使用此选项,utf8
否则可以使用。
输出:
FullName,id
"Иванов, ""Иван"" Иванович",123
Петров Петр Петрович,124
在 Excel 中:
推荐阅读
- jenkins - Jenkins 管道环境部分未串行执行
- model - 如何注入/配置用户模型以在环回 4 组件中设置关系?
- spring-boot - 应用程序引擎中的 Spring Boot 与云 sql 的连接
- ssl - TLS/SSL 握手
- java - Spring Batch 并行读取数据库
- php - ORO Commerce 自动登录过程中面临的问题
- go - 错误 linter 在项目路径 GoLand 中未显示红色下划线
- java - 多次创建 ApplicationContext(在 struts + Spring 项目中)
- r - R-Markdown 中的绘图大小
- r - 如何相对于现有列的值将值添加到 R 中的新列