首页 > 解决方案 > 如何将 JSON 转换为 CSV?(支持 UTF-8)

问题描述

之前有一个问题如何将 JSON 转换为 CSV?并且有很多答案,但是没有一个解释如何转换非 latin1 数据。

假设我有一个 JSON 文件,如下所示:

[
    {"id":123,"FullName":"Иванов Иван Иванович"},
    {"id":124,"FullName":"Петров Петр Петрович"}
]

我尝试使用这样的脚本:

#!/usr/bin/env python2.7
# -*- coding: utf-8 -*-

import sys
import codecs
import json
import unicodecsv as csv

if __name__ == '__main__':
    fin = codecs.open(sys.argv[1], encoding='utf-8')
    data = json.load(fin)
    fin.close()

    with codecs.open('test.csv', encoding='utf-8', mode='wb') as csv_file:
        w = csv.writer(csv_file, encoding='utf-8')
        w.writerow(data[0].keys())  # header row
    
        for row in data:
            w.writerow(row.values())

这给了我以下错误:

UnicodeDecodeError:“ascii”编解码器无法解码位置 32 中的字节 0xd0:序数不在范围内(128)

首先不清楚位置 32 有什么,但最有趣的问题是是否有办法将 UTF-8 编码的字符串保存到 CSV 文件。

标签: pythonpython-2.7utf-8

解决方案


给定test.json(在评论中使用引号和逗号):

[
    {"id":123,"FullName":"Иванов, \"Иван\" Иванович"},
    {"id":124,"FullName":"Петров Петр Петрович"}
]

这有效:

#!/usr/bin/env python2.7

import json
import unicodecsv as csv

with open('test.json','rb') as fin:
    data = json.load(fin)

with open('test.csv','wb') as csv_file:
    w = csv.writer(csv_file, encoding='utf-8-sig')
    w.writerow(data[0].keys())  # header row
    for row in data:
        w.writerow(row.values())

json模块采用 UTF-8 编码。

unicodecsvwriter获取以二进制模式打开的文件,并使用实例化时指定的编码进行解码。

utf-8-sig如果 .CSV 将在 Excel 中打开,则使用此选项,utf8否则可以使用。

输出:

FullName,id
"Иванов, ""Иван"" Иванович",123
Петров Петр Петрович,124

在 Excel 中:

Excel 显示


推荐阅读