python - anytree.exporter 的 JSON 编码不支持西里尔字母
问题描述
我已经使用 Anytree ( https://pypi.org/project/anytree/2.8.0/ ) 在 Python 中构建了树。然后我将它导出为 JSON。从文件导入树后,我得到了正常的符号。问题是JSON 文件包含“坏”符号而不是普通的西里尔字母。这是一个代码示例:
- 构建树
- 将树导出到 json + 渲染
- 从 json + 渲染导入树
- 打印json内容
代码:
import smart_open
import json, pprint
from anytree import AnyNode, RenderTree
from anytree.exporter import JsonExporter
from anytree.importer import JsonImporter
json_file = r'd:\temp\test.json'
#building tree
root = AnyNode(uk = 'узел-0', parent=None)
b = AnyNode(uk = 'узел-01', parent=root)
a = AnyNode(uk = 'узел-011',parent=b)
g = AnyNode(uk = 'узел-021', parent = root)
print()
print('Tree for export:')
print(RenderTree(root).by_attr('uk'))
#export
exporter = JsonExporter(indent=2, sort_keys=True)
data = exporter.export(root)
with open(json_file, 'w', encoding='utf-8') as outfile:
json.dump(data, outfile, ensure_ascii=False)
#import
importer = JsonImporter()
with open(json_file, encoding='utf-8') as json_file:
data = json.load(json_file)
root = importer.import_(data)
print()
print('Imported tree:')
print(RenderTree(root).by_attr('uk'))
#print bad json
print()
print('data in JSON-file:')
pprint.pprint(data)
结果是:
> Tree for export:
> узел-0
> ├── узел-01
> │ └── узел-011
> └── узел-021
>
> Imported tree:
> узел-0
> ├── узел-01
> │ └── узел-011
> └── узел-021
>
> data in JSON-file:
> ('{\n'
> ' "children": [\n'
> ' {\n'
> ' "children": [\n'
> ' {\n'
> ' "uk":"\\u0443\\u0437\\u0435\\u043b-011"\n'
> ' }\n'
> ' ],\n'
> ' "uk": "\\u0443\\u0437\\u0435\\u043b-01"\n'
> ' },\n'
> ' {\n'
> ' "uk": "\\u0443\\u0437\\u0435\\u043b-021"\n'
> ' }\n'
> ' ],\n'
> ' "uk": "\\u0443\\u0437\\u0435\\u043b-0"\n'
> '}')
虽然将西里尔文写入 JSON 是可以的。例子:
import json, pprint
data = '''
{
"uk":"узел-0",
"children": [
{
"uk": "узел-01",
}
]
}'''
json_file = r'd:\temp\test_ru.json'
with open(json_file, 'w', encoding='utf-8') as outfile:
json.dump(data, outfile, ensure_ascii=False)
with open(json_file, encoding='utf-8') as outfile:
data = json.load(outfile)
pprint.pprint(data)
返回:
> ('\n'
> ' {\n'
> ' "uk":"узел-0",\n'
> ' "children": [\n'
> ' {\n'
> ' "uk": "узел-01",\n'
> ' }\n'
> ' ]\n'
> '}')
解决方案
答案是:
JsonExporter(indent=2, sort_keys=True, ensure_ascii=False)
推荐阅读
- sql - SQL 查询两个 PIVOT 列组合
- c# - 允许 FileSystemWatcher 和 WriteTime/CreationTime 查看子目录?
- python - 将 seq2seq 模型的 TF 1.0 sampled_softmax_loss 函数重新实现到 TF 2 Keras 模型
- sql - R 和 dplyr:如何使用 compute() 在与源模式不同的模式中从 SQL 查询创建持久表?
- python - 为什么xml数据解析为字符串而不是int
- dafny - Dafny 简单断言不成立
- node.js - 如何管理 NodeJs 应用程序代码以减少混乱
- c# - 在MVC5中从BLL层调用函数到控制器
- ios - 如何修复 iOS/Xcode 构建错误,未定义符号`__C.NSURLSession.DataTaskPublisher`?
- c# - 如何在 UWP 应用程序中创建一个窗口以输入详细/属性信息