首页 > 解决方案 > 为什么 python 3 中的 json.dumps() 返回 python 2 的不同值?

问题描述

我需要在 Python 3 中生成一个 MD5 哈希来与在 Python 2 上生成的 MD5 哈希进行比较,但是 json.dumps() 的结果是不同的,因为在 Python 2 上元素的位置发生了变化并且 MD5 结果是不同的。

我怎样才能产生相同的结果?

编码:

content = {'name': 'Marcelo', 'age': 30, 'address': {'country': 'Brasil'}, 'interests': [{'id': 1, 'description': 'tecnology'}]}

print('CONTENT:', json.dumps(content))

print('MD5:', md5(str(content).encode('UTF-8')).hexdigest())

Python 2.7 结果:

('CONTENT:', {'interests': [{'id': 1, 'description': 'tecnology'}], 'age': 30, 'name': 'Marcelo', 'address': {'country': 'Brasil'}})

('MD5:', 'a396f6997fb420992d96b37e8f37938d')

Python 3.6 结果:

CONTENT: {'name': 'Marcelo', 'age': 30, 'address': {'country': 'Brasil'}, 'interests': [{'id': 1, 'description': 'tecnology'}]}

MD5: 40c601152725654148811749d9fc8878

编辑:

我无法更改在 Python 2 上生成的 MD5。有什么方法可以在 Python 3 上重现 Python 2 的默认顺序?

标签: pythonjsonpython-2.7md5python-3.6

解决方案


在 3.6 之前的 Python 中,字典键是无序的。所以在 Python 3.6 中,键保持它们插入的顺序(或者在字典文字的情况下,它们在文字中的出现方式)。Python 2.7 字典是无序的,因此循环顺序不一定与插入顺序匹配。

如果在这两种情况下都重新加载 json 字典,它仍然是相等的(字典相等不依赖于顺序)。

所以这里没有错误。不同之处在于字典在不同 Python 版本中的排序方式。

json.dump并按json.dumps字典循环顺序写出键值对。所以为了有一致的循环顺序,最好使用collections.OrderedDict类型来实现一致的顺序。如果你打电话json.load来获取字典,你还需要使用json.loads(text, object_hook=OrderedDict),这将保持排序。

没有简单的方法可以让 Python 3 字典使用 Python 2 排序,因此同时使用 2 和 3 代码库OrderedDict是一种更易于维护的解决方案。


推荐阅读