首页 > 解决方案 > 是否存在不可变的类字典对象?

问题描述

我想要一个 Python 对象,它可以灵活地获取任何键,并且我可以像字典一样按键访问,但它是不可变的。一种选择可能是灵活地生成一个namedtuple,但这样做是不好的做法吗?例如,在下面的示例中,linter 不会期望nt具有属性a

例子:

from collections import namedtuple

def foo(bar):
    MyNamedTuple = namedtuple("MyNamedTuple", [k for k in bar.keys()])
    d = {k: v for k, v in bar.items()}
    return MyNamedTuple(**d)

>>> nt = foo({"a": 1, "b": 2})

标签: pythoncollectionsnamedtuple

解决方案


我在评论中提到了它,我不确定为什么需要这样做。
但是可以简单地覆盖__setitem__一个字典类。尽管如此,这可能(很可能)会导致问题。一个最小的例子是:

class autodict(dict):
    def __init__(self, *args, **kwargs):
        super(autodict, self).__init__(*args, **kwargs)

    def __getitem__(self, key):
        val = dict.__getitem__(self, key)
        return val

    def __setitem__(self, key, val):
        pass

x = autodict({'a' : 1, 'b' : 2})
x['c'] = 3
print(x)

这将产生{'a': 1, 'b': 2}并因此忽略x['c'] = 3集合。


一些好处

与命名元组相比,使用字典继承的速度差异在 40-1000 倍之间。(粗略速度测试见下文)

in运算符适用于字典,但在使用命名元组时效果不佳,如下所示:

'a' in nt == False
'a' in x == True

您可以使用键访问字典样式而不是(因为缺少更好的术语) JavaScript 样式

x['a'] == nt.a

虽然这是一个品味问题。

您也不必对键挑剔,因为字典基本上支持任何键标识符:

x[1] = 'a number'
nt = foo({1 : 'a number'})

命名元组将导致Type names and field names must be valid identifiers: '1'


优化(定时)

现在,这是一个粗略的例子,它会根据系统、月亮在天空中的位置等而有很大差异。但作为一个粗略的例子:

import time
from collections import namedtuple

class autodict(dict):
    def __init__(self, *args, **kwargs):
        super(autodict, self).__init__(*args, **kwargs)
        #self.update(*args, **kwargs)

    def __getitem__(self, key):
        val = dict.__getitem__(self, key)
        return val

    def __setitem__(self, key, val):
        pass

    def __type__(self, *args, **kwargs):
        return dict

def foo(bar):
    MyNamedTuple = namedtuple("MyNamedTuple", [k for k in bar.keys()])
    d = {k: v for k, v in bar.items()}
    return MyNamedTuple(**d)

start = time.time()
for i in range(1000000):
    nt = foo({'x'+str(i) : i})
end = time.time()
print('Named tuples:', end - start,'seconds.')

start = time.time()
for i in range(1000000):
    x = autodict({'x'+str(i) : i})
end = time.time()
print('Autodict:', end - start,'seconds.')

结果是:

Named tuples: 59.21987843513489 seconds.
Autodict: 1.4844810962677002 seconds.

字典设置在我的书中,快得离谱。尽管这很可能与for命名元组设置中的多个循环有关,并且可能很容易通过某种方式进行补救。但是对于基本的理解,这是一个很大的区别。该示例显然没有测试更大的一次性创建或访问时间。只是,“如果你使用这些选项在一段时间内创建数据集,你会浪费多少时间”:)

奖励:如果您有一个大型基础词典,并且想冻结它怎么办?

base_dict = {'x'+str(i) : i for i in range(1000000)}

start = time.time()
nt = foo(base_dict)
end = time.time()
print('Named tuples:', end - start,'seconds.')

start = time.time()
x = autodict(base_dict)
end = time.time()
print('Autodict:', end - start,'seconds.')

好吧,差异比我预期的要大……x1038.5快了几倍。
(我将 CPU 用于其他东西,但我认为这是公平的游戏)

Named tuples: 154.0662612915039 seconds.
Autodict: 0.1483476161956787 seconds.

推荐阅读