python - 是否存在不可变的类字典对象?
问题描述
我想要一个 Python 对象,它可以灵活地获取任何键,并且我可以像字典一样按键访问,但它是不可变的。一种选择可能是灵活地生成一个namedtuple
,但这样做是不好的做法吗?例如,在下面的示例中,linter 不会期望nt
具有属性a
。
例子:
from collections import namedtuple
def foo(bar):
MyNamedTuple = namedtuple("MyNamedTuple", [k for k in bar.keys()])
d = {k: v for k, v in bar.items()}
return MyNamedTuple(**d)
>>> nt = foo({"a": 1, "b": 2})
解决方案
我在评论中提到了它,我不确定为什么需要这样做。
但是可以简单地覆盖__setitem__
一个字典类。尽管如此,这可能(很可能)会导致问题。一个最小的例子是:
class autodict(dict):
def __init__(self, *args, **kwargs):
super(autodict, self).__init__(*args, **kwargs)
def __getitem__(self, key):
val = dict.__getitem__(self, key)
return val
def __setitem__(self, key, val):
pass
x = autodict({'a' : 1, 'b' : 2})
x['c'] = 3
print(x)
这将产生{'a': 1, 'b': 2}
并因此忽略x['c'] = 3
集合。
一些好处
与命名元组相比,使用字典继承的速度差异在 40-1000 倍之间。(粗略速度测试见下文)
该in
运算符适用于字典,但在使用命名元组时效果不佳,如下所示:
'a' in nt == False
'a' in x == True
您可以使用键访问字典样式而不是(因为缺少更好的术语) JavaScript 样式
x['a'] == nt.a
虽然这是一个品味问题。
您也不必对键挑剔,因为字典基本上支持任何键标识符:
x[1] = 'a number'
nt = foo({1 : 'a number'})
命名元组将导致Type names and field names must be valid identifiers: '1'
优化(定时)
现在,这是一个粗略的例子,它会根据系统、月亮在天空中的位置等而有很大差异。但作为一个粗略的例子:
import time
from collections import namedtuple
class autodict(dict):
def __init__(self, *args, **kwargs):
super(autodict, self).__init__(*args, **kwargs)
#self.update(*args, **kwargs)
def __getitem__(self, key):
val = dict.__getitem__(self, key)
return val
def __setitem__(self, key, val):
pass
def __type__(self, *args, **kwargs):
return dict
def foo(bar):
MyNamedTuple = namedtuple("MyNamedTuple", [k for k in bar.keys()])
d = {k: v for k, v in bar.items()}
return MyNamedTuple(**d)
start = time.time()
for i in range(1000000):
nt = foo({'x'+str(i) : i})
end = time.time()
print('Named tuples:', end - start,'seconds.')
start = time.time()
for i in range(1000000):
x = autodict({'x'+str(i) : i})
end = time.time()
print('Autodict:', end - start,'seconds.')
结果是:
Named tuples: 59.21987843513489 seconds.
Autodict: 1.4844810962677002 seconds.
字典设置在我的书中,快得离谱。尽管这很可能与for
命名元组设置中的多个循环有关,并且可能很容易通过某种方式进行补救。但是对于基本的理解,这是一个很大的区别。该示例显然没有测试更大的一次性创建或访问时间。只是,“如果你使用这些选项在一段时间内创建数据集,你会浪费多少时间”:)
奖励:如果您有一个大型基础词典,并且想冻结它怎么办?
base_dict = {'x'+str(i) : i for i in range(1000000)}
start = time.time()
nt = foo(base_dict)
end = time.time()
print('Named tuples:', end - start,'seconds.')
start = time.time()
x = autodict(base_dict)
end = time.time()
print('Autodict:', end - start,'seconds.')
好吧,差异比我预期的要大……x1038.5
快了几倍。
(我将 CPU 用于其他东西,但我认为这是公平的游戏)
Named tuples: 154.0662612915039 seconds.
Autodict: 0.1483476161956787 seconds.
推荐阅读
- c# - 如何在 Unity 中通过拖放生成地形而不是对象?
- python - 如何在 Tensorflow 中冻结部分张量?
- c++ - 如果我们从模板函数返回一个变量并且我们不知道它的数据类型是什么,如何在主函数中获取这个返回的变量
- python - 仅具有 X、Y、Z 坐标的 Python 3D 曲面图
- flutter - Dart 空变量创建
- sql - 使用 VBA 将 Excel 数据导入 SQL Server 表
- c - 使用打印的 LLONG_MIN 初始化 long long 会发出警告:整数常量太大以至于它是无符号的:为什么以及如何解决?
- three.js - 通过 dat.gui 下拉菜单更新 three.js 纹理
- scrollable - 为什么 Swiper Scrollcontainer 在水平方向上不起作用
- flutter - 颤动改变图像onPressed