python-3.x - 检查一个元素是否属于与字典中的键关联的列表而没有 for 循环
问题描述
问题表述:
检查元素是否属于与字典中的键关联的值列表并返回键的索引。
字典的每个键都与一个值列表相关联。例如 :
498 : {1299,45,78}
875 :{45,104,200,300,456}
字典中的键数为30,000
elements = [45,65,65,...,104,..., 875] # 元素由大约900,000 个 整数值组成
算法是做什么的?
查找字典中的每个元素并返回它所属的键的索引。
例如 :
45属于键号498和875
我试过什么?
for elt in elements:
Keys_indices_elt = [key for key, list in dictionary.items() if elt in list]
问题是什么 ?
使用嵌套循环效率不高,返回 30,000 个键和 900,000 个元素之间的映射大约需要 9 个小时。
有没有有效的方法来解决它?
解决方案
你想要的是在处理循环之前建立一个反向索引。
它应该看起来像这样:
{
1299: {498},
45: {498, 875},
78: {498},
104: {875},
# etc.
}
要构建它,您只需遍历字典并将字典中的值用作反向索引中的键。像这样的东西:
rev_idx = {}
for k, v in my_dict.items():
for e in v:
if e in rev_idx:
rev_idx[e].add(k)
else:
rev_idx[e] = {k}
这当然会使用一些内存和处理时间,但是您几乎可以立即获得 900,000 个元素中的每一个的答案。我希望通过这种方法,您的程序将运行大约两秒钟而不是 9 小时。
推荐阅读
- javascript - AWS Lambda 和 Promises:未调用回调
- machine-learning - 如何找到多个变量的值,以便函数返回最高值
- jquery - 按属性统计当天的全日历事件
- python - 如何将 Python DataFrame 传递给 UiPath?
- sas - 如何通过 EG 上的 API (POST) 发送 .JSON 文件?
- c++ - 显式默认的 constexpr ctor 是否应该允许非 constexpr 初始化
- python - 在这种情况下,Python pandas 数据框合并如何工作?
- python - 在 CPU 上运行 Tensorflow 时抑制 OpenMP 调试消息
- git-submodules - Gerrit 将更改提交到 git 子模块
- c#-4.0 - 正则表达式查找名字后的中间首字母