python - 与来自多个字典的给定键对应的一组值的交集
问题描述
我正在创建一个变量,用于测量 3 个不同字典中给定键的值子样本的大小。例如,我想要字典 dict_a 中的键 A1 对应的值集,字典 dict_b 中的键 b2 和字典 dict_c 中的键 c5 (即,与来自 3 个字典的给定键对应的值集的交集)。
我编写了一个使用循环执行它的代码,如下所示:
import numpy as np
dict_a = {'a1':[1,3,4], 'a2':[1,5,6,7,8,9,13]}
dict_b = {'b1':[85,7,25], 'b2':[1,8,10,70], 'b3':[1,5,69,13], 'b4':[1,75,15,30]}
dict_c = {'c1':[1,3,4], 'c2':[725,58,2,89], 'c3':[5,684,6,8,2], 'c4':[4,8,88,55,75,2,8], 'c5':[8,5,6,28,24,6], 'c6':[8,52,3,58,26,2]}
keys_a = list(dict_a.keys())
keys_b = list(dict_b.keys())
keys_c = list(dict_c.keys())
a= []
b= []
c= []
size = []
for y in keys_a:
for u in keys_b:
for w in keys_c:
a.append(u)
b.append(w)
c.append(y)
# Define subsample
subsample = np.intersect1d(dict_a[y],dict_b[u],dict_c[w])
size.append(len(subsample))
问题是我的字典比示例中的大得多,这需要很长时间才能运行。
有没有办法让这更有效?
解决方案
使用套装怎么样?
size = []
for y in keys_a:
for u in keys_b:
for w in keys_c:
common = set.intersection(set(dict_a[y]),
set(dict_b[u]),
set(dict_c[w]))
size.append(len(common))
计算集合的交集也应该比先将数字列表转换为数组然后使用 np.intersection 快得多。
您可以将此方法与列表中的任何可散列类型一起使用。
推荐阅读
- java - Iterating an Arraylist of Arraylists using forEach and lambda expression
- python - PyError 在 Julia 中使用 PyCall
- sql - 在 BigQuery 中创建具有重复嵌套列的表语句
- r - 创建一个表格,其中包含特定格式的日期作为列
- javascript - 检查哨兵报告模式是否已经打开以防止多个弹出窗口
- jquery - ajax 调用的输入意外结束
- f# - 在 FSI 中使用 Azure Cosmos 库从 Azure 表存储中检索数据失败
- aws-cdk - 允许堆栈创建多个 ecr 图像
- python - 使用 pymongo 更新 Mongodb 会随着文件的工作方式显着变慢
- reactjs - 如何在 React Typescript 应用程序中导入 react-admin?