首页 > 解决方案 > 与来自多个字典的给定键对应的一组值的交集

问题描述

我正在创建一个变量,用于测量 3 个不同字典中给定键的值子样本的大小。例如,我想要字典 dict_a 中的键 A1 对应的值集,字典 dict_b 中的键 b2 和字典 dict_c 中的键 c5 (即,与来自 3 个字典的给定键对应的值集的交集)。

我编写了一个使用循环执行它的代码,如下所示:

import numpy as np


dict_a = {'a1':[1,3,4], 'a2':[1,5,6,7,8,9,13]} 
dict_b = {'b1':[85,7,25], 'b2':[1,8,10,70], 'b3':[1,5,69,13], 'b4':[1,75,15,30]} 
dict_c = {'c1':[1,3,4], 'c2':[725,58,2,89], 'c3':[5,684,6,8,2], 'c4':[4,8,88,55,75,2,8], 'c5':[8,5,6,28,24,6], 'c6':[8,52,3,58,26,2]} 

keys_a =  list(dict_a.keys())
keys_b =  list(dict_b.keys())
keys_c =  list(dict_c.keys())


a= []
b= []
c= []
size = []
for y in keys_a:
    for u in keys_b:
        for w in keys_c:
            a.append(u)
            b.append(w)
            c.append(y)

            # Define subsample
            subsample = np.intersect1d(dict_a[y],dict_b[u],dict_c[w])
            size.append(len(subsample))

问题是我的字典比示例中的大得多,这需要很长时间才能运行。

有没有办法让这更有效?

标签: pythonpython-3.xdictionaryset-intersection

解决方案


使用套装怎么样?

size = []
for y in keys_a:
    for u in keys_b:
        for w in keys_c:
            common = set.intersection(set(dict_a[y]),
                                      set(dict_b[u]),
                                      set(dict_c[w]))
            size.append(len(common))

计算集合的交集也应该比先将数字列表转换为数组然后使用 np.intersection 快得多。

您可以将此方法与列表中的任何可散列类型一起使用。


推荐阅读