首页 > 解决方案 > 使用 SciPy/NumPy 循环有限概率权重

问题描述

让我们有一个事件概率prob,它是 0-1 之间的标量。如果我想以 0.1 的增量迭代每个可能的概率,那么我可以使用:

prob = np.arange(0.01, 1, 0.1)

现在假设我有 5 个事件(独立,概率总和为 1),每个事件的概率为p_i。我想要多维概率数组,例如:

1.0 - 0.0 - 0.0 - 0.0 - 0.0
0.9 - 0.1 - 0.0 - 0.0 - 0.0
0.9 - 0.0 - 0.1 - 0.0 - 0.0
0.9 - 0.0 - 0.0 - 0.1 - 0.0
0.9 - 0.0 - 0.0 - 0.0 - 0.1
0.8 - 0.1 - 0.1 - 0.0 - 0.0
0.8 - 0.1 - 0.0 - 0.1 - 0.0
.      .     .     .     .
.      .     .     .     .
.      .     .     .     . 
0.2 - 0.2 - 0.2 - 0.2 - 0.2

有没有比考虑 0 - 0.1 - ... - 1 的所有组合并删除总和不等于 1 的行更聪明的方法?如果是,最简单的方法是什么?

标签: pythonpython-3.xnumpyscipyprobability

解决方案


您可以使用itertools.productandfilter创建所有总和为 10 的组合并将其传递给数组:

import itertools
f = filter(lambda x: sum(x) == 10, itertools.product(*[range(11)]*5))
x = np.array(list(f)).astype(np.float)/10
x
>> array([[0. , 0. , 0. , 0. , 1. ],
       [0. , 0. , 0. , 0.1, 0.9],
       [0. , 0. , 0. , 0.2, 0.8],
       ...,
       [0.9, 0. , 0.1, 0. , 0. ],
       [0.9, 0.1, 0. , 0. , 0. ],
       [1. , 0. , 0. , 0. , 0. ]])

编辑

作为记录,这是一种不使用过滤的更有效的方法。本质上,您创建k垃圾箱(在您的示例中为 10),并以所有可能的组合将它们“分配”给“n”个样本(在您的示例中为 3),使用combinations_with_replacement

然后,你计算每个样本有多少个箱子:这是你的概率。这种方法理解起来更复杂,但避免了filter,因此效率更高。您可以尝试使用 0.01 ( k = 100)的除法

n = 3 # number of samples
k = 100 # number of subdivisions

f = itertools.combinations_with_replacement(range(3),k) #your iterator
r = np.array(list(f)) #your array of combinations
x = np.vstack((r==i).sum(1) for i in range(n)).T/k #your probability matrix

推荐阅读