python - 使用 SciPy/NumPy 循环有限概率权重
问题描述
让我们有一个事件概率prob
,它是 0-1 之间的标量。如果我想以 0.1 的增量迭代每个可能的概率,那么我可以使用:
prob = np.arange(0.01, 1, 0.1)
现在假设我有 5 个事件(独立,概率总和为 1),每个事件的概率为p_i
。我想要多维概率数组,例如:
1.0 - 0.0 - 0.0 - 0.0 - 0.0
0.9 - 0.1 - 0.0 - 0.0 - 0.0
0.9 - 0.0 - 0.1 - 0.0 - 0.0
0.9 - 0.0 - 0.0 - 0.1 - 0.0
0.9 - 0.0 - 0.0 - 0.0 - 0.1
0.8 - 0.1 - 0.1 - 0.0 - 0.0
0.8 - 0.1 - 0.0 - 0.1 - 0.0
. . . . .
. . . . .
. . . . .
0.2 - 0.2 - 0.2 - 0.2 - 0.2
有没有比考虑 0 - 0.1 - ... - 1 的所有组合并删除总和不等于 1 的行更聪明的方法?如果是,最简单的方法是什么?
解决方案
您可以使用itertools.product
andfilter
创建所有总和为 10 的组合并将其传递给数组:
import itertools
f = filter(lambda x: sum(x) == 10, itertools.product(*[range(11)]*5))
x = np.array(list(f)).astype(np.float)/10
x
>> array([[0. , 0. , 0. , 0. , 1. ],
[0. , 0. , 0. , 0.1, 0.9],
[0. , 0. , 0. , 0.2, 0.8],
...,
[0.9, 0. , 0.1, 0. , 0. ],
[0.9, 0.1, 0. , 0. , 0. ],
[1. , 0. , 0. , 0. , 0. ]])
编辑
作为记录,这是一种不使用过滤的更有效的方法。本质上,您创建k
垃圾箱(在您的示例中为 10),并以所有可能的组合将它们“分配”给“n”个样本(在您的示例中为 3),使用combinations_with_replacement
然后,你计算每个样本有多少个箱子:这是你的概率。这种方法理解起来更复杂,但避免了filter
,因此效率更高。您可以尝试使用 0.01 ( k = 100
)的除法
n = 3 # number of samples
k = 100 # number of subdivisions
f = itertools.combinations_with_replacement(range(3),k) #your iterator
r = np.array(list(f)) #your array of combinations
x = np.vstack((r==i).sum(1) for i in range(n)).T/k #your probability matrix
推荐阅读
- sql - 如何根据 SQL 中多列的条件仅连接 1 列?
- python - 我想在我的自定义谷歌搜索引擎中搜索一个特定的词,然后过滤该搜索的输出以获得标题
- java - 我的 Java 程序显示错误:IOException: Stream closed - 但我没有对此 Stream 进行 close() 调用
- c++ - 创建一个数据结构,接受键值对并按值对数据进行排序
- python - 无法使用请求从网页中获取特定项目
- arrays - 为什么我的阵列在我推入它们后仍然是空的?
- python - 索引超出范围,用于减少嵌套列表的循环
- python - 如何从有条件的字典中提取值
- html - 使用 Bootstrap 4 在无限行内居中卡
- python - python删除所有重复项包括该元素