首页 > 解决方案 > 具有自定义概率分布的随机索引

问题描述

我有一个概率向量(当然总和为 1):

prob = [0.1, 0.3, 0.4, 0.2]

现在我需要为这个向量生成一个随机索引(包括 0 到 3 之间的数字),但我希望每个索引的概率由 prob 给出

0 will be generated with prob 0.1
1 will be generated with prob 0.3
2 will be generated with prob 0.4
3 will be generated with prob 0.2

我知道我可以通过计算 cumsum 来做到这一点

cumsum = [0.1, 0.4, 0.8, 1.0]

然后生成一个介于 0 和 1 之间的随机数:

rand_num = np.random.random()

最后用于np.digitize检查我的随机数落在哪个 bin 中。

idx = np.digitize([rand_num], cumsum)

这很有效,我对此很满意,digitize 甚至接受一个数字列表并将它们分类到 bin 中,因此我可以创建自己的函数来生成给定概率分布的索引。

我的问题是:这是一个常见问题,所以不存在执行此操作的函数吗?(这会比自己做更有效率)

谢谢

标签: pythonnumpyrandomdistribution

解决方案


您可以random.choices在 Python 3.6 中使用它,其中包含一个weights参数:

>>> from random import choices
>>> prob = [0.1, 0.3, 0.4, 0.2]
>>> choices(range(len(prob)), weights=prob)
[2]
>>> choices(range(len(prob)), weights=prob)
[3]
>>> choices(range(len(prob)), weights=prob, k=4)
[1, 2, 2, 2]

推荐阅读