首页 > 解决方案 > 从两个变量创建和采样联合分布

问题描述

我有一个问题一直困扰着我。

我有一个熊猫数据框,其中有两列对应于每行ab系数(它们不是独立的):

            a          b
0   13.967158   2.370449
1   12.375649   2.199846
2   12.005615   2.268646
3   12.030142   1.542835
4   12.119529   1.570510
... ... ...
63  12.215212   1.677631
64  12.221597   1.483855
65  12.758342   2.311847
66  11.712199   2.505323
67  12.393513   1.402272

这些可以绘制为:

联合分配

由此,我需要从ab变量的联合分布中生成随机样本,但我不知道该怎么做。我尝试从这些变量中的每一个的正态分布中生成随机样本,使用np.random.normal(mean_variable, sd_variable, 1000). 但是,在创建这些值之后,我不确定如何加入它们。在这方面的任何想法都会非常有用。问候

标签: pythonpandasnumpystatisticsdistribution

解决方案


您需要对多元正态分布进行采样的函数。此函数需要一个一维均值数组和一个二维协方差数组,这两者都可以从您的数据帧中轻松计算出来:

numpy.random.multivariate_normal(df.mean(), df.cov())
#array([11.69993186,  1.64400885])

推荐阅读