首页 > 解决方案 > R中的条件概率模拟

问题描述

祝你早安

我是生成数据模拟的第一步,我想实现这种情况:

为了生成具有两个变量的合成数据:性别和购买,我假设性别遵循概率为 0.5 的二项式定律。我想对 R 说来模拟条件概率:P(购买/性别是女性)= 0.25 和 p(鉴于性别是男性,购买)= 0.70。所以我使用 simstudy 编写了代码:

 <- defData(varname = "buy", dist = "binary", formula=0.5)
 dt <- genData(20, def)
 defC <- defCondition(condition = "gen == 1", dist = "binary" , formula = 0.25 )
 defC <- defCondition(defC, condition = "gen == 0", dist = "binary" , formula = 0.70)
 dt <- addCondition(defC, dt, "buy")
 dt

我尝试了另一种解决方案:

 def <- defData(def, varname = "buy", dist = "binary", formula="0.70 -  0.45*(gen == 1)")
 dt <- genData(20, def)
 dt

这两种实现在模拟过程中是否有区别?(由于这些值是概率性的,我无法仅通过观察结果来确定这两个代码之间的区别)。它们是否满足模拟的目标(条件概率)?

在此先感谢您的帮助 !

我得到的一个例子:[ 在此处输入图像描述] 在此处输入图像描述

标签: r

解决方案


推荐阅读