r - R中的条件概率模拟
问题描述
祝你早安
我是生成数据模拟的第一步,我想实现这种情况:
为了生成具有两个变量的合成数据:性别和购买,我假设性别遵循概率为 0.5 的二项式定律。我想对 R 说来模拟条件概率:P(购买/性别是女性)= 0.25 和 p(鉴于性别是男性,购买)= 0.70。所以我使用 simstudy 编写了代码:
<- defData(varname = "buy", dist = "binary", formula=0.5)
dt <- genData(20, def)
defC <- defCondition(condition = "gen == 1", dist = "binary" , formula = 0.25 )
defC <- defCondition(defC, condition = "gen == 0", dist = "binary" , formula = 0.70)
dt <- addCondition(defC, dt, "buy")
dt
我尝试了另一种解决方案:
def <- defData(def, varname = "buy", dist = "binary", formula="0.70 - 0.45*(gen == 1)")
dt <- genData(20, def)
dt
这两种实现在模拟过程中是否有区别?(由于这些值是概率性的,我无法仅通过观察结果来确定这两个代码之间的区别)。它们是否满足模拟的目标(条件概率)?
在此先感谢您的帮助 !
解决方案
推荐阅读
- python - 如何在bot框架v4中使用python发送带有响应消息的元数据
- python - 根据Python中单独列中的值更改条形图中条形的颜色
- tailwind-css - 创建一个带有 2 个列的 tailwindcss 响应式网格:一个固定一个拉伸
- c# - c# OdataClient: DataServiceActionQuery,如何执行 Microsoft Dynamics 365 Business Central 的功能?
- sonarqube - FARGATE 上的 Sonarqube 因错误而失败
- github - git merge 抛出错误“致命:拒绝合并不相关的历史”
- pandas - 将列中的多级索引删除到单级
- json - Azure json 部署在现有中心路由表中添加分支路由
- c# - 在测试(NUnit)中运行时的内存使用量比在正常模式下(WinForms 应用程序)大得多
- javascript - 使用 new Date() 反应倒数计时器