python - 如何在 Python (Statsmodels) 中编写线性混合效应模型的公式?
问题描述
请耐心等待,因为我是这个级别的统计数据和 Python 的新手。我已经阅读了 statsmodels 和 patsy 的所有文件,但仍有疑问。
我正在尝试使用 statsmodels MixedLM 分析纵向数据。简化一点,我有 5 个变量,自变量之间没有共线性:
- 结果:因变量。
- 患者:随机效应,因为每个患者都对结果进行了多次测量
- 时间:固定效应
- 有针对性:固定效应,0 = 否,1 = 是,患者是否是针对结果进行干预的目标
- 性别:固定效应,0=男性,1=女性
我想知道两件事:
- 患者是否被靶向与随时间推移的结果趋势之间是否存在关联?
- 随着时间的推移,患者性别和结果趋势之间是否存在关联,仅在目标群体中?
也许很重要:我实际上并没有试图做出任何预测。只是准确地解释我已经拥有的数据。
为了回答第一个问题,我尝试了:
md = smf.mixedlm('outcome ~ time * targeted', df, groups = df['patient'])
这个符号正确吗?或者我应该使用:
md = smf.mixedlm('outcome ~ time : targeted', df, groups = df['patient'])
更好地比较结果趋势的差异?或者是其他东西?
为了回答第二个问题,我尝试了:
md = smf.mixedlm('outcome ~ time * targeted * sex', df, groups = df['patient'])
但我认为这是不正确的,因为系数没有意义。目标患者的起始结果需要> 6,但目标:性别的系数< 6。一种解决方案是制作一个仅包含目标患者的单独数据框,但我很好奇是否有操作员我可以在这里用不同的方式得到我想要的。
谢谢!
解决方案
推荐阅读
- layout - Filemaker——如何在多个页面上显示子摘要
- php - 在 WooCommerce 中创建订单时过滤商品单价
- sql - SQL 多个左连接:A 到 B,然后 A 到 C
- python - 如何有效地将时间/日期字符串解析为日期时间对象?
- c# - SQLite 事务回滚与内存数据库不同
- r - write.csv 给出“文件错误(文件,ifelse(追加,“a”,“w”)):无法打开连接”
- java - 获取打印字符串之间的空格
- mysql - MYSQL 过程:循环遍历 Text 列的不同值并创建临时表
- excel - 为什么 CSV 文件在保存后会损坏?
- powerbi - PowerBI-Drill Down Map PRO by ZoomCharts 颜色和光环功能