python - 如何在 patsy 中按组贬低变量?
问题描述
对于回归,我想从(许多)右侧变量(它们是交互作用)中减去组特定的平均值。
如果没有组特异性,这当然很容易。
y, X = dmatrices('lhs ~ center(x1 * k1)', df)
我怎么能用组特定的方式做到这一点?问题是右侧包含许多我不能天真地预先创建的交互术语。
所以我想预先做这样的事情:
df['x1_times_k1'] = df['x1'] * df['k1']
df['x1_times_k1_centered'] = df.groupby('group')['x1_times_k1'].transform('mean')
y, X = dmatrices('lhs ~ x1_times_k1_centered', df)
但这不可行,有什么建议吗?
编辑 或者:有没有办法在 scikit 中按组标准化数据?
解决方案
推荐阅读
- javascript - 当我尝试在 JSP 中加载 JSON 文件时出错
- python - Flask login_required 访问静态文件夹中的子目录
- javascript - 如何:延迟订阅弹出窗口 - jQuery
- excel - 如何在 dot net core 中使用 OpenXML 保存 .xls 文件?
- firebase - Flutter:即使应用程序关闭,如何发送推送通知?
- reactjs - 错误:纱线启动 - 错误命令“start”未找到
- javascript - Paypal 智能按钮 – 延迟触发“onApproval”会导致问题
- docker - Windows 10 企业版 Docker 安装失败
- excel - 如何从excel单元格中提取文本
- python - 如何使用python检测相同颜色的相邻线以检测损坏区域?