python-3.x - 带有 statsmodels 的 sm.OLS.from_formula('variable1 ~ variable2 + x ') 问题
问题描述
如果我运行该函数advanced_stats(['one', 'two', 'three'], 'myFile.csv')[0].summary()
,或者advanced_stats(['one', 'two', 'three'], 'myFile.csv')[0].pvalues
下面的函数将输出file[independent]
,file[dependent]
而不是实际名称'one', 'two' or 'three'
,我需要在输出值时知道列名。计算和代码完美运行,但标签很重要,因为我将它们用作我的数据框的一部分。所以,我需要知道如何输出标题 'one' 而不是file[dependent]
.
def advanced_stats(categories, file):
finalData = []
for dependent in categories:
for independent in categories:
if dependent == independent:
pass
else:
model = sm.OLS.from_formula('file[dependent] ~ file[independent] + age + sex + height', file).fit()
finalData.append(model)
return finalData
解决方案
model = sm.OLS.from_formula('file[dependent] ~ file[independent] + age + sex + height', file)
model.exog_names[:] = [dependent if x=='file[dependent]' else x for x in model.exog_names]
model.exog_names[:] = [independent if x=='file[independent]' else x for x in model.exog_names]
result = model.fit()
finalData.append(result)
推荐阅读
- android - 如何在android中增加每天的 Place Api 请求限制?
- r - mlr:测试 FailureModel 的最佳方法是什么?
- python - 无法使用请求解析来自网页的视频链接
- javascript - 如何在不使用位置属性的情况下重叠表格(td)文本
- wordpress - 带有请求批准表和用户页面上的批准检查的 Wordpress 插件
- r - 使用 dplyr 的多个 group_by
- haskell - 使用 -hy 进行 GHC 堆分析 - 什么是 ->、->>、->>>?
- html - 锚标签上“rel”属性的默认值是多少?
- google-apps-script - 来自 Google Apps 脚本的 Google 日历中的第三方会议
- c# - C# SHA256 RSA 签名。如何从 byte[] 符号中获取字符串?