首页 > 解决方案 > 是否有用于编写 R-Style 线性回归点 (.) 以表示所有自变量的 python 操作

问题描述

我的问题是关于模拟线性回归的 R 函数的符号或 python 运算符。

假设我们有数据,我们想将因变量表示为自变量的函数。在 R 中,有一种表示自变量的简单方法。可以使用点 (.) 操作来表示所有变量,而不是列出所有自变量。但是,我似乎没有在 python 中找到与 R 完全相同的操作。运算符冒号“:”用于两列之间的交互,星号“*”用于列列表及其交互。

例如,假设保险有 6 个自变量。

model <- lm(expenses ~ age + children + bmi + sex + smoker + region,
                data = insurance)

可以使用点“。”,而不是列出公式中的所有自变量。操作是指它包含所有变量,因此,它可以缩短为:

model <- lm(expenses ~ .,
                data = insurance)

我正在寻找一个与 R 中产生类似效果的运算符 Python。

import statsmodels.formula.api as smf

model = smf.ols(formula = 'expenses ~ age + children + bmi + smoker + region', data = insurance).fit()

import statsmodels.formula.api as smf在 python 中使用以获得与 R 类似的结果,但不幸的是,我似乎没有找到可以缩短公式的东西。

标签: pythonrlinear-regressionstatsmodels

解决方案


推荐阅读