首页 > 解决方案 > 回归中的系数太多

问题描述

我有一个包含大约 800 个点的数据框。该表大致如下所示:

V4 V92
.5 .02
.25 .12
.5 1.02
.45 -.02
.5 .32
1.5 .42

这持续了大约 850 行。

我使用以下代码对此进行了线性回归:

lmMRE <- lm(data.frame$V92~data.frame$V4)

出于某种原因,当我运行这段代码时,我的回归有 157 个系数。

为什么会这样?我该如何改变这个,所以我只有 1 个?

谢谢!

标签: rlinear-regression

解决方案


您的输入数据显然有问题。模拟您的数据会给出预期的一个系数。检查您的依赖数据和独立数据是否都是数字的。

请参阅下面的代码。

library(tidyverse)

#create fake data
my_data <- data.frame("V4" = 1:800 + rnorm(800, 0, 2),
                      "V92" = seq(from = 1, to = 100, length.out = 800) ) 

#run regression
lmMRE <- lm(my_data$V92~my_data$V4)

#one coefficient
lmMRE

my_data %>%
  ggplot(aes(x = V4, y = V92)) +
  geom_point()+
  geom_smooth(method=lm) +
  labs(title = "Sample regression",
       subtitle = paste0("Number of coefficients: ",
                         length(lmMRE$coefficients) - 1))

样本回归


推荐阅读