python - 为什么多元线性回归中每个参数的p值大多小于0.05?
问题描述
import pandas as pd
import numpy as np
from sklearn import datasets, linear_model
from sklearn.linear_model import LinearRegression
import statsmodels.api as sm
from scipy import stats
df = pd.read_csv('new0110_1.csv', encoding= 'unicode_escape')
df=df.dropna(axis=0, how='any')
df_array = df.values
train_group = [2,3,4,5,6,7,8,9,10,11,12,13,14,15] #all Z
values = df_array[:,train_group]
reframed = pd.DataFrame(values, columns =
['Z','T1','T2','T3','T4','T5','T6','T7','T8','T9','T10','T11','T12','T13'])
X,Y = reframed[['T1','T2','T3','T4','T5','T6','T7','T8','T9','T10','T11','T12','T13']] ,
reframed[['Z']]
est = sm.OLS(Y, X)
est2 = est.fit()
print(est2.summary())}
df.corr()
因变量为Z。自变量为[T1、T2.....、T13]。
p值都小于0.05,是不是因为因变量和自变量有很强的相关性?
解决方案
推荐阅读
- azure - 如何在没有 Zabbix S 的情况下使用 Trapper Item
- python - 如何在两个数据帧之间保持相同的行?
- javascript - 在 React 中创建观察者组件 - 将道具传递给孩子
- maven - 如何在 Maven 构建期间允许来自特定域的自签名证书?
- ruby-on-rails - 具有 has_one 关系的模型范围
- python - selenium 使用 chrome webdriver 访问具有更改 ID 的文本输入元素
- nosql - Dynamo 通过多个条件为同一字段选择
- javascript - React - 奇怪的数据循环行为
- python - 在 python 中随机应用 Numpy 的旋转函数
- nginx - Nginx路由问题:子页面刷新到DNS_PROBE_FINISHED_NXDOMAIN错误