python - Python中手动线性回归函数
问题描述
我已经编写了下面的代码来定义回归分析的函数,但是它不起作用。
import numpy as np
import pandas as pd
def linear_regress(y, X):
X_trp = np.transpose(X)
b = np.linalg.inv(X_trp@X)@X_trp@y
e = y - X@b
e_trp = np.transpose(e)
sigma_sqr = (e_trp@e) / (X.shape[0] - X.shape[1])
var_b = sigma_sqr@(np.linalg.inv(X_trp@X))
SE = np.sqrt(var_b)
z_score = 1.96
upper = b+SE*z_score
lower = b-SE*z_score
CI = [lower, upper]
results = {"Regression Coefficients": b,
"Standard Error (SE)": SE,
"95% Confidence Interval": CI}
return results
它在我定义数组并运行函数时返回:
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-17-8307755b9bbc> in <module>
----> 1 linear_regress(indt, dept)
<ipython-input-16-a6336ec1997c> in linear_regress(y, X)
8 e_trp = np.transpose(e)
9 sigma_sqr = (e_trp@e) / (X.shape[0] - X.shape[1])
---> 10 var_b = sigma_sqr@(np.linalg.inv(X_trp@X))
11 SE = np.sqrt(var_b)
12 z_score = 1.96
ValueError: matmul: Input operand 1 has a mismatch in its core dimension 0, with gufunc signature (n?,k),(k,m?)->(n?,m?) (size 2 is different from 1)
你能帮我找出问题所在吗?
谢谢你的帮助!
解决方案
如果对您的数据没有适当的了解,就很难说出您做错了什么。但我猜你正在尝试实施正态方程来获得重量。如果是这样的话,这似乎太复杂了,这里有一个更简单的方法。
def LinearRegression(X, y):
X_t = X.T
theta = np.dot(np.linalg.inv(np.dot(X.T, X)), np.dot(y,X))
mean_sqr_error = np.mean((y - np.dot(theta,X.T))**2)
return theta, mean_sqr_error
推荐阅读
- vue.js - 在Vue.js中按键获取单个项目
- angular - 为什么我的加载程序会破坏 fxLayout 行换行
- javascript - 为什么 node.bcrypt.js 的哈希密码直接以 salt 为前缀?
- spring-boot - IBM Mq 之间的消息消费和发布速度减慢
- bash - 带有 AND 的 Shell 脚本测试命令
- gitlab - 为什么我不能克隆 gitlab 存储库?
- python - 使用 BeautifulSoup Python 从
- gradle - 理解 Gradle 依赖示例代码
- amazon-redshift - 在 Redshift 中解析为 json 类型?
- ethereum - 以太坊项目报“err = Error: invalid address”