python - 使用 .fit(线性回归)时出错
问题描述
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
dataset = pd.read_csv('C:/Users/seemarahul/Downloads/adult-1.csv')
X = dataset.iloc[:,0:15].values
Y = dataset['income']
y_train: object
X_train,X_test,y_train,y_test= train_test_split(X,Y,shuffle=True,test_size=0.3)
lin = LinearRegression()
lin.fit(X_train,y_train)
y_pred = lin.predict(X_test)
coef = lin.coef_
components = pd.DataFrame(zip(X.columns,coef), columns=['component','value'])
components = components.append({'components':'intercept','value':lin.intercept_}, ignore_index=True )
这是我的代码,它出现了一些错误并被重定向到base.py
这条线出现错误
lin.fit(X_train,y_train)
我尝试了多种将数据添加到 X 和 Y 变量的方法,但都不起作用
解决方案
看看错误。它告诉您在您的或变量'Private'
中存在一个值。看起来它是基于回溯的第五行。X
Y
X
'Private'
是一个字符串,不能转换为浮点数,因此会引发错误。
推荐阅读
- python - 字数频率:去除停用词
- bash - 用户输入中的 Bash 自动完成,Makefile
- mysql - SQL 从视图中的 4 个表中选择
- c++ - C++ 如何在同一个类中声明类的双端队列?
- dns - Windows 10 DNS 客户端崩溃,我无法重新启动它
- security - 动态内存分配期间的数据安全
- java - 如何从外部paint() 绘制变量?
- c++ - 如何使用 sd-bus 获取服务状态?
- javascript - NodeJS http服务器未发送整个缓冲区/获取未获取整个缓冲区
- opencv - 为什么 OpenCV 可以等待流式 CUDA 操作而不是异步进行?