首页 > 解决方案 > sklearn 中的数据重塑(线性回归)

问题描述

输入代码:

data = pd.read_csv('test.csv')
data.head()

data['Density'] = data['Flow [Veh/h]'] / data['Speed [km/h]']
data = data.replace(np.nan, 1)

X = data['Density']
y = data['Speed [km/h]']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=101)

from sklearn.linear_model import LinearRegression
lm = LinearRegression()
lm.fit(X_train,y_train) #HERE I GOT AN ERROR

如果您的数据具有单个特征,则使用 array.reshape(-1, 1) 重塑您的数据,如果它包含单个样本,则使用 array.reshape(1, -1) 。

标签: anacondalinear-regression

解决方案


您可以尝试更改变量 X 如下:

X = 数据['密度'].values.reshape((-1, 1))

我遇到了同样的错误,我的功能集只有一个变量。上述更改为我解决了这个问题。


推荐阅读