首页 > 解决方案 > 机器学习,如何根据学习和训练数据进行预测

问题描述

我尝试在 python 中使用 pandas 进行一些机器学习。我的目标是根据人们的生活方式估算他们的保险费用。我从 kaggle 得到了一个不错的数据库。对我的数据集进行训练和测试非常顺利,但现在我想为一个人做一些预测,但我不知道如何开始。

我发布了到目前为止我用线性回归进行的训练和测试(我还做了很多其他的东西,比如 monte carlo,knearest,...)
,结果是训练集的准确度:0.735 测试集的准确度:0.795

那么,您建议如何继续估算另一个人的保险费用?


#Linear Regression
linreg = LinearRegression()

linreg.fit(X_train, y_train)

print("Accuracy on training set: {:.3f}".format(linreg.score(X_train, y_train)))
print("Accuracy on test set: {:.3f}".format(linreg.score(X_test, y_test)))```


标签: python

解决方案


由于您已经在 X_train 和 y_train 数据集上“拟合”了算法,因此您可以对 X_test 进行如下预测:

predictions = linreg.predict(X_test)

基本上,意味着使用作为输入和作为(目标)标签linreg.fit(X_train, y_train)进行拟合/训练。另一方面,意味着使用作为输入来产生预测,并且意味着使用作为输入进行预测,然后将预测与(目标)进行比较以获得(准确性)分数。X_trainy_trainlinreg.predict(X_test)X_testlinreg.score(X_test, y_test)X_testy_test


推荐阅读