python - 机器学习,如何根据学习和训练数据进行预测
问题描述
我尝试在 python 中使用 pandas 进行一些机器学习。我的目标是根据人们的生活方式估算他们的保险费用。我从 kaggle 得到了一个不错的数据库。对我的数据集进行训练和测试非常顺利,但现在我想为一个人做一些预测,但我不知道如何开始。
我发布了到目前为止我用线性回归进行的训练和测试(我还做了很多其他的东西,比如 monte carlo,knearest,...)
,结果是训练集的准确度:0.735 测试集的准确度:0.795
那么,您建议如何继续估算另一个人的保险费用?
#Linear Regression
linreg = LinearRegression()
linreg.fit(X_train, y_train)
print("Accuracy on training set: {:.3f}".format(linreg.score(X_train, y_train)))
print("Accuracy on test set: {:.3f}".format(linreg.score(X_test, y_test)))```
解决方案
由于您已经在 X_train 和 y_train 数据集上“拟合”了算法,因此您可以对 X_test 进行如下预测:
predictions = linreg.predict(X_test)
基本上,意味着使用作为输入和作为(目标)标签linreg.fit(X_train, y_train)
进行拟合/训练。另一方面,意味着使用作为输入来产生预测,并且意味着使用作为输入进行预测,然后将预测与(目标)进行比较以获得(准确性)分数。X_train
y_train
linreg.predict(X_test)
X_test
linreg.score(X_test, y_test)
X_test
y_test
推荐阅读
- php - Moodle 事件 API
- flutter - 将数组推入列表颤动
- node.js - 在 Express POST 路由中访问 URL 查询参数
- python-3.x - 列表中的 Python 模式自动匹配
- google-cloud-platform - 如何从 GCP Cloud Build 管道内提交 GCP AI Platform 训练作业?
- c++ - 为什么我收到此错误“没有构造函数实例”,CUDA 优化器中的 viennacl 库,C++ 控制台应用程序
- python - TypeError:Decimal 类型的对象不是 JSON 可序列化的
- python - 从两个包创建最终的 Python 包
- python - 向量化矩阵计算比较关系矩阵并在 Python 中取最小值
- python - Python - 我正在尝试将以下文件复制并粘贴到我的 h 驱动器中,这是个人驱动器