pandas - 如何将原始索引保留在预测函数的numpy数组输出中
问题描述
我已经训练了一个 xgb 模型并在测试数据集上调用了一个预测函数
xg_reg.fit(X_train, y_train)
preds = xg_reg.predict(X_test)
但是,结果preds
变量是一个numpy
数组,其中索引重置为0-101
由于我y_test
是一个带有随机索引的 pandas 数据帧,因此train_test_split from (sklearn.model_selection)
我实际上无法将结果预测值映射或附加到测试数据帧。
有没有办法在预测数组中保留原始索引?
解决方案
将y_test.values()
它们直接与 preds 进行比较,将两者都视为 numpy 数组并进行比较,预测肯定会与实际数据一致,在这种情况下,索引并没有真正定义任何内容,如果您认为 preds 和 y_test 之间存在不匹配由于准确性低,这绝对是模型或数据或其他问题的错误,但预测与 y_test 匹配
推荐阅读
- android - 以编程方式将 strokeColor 设置为 CardView
- swift - 如何一次关闭我的 DimmingView 和 SlideMenu?
- java - 使用 setOnItemClickListener 接口时无法从 ListView 接收值
- javascript - 如何获得不包括背景的视频高度宽度
- mysql - “连接到本地服务被拒绝,因为......” Torsocks 错误 - 我如何连接到本地 Mysql 服务器?
- java - 在 Maven 存储库中找不到 SpringSecurityUser 类
- javascript - 使用 JS (DOM) 选择元素时遇到问题
- javascript - 如何通过变量将 JSON 传递给 highchart 热图数据标签?
- c++ - 错误:行外构造函数不能有模板参数 C++
- android - 单击另一个文件中的提交按钮后如何禁用文件中的卡片视图