python - 如何通过唯一的rowID组合两个数据框,一个比另一个具有更少的值
问题描述
我有两个数据框。一个是输出数据集。另一个是原始数据集。由于输出数据集是预处理的;异常值和 NA 值被删除,这已经摆脱了数据集中的 rowID,因此具有较小的值。我正在尝试将分类器从输出数据集中输出到原始数据集。但是我总是遇到错误。关于如何将具有相应 rowID 的分类器值附加到原始数据集的任何建议。
谢谢你。
我的代码。
predictions=clf_A.predict(data_test)
df = pd.read_csv("/Documents/TestingSet(4) (4).csv")
for i in range(0,len(df)):
if(df['row ID'][i]==data_test['row ID'][i])
df['QUALIFIED'][i] = predictions[i]
df.to_csv("TestingSet(4) (4).csv", index=False)
//df-Original dataSet
//data_set=output dataset with my classifier predictions
解决方案
推荐阅读
- python - BeautifulSoup 抓取备用 div
- vb.net - 发送带附件的电子邮件失败(使用 System.Net.Mail)没有附件工作
- amazon-dynamodb - 优化 DynamoDB 读取消耗
- android - 位置侦听器不适用于网络提供商
- c++ - 无法识别的类函数副本
- c - 使用 C 语言查找 Kaprekar 常数的动态数组与普通数组
- amazon-dynamodb - 如何在不使用 hashKey 的情况下查询 dynamoDB
- angular - Angular 6在输入键上添加输入
- android - 如何通过改造上传多个文件并请求正文?
- php - Laravel:无法访问集合中的项目