首页 > 解决方案 > 如何通过唯一的rowID组合两个数据框,一个比另一个具有更少的值

问题描述

我有两个数据框。一个是输出数据集。另一个是原始数据集。由于输出数据集是预处理的;异常值和 NA 值被删除,这已经摆脱了数据集中的 rowID,因此具有较小的值。我正在尝试将分类器从输出数据集中输出到原始数据集。但是我总是遇到错误。关于如何将具有相应 rowID 的分类器值附加到原始数据集的任何建议。

谢谢你。

我的代码。

predictions=clf_A.predict(data_test)

df = pd.read_csv("/Documents/TestingSet(4) (4).csv")

for i in range(0,len(df)):
    if(df['row ID'][i]==data_test['row ID'][i])
    df['QUALIFIED'][i] = predictions[i]


df.to_csv("TestingSet(4) (4).csv", index=False)

//df-Original dataSet
//data_set=output dataset with my classifier predictions

标签: pythonpandasdataframe

解决方案


推荐阅读