首页 > 解决方案 > 从另一个数据集中删除一个数据集的所有行的值

问题描述

例如,我有以下 2 个数据集:

df1 =

在此处输入图像描述

df2 =

在此处输入图像描述

这里 df2 的值已经在 df1 中(第 1、4 和 5 行)。现在我必须制作另一个数据集 df3,其中只有第 2 行和第 3 行存在。

df3 =

在此处输入图像描述

我研究了很多关于拆分数据集的东西,但作为一个新学习者,我找不到它的确切解决方案。如果我说错了,请随时纠正我。如果有人可以帮助我解决这个问题,我将非常高兴。谢谢。

标签: python-3.xpandasnumpymachine-learning

解决方案


要获得 DF 的差异,请使用 drop_duplicate 方法,如下所示

pd.concat([df1,df2]).drop_duplicates(keep=False)

推荐阅读