首页 > 解决方案 > 从另一个删除数据框而不删除重复项

问题描述

我有一个大小为 [21,4] 的数据帧 df1 和一个大小为 [10200,4] 的数据帧 df2。我希望从 df2 中删除 df1 的值,使其大小为 [10179,4]

我已经看到很多使用 drop duplicates 功能的帖子,但是我不想在 df2 数据框中删除任何重复项,我只想删除 df1 值。我努力了

result=df1[~df1[['decel','accel','corner','vert']].apply(lambda x: np.in1d(x,df2).all(),axis=1)]\.reset_index(drop=True)

但没有成功!非常感谢您的帮助

更新:使用代码:

Xfinal = pd.merge(X, dropthese, on=['decel','accel','corner','vert'], how='outer', indicator=True).query("_merge != 'both'").drop('_merge', axis=1)

允许我从 df2 中删除 df1,但是重新排序 df2,将相似的值分组。有没有办法保持顺序不变?谢谢

标签: pythonpandasdataframe

解决方案


推荐阅读