首页 > 解决方案 > Python-删除重复行 Pandas(具体)

问题描述

这是我正在处理 的数据集,看起来像这样。在此处输入图像描述

基本上,我想删除重复的行,特别是我知道该drop_duplicate命令,但我需要一些帮助。

让我通过对数据进行排序来向您展示,以便您清楚地了解它。

by_streamed=data.sort_values(by='Streams',ascending=False)
by_streamed

在此处输入图像描述

因此,当我获得前 10 名流媒体歌曲时,重复的歌曲显然会干扰。如果你仔细看,虽然这些歌曲的排名不同

我想删除这些类型的重复行。这是我的代码,

data=data.drop_duplicates(subset=['Artist','Title'],keep='first')

在此处输入图像描述

但这会删除很多不应该的行。

确实有问题,subset但我无法解释。如果你能帮我弄清楚,那就太好了。提前致谢。

标签: pythonpandasdrop-duplicates

解决方案


推荐阅读