python - Python-删除重复行 Pandas(具体)
问题描述
这是我正在处理 的数据集,看起来像这样。
基本上,我想删除重复的行,特别是我知道该drop_duplicate
命令,但我需要一些帮助。
让我通过对数据进行排序来向您展示,以便您清楚地了解它。
by_streamed=data.sort_values(by='Streams',ascending=False)
by_streamed
因此,当我获得前 10 名流媒体歌曲时,重复的歌曲显然会干扰。如果你仔细看,虽然这些歌曲的排名不同
我想删除这些类型的重复行。这是我的代码,
data=data.drop_duplicates(subset=['Artist','Title'],keep='first')
但这会删除很多不应该的行。
确实有问题,subset
但我无法解释。如果你能帮我弄清楚,那就太好了。提前致谢。
解决方案
推荐阅读
- selenium - 为什么我在无头模式下运行时没有出现浏览器?
- prestashop - 如何在 prestashop 的订单视图页面管理员中找到“重新发送电子邮件”的负责代码?
- python - 有没有办法打印 OSC 收到的所有信息?
- nuget - project.assets.json 丢失请运行 nuget restore visual studio 2019
- spring-boot - 如何自定义 Spring DefaultCorsProcessor 抛出的“无效 CORS 请求”消息?
- android - 我无法在 android Studio 中启动我的 AVD 或模拟器
- azure - 如何关闭 Azure 静态 Web 应用程序?
- angular - “颜色”属性不起作用
在 Angular Materia 的侧边导航中 - oauth - HERE API 使用 REST java 请求 OAuth 2.0 令牌
- google-cloud-functions - 通过 gcloud 命令部署时如何更改云功能的内存分配