首页 > 解决方案 > 计算 Pandas 数据框中不同行数的最简单方法?

问题描述

我已经做了:

len(my_df.drop_duplicates())

没有更优雅的方法来做到这一点吗?在 R 中你可以这样做:

nrow(distinct(my_df))

对我来说,哪一个非常易读,drop_duplicates() 令人担忧,因为作为新的 Python 用户,我迷失了正在发生的操作以及需要存储/覆盖环境副本以保持更改的操作。

事实上,在谷歌上搜索并没有给我一个明确的一键式答案,我认为这是一个简单的功能,这让我有点担心......

谢谢!

标签: python-3.xpandasdataframe

解决方案


pandas您可以通过其他方式groupbyduplicated使用sum

df.groupby(list(df)).ngroup() 

(~df.duplicated()).sum()

同样作为一个Rpython用户,我知道这很难从 to 切换Rpandas但最常见的方式是drop_duplicates


推荐阅读