python - drop_duplicates() 在 Python pandas 中停止工作
问题描述
此代码以前在 python 3 中工作以删除重复值,但在整个数据帧中保持第一次出现。回到我的脚本后,这不再删除熊猫数据帧中的重复项。
df = df.apply(lambda x: x.drop_duplicates(), axis=1)
所以如果我有
a b c
0 1 2
3 4 0
0 8 9
10 0 11
我想作为输出
a b c
0 1 2
3 4
8 9
10 11
我不介意空格是否返回为“nan”
我还尝试了以下
df.drop_duplicates(subset = None, keep='first')
和
df.drop_duplicates(subset = None, keep='first', inplace =True)
欢迎任何建议/替代方案!
解决方案
附加数据后,我认为您可以使用duplicated
newdf=df[~df.stack().duplicated().unstack()]
newdf
Out[131]:
a b c
0 0.0 1.0 2.0
1 3.0 4.0 NaN
2 NaN 8.0 9.0
3 10.0 NaN 11.0
推荐阅读
- c - Why does my code terminate when I add a 7th character to my array?
- django - Django: production app on Heroku cant find templates with "path" urlpattern
- postgresql - 启动 pgpool 时,这个“验证失败”错误是什么?
- android - 错误:无法解决:com.android.support:appcompat-v7:28.0.0
- c# - Not receiving result it seems with "onActivityResult()"
- python - Format first row in ReportLab table
- r - 为什么使用 sf 包创建的 shapefile 在 ArcMap 中不显示相同的 CRS?
- google-apps-script - 如何防止 NOW 功能每次自动更新?有没有办法做到这一点?
- azure - DotNetNuke 实例无法启动
- python - 无法将 Beautiful Soup 安装到 Python 2,因为我已经在我的 Python 3 中安装了它,但我也无法导入或卸载它