python-3.x - 在熊猫数据框中查找包含各种类型列表(列表)的重复行
问题描述
背景
我有以下df
包含列表类型的混合
import pandas as pd
df = pd.DataFrame({'Size' : [[[['small', 'small', 'big', 'big']]], [['big', 'small','small']], ['big'], ['big']],
'ID': [1,2,3,3],
'Animal' : [['cat', 'dog', 'dog', 'cat'], ['dog', 'pig','dog'], ['pig'], ['pig']]
})
看起来像这样
Animal ID Size
0 [cat, dog, dog, cat] 1 [[[small, small, big, big]]]
1 [dog, pig, dog] 2 [[big, small, small]]
2 [pig] 3 [big]
3 [pig] 3 [big]
问题
我使用以下
df.duplicated()
我收到以下错误,因为我的数据框包含列表(至少我认为这就是原因)
TypeError: unhashable type: 'list'
问题
如何检查包含多种类型列表的数据框中的重复行?
解决方案
df.loc[df.astype(str).drop_duplicates().index]
推荐阅读
- python - 如何在 Django auth_views 中使用我自己的模板?
- javascript - 在laravel中将日期函数传递给javascript
- javascript - DarkSky 代理 - “请求未发送。错误:缺少经度或纬度。” - 节点 JS 请求 URL,不知道为什么不工作
- matlab - 未定义的函数或变量“x”
- ruby-on-rails - 带有 selenium/standalone-chrome 的 dockerized Rails 5 应用程序中 RSpec 系统测试的 SSL 错误
- gis - ST_Polygonize/Shapely 在与共享节点/点重叠时无法多边形化
- swift - 退出函数无意中关闭了两个视图控制器而不是一个
- ios - 如何处理从 ios 应用程序单击返回到 Safari 按钮
- haxe - 在 HashLink 上使用套接字读取 HTTP 请求
- python-3.x - Python 3 中的 Int 对象不可调用错误