python - 删除列中的重复值
问题描述
我有一个像这样的框架;
df = pd.DataFrame({'America':["24,23,24,24","10","AA,AA, XY"]})
试图将其转换为列表、设置等。但无法处理
我怎样才能删除重复项
解决方案
将自定义函数与split
and一起使用set
:
df['America'] = df['America'].apply(lambda x: set(x.split(',')))
另一个解决方案是使用列表理解:
df['America'] = [set(x.split(',')) for x in df['America']]
print (df)
America
0 {23, 24}
1 {10}
2 {AA, XY}
推荐阅读
- python-3.x - 如何修复 pydicom 的 dcmread() 前导错误?
- rust - 如何一次执行多个异步函数并获得结果?
- java - 如何为抛出 IOException 并接受 ResourceRequest 作为参数的方法编写 JUnit
- css - 带有 CSS Color Module Level 4 的 color() 函数的 Alpha 通道
- javascript - Smartphoto.js 如何跟踪对象?
- ios - 如何对来自 JSON 响应的数据进行排序并以预定义的顺序加载到表中
- javascript - 使用 JavaScript 将 JSON 对象数组转换为嵌套的 json 树
- android - 如何将混淆的 AAR 转换为 Dex?
- postgresql - Postgres:更新具有最低值的列
- android - 仍然没有解决错误 E/RecyclerView:没有连接适配器;跳过布局