首页 > 解决方案 > 删除列中的重复值

问题描述

我有一个像这样的框架;

df = pd.DataFrame({'America':["24,23,24,24","10","AA,AA, XY"]})

试图将其转换为列表、设置等。但无法处理

我怎样才能删除重复项

标签: pythonpandas

解决方案


将自定义函数与splitand一起使用set

df['America'] = df['America'].apply(lambda x: set(x.split(',')))

另一个解决方案是使用列表理解:

df['America'] = [set(x.split(',')) for x in df['America']]

print (df)
     America
0   {23, 24}
1       {10}
2  {AA,  XY}

推荐阅读