首页 > 解决方案 > 如何通过按单元格删除重复项将数字数据框的 ColA 转换为按每个单元格值排序?

问题描述

我有一个如下所示的数据框

可乐
5544412
564256
34342

我正在寻找如下输出:

可乐 Col_B
5544412 12345
5642356 23456
34342 234

标签: pythonpandasdataframe

解决方案


将每一行转换为一个字符串,然后作为一个集合,对值进行排序并连接每个数字。最后将新字符串转换为数字:

df['Col_B'] = df['Col_A'].apply(lambda x: ''.join(sorted(set(str(x))))).astype(int)

输出:

>>> df
     Col_A  Col_B
0  5544412   1245
1   564256   2456
2    34342    234

推荐阅读