首页 > 解决方案 > 在熊猫数据框中格式化字符串

问题描述

我有一个(简化的)数据框,看起来像:

col1 col2
1     a
2     b
3     c,ddd,ee,f,5,hfsf,a

在 col2 中,我需要能够删除最后 2 个逗号之后的所有内容,如果没有逗号,则保持原样:

    col1 col2
1     a
2     b
3     c,ddd,ee

同样,这被简化了,解决方案需要扩展到具有 1000 行的东西,并且每个逗号之间的空间并不总是相同

编辑:这让我走上了正确的轨道

 df.col2 = df.col2.str.split(',').str[:2].str.join(',')

标签: pythonpandasdataframe

解决方案


.strPandas 通过以下属性提供对许多熟悉的字符串函数的访问,包括切片和选择:

df.col2.str.split(',').str[:3].str.join(',')
#0           a
#1           b
#2    c,ddd,ee

推荐阅读