python - 在熊猫数据框中格式化字符串
问题描述
我有一个(简化的)数据框,看起来像:
col1 col2
1 a
2 b
3 c,ddd,ee,f,5,hfsf,a
在 col2 中,我需要能够删除最后 2 个逗号之后的所有内容,如果没有逗号,则保持原样:
col1 col2
1 a
2 b
3 c,ddd,ee
同样,这被简化了,解决方案需要扩展到具有 1000 行的东西,并且每个逗号之间的空间并不总是相同
编辑:这让我走上了正确的轨道
df.col2 = df.col2.str.split(',').str[:2].str.join(',')
解决方案
.str
Pandas 通过以下属性提供对许多熟悉的字符串函数的访问,包括切片和选择:
df.col2.str.split(',').str[:3].str.join(',')
#0 a
#1 b
#2 c,ddd,ee
推荐阅读
- javascript - 如何将 CSS 添加到链接预览?
- ios - 如何从动作扩展传回文本?
- typescript - ts-loader -> file-loader 不解析需要依赖项
- html - 为什么`iframe`自动边距不在div内的iframe居中?
- html - 如何创建 3 个不同尺寸的盒子?
- javascript - 如何使用promise.all 使用mysql 插入级联样式?
- java - 在一个循环或两个单循环中在哈希映射的哈希映射中输入数据
- php - 仅获取具有最新一条评论且声誉超过 5 条的帖子
- angular - 限制日期选择器中的多个日期
- python - 熊猫将列数据转换为日期之后的新列