python - 使用python仅解析字符串中的特定字符
问题描述
尝试从列中拆分和解析字符并将解析后的数据提交到不同的列中。
我通过在给定的列数据中解析 _ 来尝试相同的方法,直到字符串中存在的 '_' 的数量固定为 2 之前,它一直运行良好。
输入数据:
Col1
U_a65839_Jan87Apr88
U_b98652_Feb88Apr88_(2).jpg.pdf
V_C56478_mar89Apr89
Q_d15634_Apr90Apr91
Q_d15634_Apr90Apr91_(3).jpeg.pdf
S_e15336_may91Apr93
NaN
预期输出:
col2
Jan87Apr88
Feb88Apr88
mar89Apr89
Apr90Apr91
Apr90Apr91
may91Apr93
我一直在尝试的代码:
df = pd.read_excel(open(r'Dats.xlsx', 'rb'), sheet_name='Sheet1')
df['Col2'] = df.Col1.str.replace(
'.*_', '', regex=True
)
print(df['Col2'])
解决方案
我想你想要这个:
col2 = df.Col1.str.split("_", expand=True)[2]
输出:
0 Jan87Apr88
1 Feb88Apr88
2 mar89Apr89
3 Apr90Apr91
4 Apr90Apr91
5 may91Apr93
6 NaN
(dropna
如果你不想要最后一行,你可以)
推荐阅读
- heroku - 我的 Heroku 自定义域在我使用 www.mywebsite.com 时有效,但在我访问 mywebsite.com 时无效
- flutter - 颤振三元运算符未按预期工作
- reactjs - TypeError:无法读取材料 ui 中未定义的属性(读取“断点”)
- javascript - 试图创建一个基本的跳跃恐龙游戏
- python - Django 数据迁移:表不存在
- ios - AVAudioRecorder 在后台运行一段时间后停止
- dask - 使用 Dask 读取包含无效数据的 CSV 列并键入 int64
- javascript - GSAP 时间线的目标克隆元素仅在单击时运行
- rust - 用于按索引从嵌套结构中检索数据的过程宏
- python - 使用 Buddy 使用 Django REST FRAMEWORK POSTGRE AS DB 测试项目时遇到问题