regex - Pandas 列在特定单词后选择行正则表达式数字
问题描述
我正在尝试为 pandas 数据框中的以下行提取“Purchase Id:XXXXXXXX”,但我不确定要选择的正确正则表达式表达式以 Purchase Id 开头并在数字之后结束。
我现在拥有的:
描述 |
---|
“网上订单采购编号:14527903 收费编号:11111111” |
“在线订单采购编号:90762134 收费编号:33345872” |
期望的结果:
描述 |
---|
采购编号:14527903 |
采购编号:90762134 |
解决方案
试试这个来匹配之后的任意位数Product Id:
:
df['Description'].str.extract('(Purchase Id: \d+)')
或此匹配后的 8 个字符Product Id:
:
df['Description'].str.extract('(Purchase Id: .{8})')
输出:
0
0 Purchase Id: 14527903
1 Purchase Id: 90762134
推荐阅读
- c# - Calculate event rate per second
- python - Panda Group by time and count value of column
- bixby - Bixby viv 中已弃用的项目
- email - 如何使用身份验证发送邮件?
- php - 在 Symfony 中找不到 FIND_IN_SET 方法
- c# - 是否有可能制造急性肘部?
- java - 尝试在 Spring Boot REST API 中下载文件时如何修复“找不到资源”?
- azure - Azure 中“企业应用”和“应用注册”的区别
- c# - 在 c# 中获取 neo4j 响应
- mqtt - Mosquitto client can't publish message to EMQ X Broker