python - 正则表达式:赛后拿走一切
问题描述
我在数据框中有很多字符串,例如:
adrianos ristorante 2930 beverly glen circle los angeles 310475 9807 italian
我想把电话号码后面的所有单词/字符。([0-9]{6}\s[0-9]{4})\s
我有用于在( )之后获取电话号码和空格的正则表达式。我想要的是这之后的所有角色。在这种情况下,它是italian
但它可能类似于asian fusion
or indian and thai
。
解决方案
在 Pandas 中,您可以使用
[0-9]{6}\s[0-9]{4}\s+(.+)
^^^^^
代码看起来像
df['col'].str.extract('[0-9]{6}\s[0-9]{4}\s+(.+)')
请注意,您应该使用捕获组包装需要提取的部分,(...)
. 请参阅熊猫参考:
拍:字符串
带有捕获组的正则表达式模式
推荐阅读
- r - 重复测量的描述性统计和箱线图?
- tensorflow - 模型训练 - 对象的裁剪图像 VS 带有边界框的更大图像
- visual-studio-code - 如何在独立的 monaco 编辑器实例中显示诊断信息?
- python - 如何在一行中读取多个输入?
- excel - 选择和删除组内的行
- html - 内容适合窗口
- python - 如何从 python 子进程执行 netcat 命令?
- reactjs - ref.current.onSnapshot 不是函数
- asp.net - 如何在 Stimulsoft Report 中为图像设置圆角?
- javascript - @aws-sdk/lib-storage 使用 JSONStream.stringify() 将 JSON 从 MongoDB 流式传输到 S3