首页 > 解决方案 > 需要正则表达式来替换双引号之外的所有逗号并替换为 | - 在蟒蛇

问题描述

我有这样的字符串:

8/30/2021 19:22,server1,app1,"user1, Mrs. user2",US,One,Email, Sent,Success

预期输出:

8/30/2021 19:22|server1|app1|user1, Mrs. user2|US|One|Email| Sent|Success

我的代码看起来像:

....
line = line.replace(',', '|')
print (line)

如何使用 RegEx 在 python 中处理双引号?

标签: pythonpython-3.xpython-2.7

解决方案


对不起,我的回答只是一个黑客,但提供了预期的结果:

from io import StringIO
import pandas as pd

s = '8/30/2021 19:22,server1,app1,"user1, Mrs. user2",US,One,Email, Sent,Success'
print("|".join(pd.read_csv(StringIO(s)).columns))

输出:

'8/30/2021 19:22|server1|app1|user1, Mrs. user2|US|One|Email| Sent|Success'

我有点猜想你可以通过谷歌搜索找到答案吗?:) 或者查看 pandas 库的源代码!

更新- 是的,5 分钟的 Google Fu 揭晓答案!在这里:https : //stackoverflow.com/a/632552/551694 请去投票。

re.sub('(,)(?=(?:[^"]|"[^"]*")*$)','|',s)

交付

'8/30/2021 19:22|server1|app1|"user1, Mrs. user2"|US|One|Email| Sent|Success'

推荐阅读