python - 使用 Python 和 Regex 从 JSON 中的文本中删除双引号
问题描述
我有数百万个 JSON 对象,格式为字符串,里面有一点文本。例如:
'{"node": {"text": "Você entra numa livraria de livros jurídicos você tem
uma pilha de livros dizendo: "você pode fazer isso". Ao lado você tem uma
pilha de livros que contestam exatamente isso. Assim são as discussões
sobre a legalidade da flexibilização do porte de armas. Eu examinei bem
profundamente isso porque sou uma defensor da legítima defesa tive mais
tempo que o próprio presidente para observar item a item e o presidente
pode ficar tranquilo!"}}'
我能够将单引号替换为双引号,以便 JSON 模块接受它。但是由于“文本”中的双引号,我遇到了很多错误。我正在尝试编写一个正则表达式来处理它。我编写的代码不仅替换了第一个双引号,还替换了“文本”之后的那些。
re.sub(r'(:\s+"*)', ' ', text)
我如何编写一个正则表达式来清除“você pode fazer isso”中的双引号并保持“文本”之后的双引号完整?
解决方案
推荐阅读
- javascript - JavaScript 时间选择器实时插入
- python - 使用 Jupyter 在 Python 中进行 For 循环
- bash - 虚拟机及其资源的删除不能通过 shell 脚本 (azcli) 工作,而是手动工作
- unity3d - AddForce() 不适用于 PhotonNetwork 上的速度同步对象
- javascript - React Router - OnClick 不在 Navlink 中处理
- bash - 是/否 shell 脚本导致“==是”循环?
- javascript - 如何根据国家名称获取国旗代码?
- amazon-web-services - 为什么使用 Terraform 创建存储桶会引发“提供程序 provider.aws 不支持资源类型“aws_s3””错误?
- postgresql - 如何在postgresql中找到当月的第一个和第三个星期日/星期一
- ios - 无法在 swift 中使用 Process() 打开应用程序返回错误域 = NSPOSIXErrorDomain 代码 = 13“权限被拒绝”