python - 正则表达式拆分标点符号和空格,括号内除外
问题描述
我正在尝试标记一个字符串,其中所有标点符号都成为它自己的标记。但是,我不需要在括号内拆分文本。
例句:我想将 [InsideBrackets] 和 [Inside Brackets] 保持在一起,同时删除其他标点符号。
过了一会儿,我想出了这个:
re.findall(r"\[?\w+\]?|[^\w\s]",str_here)
产生:
['I' , 'want' , 'to' , 'keep' , '[InsideBrackets]' , ',' , 'as' , 'well' , 'as' ,
'[Inside' , 'Brackets]' , ',' , 'together',',','while','removing','other','punctuation','.']
但我还没有弄清楚如何在括号内不分割空格。我找到了几种方法来做到这一点,但它们都打破了标点符号的分裂。我需要做出什么改变?
解决方案
推荐阅读
- node.js - 如何在 nodeJs 和 Ajax 中加载评论而不刷新页面
- reactjs - 来自通量存储的数据返回 null
- python - & 解压 bz2 文件时出乎意料
- javascript - Javascript - 使用数据间隔、年份过滤器和输入过滤器进行表格搜索
- javascript - 如何使用 jsf 和 javascript 显示数据?
- awk - 如何使用 vim 命令或 sed/awk 命令将具有不同列数的行分隔到另一个文件中?
- javascript - Knockout JS foreach 作为函数的输入
- swift - SwiftUI TabView 在添加/删除 CoreData 的元素期间给出错误消息
- javascript - 如何使用 Mongoose 获取数组中的特定对象
- html - 页脚与内容无关(Vuejs)