python - 从字母系统更改的点拆分字符串
问题描述
我正在尝试创建一个列表,其中仅包含 1 个字母表中的项目,例如拉丁字母表或韩文。其中一个字母将始终是拉丁字母,而其他字母可能会改变。我也不希望列表中出现由单词之间的空格引起的空白项。
我想把它从字母改变的地方分开。
举个例子,我的字符串是:
"형 older brother 누나 older sister 언니 older sister 오빠 older brother"
.
我想创建列表:
["형", "older brother", "누나", "older sister", "언니", "older sister", "오빠", "older brother"]
有人可以帮忙吗?
解决方案
使用正则表达式。
import re
s = "형 older brother 누나 older sister 언니 older sister 오빠 older brother"
#print(re.split(r"([^a-z\s]+)", s, re.IGNORECASE))
print([i for i in re.split(r"([^a-z\s]+)", s) if i])
推荐阅读
- powershell - 行中的额外字符
- eclipse - 很少有调试点在 Mac 的 Eclipse 中不起作用
- django - Django Profile 不使用 UserModel 保存其他字段
- c# - 尝试按列名获取值时无法将“String”转换为“int”
- php - 如何将 joomla 的日期格式更改为 d/m/Y?
- sql-server - 如何导出选择查询的消息部分(JARED ZAGELBAUM RESTORE for SQL Server Express)
- node.js - AWS Lambda 函数在控制台上测试时有效,但在 CloudWatch 事件触发时无效
- machine-learning - H2O AutoML 如何处理因子变量?
- javascript - 单击对象中最后一个图像之后的图像时,我将如何切换图像?
- c# - 文本框数据在 ddl 中反映两次