首页 > 解决方案 > 从字母系统更改的点拆分字符串

问题描述

我正在尝试创建一个列表,其中仅包含 1 个字母表中的项目,例如拉丁字母表或韩文。其中一个字母将始终是拉丁字母,而其他字母可能会改变。我也不希望列表中出现由单词之间的空格引起的空白项。

我想把它从字母改变的地方分开。

举个例子,我的字符串是:

"형 older brother 누나 older sister 언니 older sister 오빠 older brother" .

我想创建列表:

["형", "older brother", "누나", "older sister", "언니", "older sister", "오빠", "older brother"]

有人可以帮忙吗?

标签: pythonsplit

解决方案


使用正则表达式。

import re

s = "형 older brother 누나 older sister 언니 older sister 오빠 older brother"
#print(re.split(r"([^a-z\s]+)", s, re.IGNORECASE))
print([i for i in re.split(r"([^a-z\s]+)", s) if i])

推荐阅读