python - 拆分韩文和数字
问题描述
我需要将韩文字母与两个数字分开。
韩文字母可以是一到三个单词,使一切变得更加复杂。
以下是我知道的一些韩国正则表达式代码范围:
ㄱ ~ ㅎ: 0x3131 ~ 0x314e
ㅏ ~ ㅣ: 0x314f ~ 0x3163
가 ~ 힣: 0xac00 ~ 0xd7a3
前面的数字始终是 4 位数字,另一个是 5 位数字。
这里有些例子:
2019개회54321
2017가51584
2019가행견16997
我需要的应该是这样的:
Var_A = "2019"
Var_B = "가"
Var_C = "23220"
提前致谢 ;)
解决方案
这里不需要正则表达式。由于您知道数字的长度,因此您可以对字符串进行切片。
要获取前 4 位数字:
yourString[:4]
要获得韩语部分:
yourString[4:-5]
要获取最后 5 位数字:
yourString[-5:]
如果你真的想要一个正则表达式,你可以使用这个:
^(\d{4})([\u3131-\u3163\uac00-\ud7a3]+?)(\d{5})$
记得打开re.UNICODE
Unicode 匹配选项。前 4 位数字、韩文文本和后 5 位数字将分别在第 1、2 和 3 组中。
推荐阅读
- google-apps-script - Google 表单的链接列表以列出 Google 表格
- powershell - 使用powershell获取“Audit Policy”安全设置值
- php - 我可以在 Ubuntu Server 20.04 上使用 PHP 5.3.29 安装 apache 吗?
- go - 转到列表:查询“最新”没有匹配的版本
- kotlin - 有没有像 Python 的 RICH 一样的库,但适用于 Kotlin?
- javascript - “可选”字段的字段验证
- java - 当请求被客户端中止时,WebFlux 如何停止发布者?
- kubernetes - Helm,K8s:是否可以将 k8s 机密中的值提取到 configmap.yaml
- html - 在烧瓶中验证 reCAPTCHA
- c# - 如何从包含 .Net 5 Web API 中的 HttpContext 数据的通用类创建响应