首页 > 解决方案 > 正则表达式匹配中英文标签

问题描述

我正在尝试编写一个正则表达式来提取英文和中文的主题标签内容。中文标签的表示方式与英文标签不同。使用了两个标签符号,内容就放在它们之间,例如#中国#. 此外,中文不使用空格。一个例子是

我来自#中国#。

对应的英文句子是

I'm from #China.

是否可以编写一个正则表达式来提取这两种语言的主题标签?如果是这样,怎么做?

标签: rubyregex

解决方案


string = "我来自#中国#。 I'm from #China."        
string.scan(/#\w+|#\p{Han}+#/)
=> ["#中国#", "#China"]

推荐阅读