首页 > 解决方案 > 如何从字符串中删除所有 Unicode,但保留语言,例如:日语、希腊语、印地语等

问题描述

我如何从这个字符串中删除所有 Unicode【你好!】★ ああああ 我需要删除所有“奇怪的”符号(【、★、】)并保留“你好!” 和“ああああ”。这需要适用于所有语言,而不仅仅是日语。

标签: javascriptregexunicode

解决方案


您希望删除Unicode 类别中的其他符号、组合符号和封闭标记中的字符,但保留其他类别中的字符。

使用正则表达式,它们分别匹配\p{So}\p{Sk}\p{Me}。例如,您可能会使用XRegExp.replace().


推荐阅读