首页 > 解决方案 > 在标点符号上拆分字符串(标签除外)

问题描述

如何在除 # 字符之外的任何标点符号和空格上拆分字符串?

tweet="I went on #Russia to see the world cup. We lost!"

我想像这样拆分下面的字符串:

["I", "went", "to", "#Russia", "to, "see", "the", "world", "cup", "We","lost"]

我的尝试:

p = re.compile(r"\w+|[^\w\s]", re.UNICODE)

不起作用,因为它创建“俄罗斯”而不是“#Russia”

标签: pythonregexstringsplit

解决方案


只需包括“#”

p = re.compile(r"[\w#]+", re.UNICODE)

推荐阅读