python - 在标点符号上拆分字符串(标签除外)
问题描述
如何在除 # 字符之外的任何标点符号和空格上拆分字符串?
tweet="I went on #Russia to see the world cup. We lost!"
我想像这样拆分下面的字符串:
["I", "went", "to", "#Russia", "to, "see", "the", "world", "cup", "We","lost"]
我的尝试:
p = re.compile(r"\w+|[^\w\s]", re.UNICODE)
不起作用,因为它创建“俄罗斯”而不是“#Russia”
解决方案
只需包括“#”
p = re.compile(r"[\w#]+", re.UNICODE)
推荐阅读
- jenkins - 批处理文件未完全执行。
- ios - 如何在 SwiftyJSON 中使用数组解析数组和数组?
- python - 在过去的日期戳和现在之间获取python中的日期
- android - 显示多个通知
- c++ - VC++ std::current_exception 在未捕获的异常中返回 null
- amazon-web-services - 在 AWS API Gateway 中映射 API 密钥和外部账户 ID
- php - 到 Geojson 的 PDO 语句
- r - 在分组小提琴/箱线图中居中 x 轴标签
- c# - 生成具有特定间隔的随机数
- php - 如何将 google place api 图像传递给 WordPress 帖子缩略图