python - 寻找提取子字符串
问题描述
我正在寻找一种从一段文本中提取子字符串/许多子字符串的方法。
我需要能够从下面的字符串中提取#Covid19 和#VaccineRecovery。
今天的重要里程碑。自 3 月 21 日以来没有报告 #CoVid19 死亡的第一天。这是充满希望的一天。我们将占上风#VaccineRecovery。
基本上我需要任何以“#”开头的子字符串,直到下一个空格。可能有 1 个或多个哈希标签要从每个句子中提取。
解决方案
以下似乎可以完成这项工作。将字符串拆分为单词并检查哪个单词以#
data = 'Significant milestone today. First day with no reported #CoVid19 deaths since March 21st. This is a day of hope. We will prevail #VaccineRecovery.'
words = [x for x in data.split() if x and x[0] == '#']
print(words)
输出
['#CoVid19', '#VaccineRecovery.']
推荐阅读
- flutter - BottomNavigationBar 内的顶部 TabBar
- java - 增加 JTextField 组件的高度
- ruby - 为什么我的错误堆栈级别太深(SystemStackError)
- javascript - 减少生产应用程序的包大小
- laravel - Laravel 5.8,应用自定义规则验证失败
- python - 如何将数据从 python 发送到 javascript?
- php - 我怎样才能得到每个月的总数?
- powerbi-desktop - 在 Power BI 中,我的页面切片器不会过滤掉页面级筛选器中的数据。如果没有,是否有可能有人可以帮助我解决问题
- reactjs - 如何配置nextjs 9和ant design兼容性差?
- php - PHP登录脚本无法解密密码哈希