python - 如何使用python从网页内容中提取动态数字?
问题描述
举一个我正在尝试做的例子,假设有一个网站每小时显示一次彩票结果。网页本身是静态的,周围的文本保持不变,只有数字发生变化(人工输入不会动态更新)。
就像The lucky number is: X
X 表示每小时不同的数字一样。
现在我想运行一个 python 脚本,每小时解析一次数字,然后在一天结束时以一种很好的格式打印出所有数字。
我知道如何通过使用 BeautifulSoup 和 requests 库来获取网页内容并只获取没有 html 标签等的文本部分,但是我不太确定如何获取目标编号。
我在想一个像正则表达式这样的东西,它会从文本中找到一个静态单词,例如“数字是:”在这种情况下,然后在它之后抓住这个词(数字)。
这是可行的吗?如果是,如何?
先感谢您。
解决方案
使用正则表达式是可能的,但如果您已经知道该字符串并且它是 static ,请对该字符串使用简单的拆分。假设 var='幸运数字是:123' Out= int(var.split(':')[1])
输出将是 123
推荐阅读
- c# - 处理 Microsoft.AnalysisServices 更新方法上的错误
- certificate - VOIP 服务无法在生产环境中运行,但在测试服务器中运行良好
- bash - 将文件复制到bash中的多个目录中
- google-cloud-platform - 组织不会作为迁移选项出现在 Google Cloud Platform Console 中
- json - React Native 渲染嵌套的 Json
- python - 插入以在一行中使用 for 循环从列表中读取多个键 - dict.setdefault
- sql-server - 根据 TableB 中的值更新 TableA 值(多个选项)
- vba - 条件格式,虽然应用了没有格式出现
- javascript - Javascript / Angular - 函数运行太快
- sql - Amazon Athena 从该方向获取所有文件,而不是一个文件