首页 > 解决方案 > 如何使用python从网页内容中提取动态数字?

问题描述

举一个我正在尝试做的例子,假设有一个网站每小时显示一次彩票结果。网页本身是静态的,周围的文本保持不变,只有数字发生变化(人工输入不会动态更新)。

就像The lucky number is: XX 表示每小时不同的数字一样。

现在我想运行一个 python 脚本,每小时解析一次数字,然后在一天结束时以一种很好的格式打印出所有数字。

我知道如何通过使用 BeautifulSoup 和 requests 库来获取网页内容并只获取没有 html 标签等的文本部分,但是我不太确定如何获取目标编号。

我在想一个像正则表达式这样的东西,它会从文本中找到一个静态单词,例如“数字是:”在这种情况下,然后在它之后抓住这个词(数字)。

这是可行的吗?如果是,如何?

先感谢您。

标签: pythonweb-scrapingbeautifulsoup

解决方案


使用正则表达式是可能的,但如果您已经知道该字符串并且它是 static ,请对该字符串使用简单的拆分。假设 var='幸运数字是:123' Out= int(var.split(':')[1])

输出将是 123


推荐阅读