首页 > 解决方案 > 用 BeautifulSoup 解析一些 HTML 代码

问题描述

我正在尝试解析特定网站上的一些数据,我已经找到了我需要的数据的确切位置,但是当我在 chrome 中检查它时,我看到了我需要的数据,时间,当检查时在 chrome 上是这样的:

<span data-push="clock">Half Time 34:11</span>

但是,当我在 python 中找到这个特定文本时,时间无处可寻(我怀疑它是隐藏的)(见附件第二张图片),这些数据显然在不断更新,有没有办法在 python 中找到这些数据?这是我的代码中返回的内容:

<span data-push="clock"></span>

主要问题是我不确定这些数据是否为我隐藏,或者我在解析中做错了什么。由于我找到了正确的代码行,我不确定是后者。

谢谢

标签: pythonbeautifulsoup

解决方案


如果使用 javascript 放置时间,则仅使用 bs4 和 python 无法获得,您必须使用selemium webdriver -> 在浏览器中打开网页 -> 捕获源 -> 然后使用 bs4 从网页中获取所需的文本资源。


推荐阅读