python - 无法访问 div,使用 BeautifulSoup
问题描述
我无法解析div id= "id="divTradeHaltResults"。当我尝试在此 div 中返回表格时,我得到None。提前致谢!
from bs4 import BeautifulSoup
import requests
my_url = "https://www.nasdaqtrader.com/Trader.aspx?id=TradeHalts"
r = requests.get(url=my_url)
page_text = r.text
soup = BeautifulSoup(page_text, "lxml")
table = soup.table
print(table)
解决方案
如果您在汤内选择该标签,您将获得该标签,但它是空的。如果您查看网页,您可以看到标签中的表格。我的猜测是这个表是用 JS 生成的(以某种形式),因此它不带有 HTML。我的解决方案是转向 Selenium 之类的东西。
这是我为选择该标签而运行的代码:
soup.find('div', {'id':'divTradeHaltResults'})
# <div id="divTradeHaltResults"></div>
如果你查看页面上的 JS,你实际上可以找到生成表格的函数,正如我上面提到的:
function GetTradeHalts()
{
document.getElementById('divTradeHaltResults').innerHTML = "updating....";
Server.BL_TradeHalt.GetTradeHalts(cb_GetTradeHalts);
setTimeout(GetTradeHalts, 1000 * 60);
}
推荐阅读
- typescript - 打字稿泛型,无需函数调用即可推断对象属性类型
- pvlib - pvlib:在给定 DNI 和 GHI 值的情况下,在 DHI 中填充空值的最准确方法
- pytorch - pytorch index_put_ 给出 RuntimeError: 'indices' 的导数未实现
- mysql - 使用 k8s StatefulSet 配置 MySQL 复制
- datetime - 在 Postman 中设置 DateStart 和 DateEnd 变量以表示“昨天”
- go - 具有私有依赖的 Vercel Golang 无服务器
- python - H2O 中的 GLRM - 性能指标返回 NaN
- javascript - 使用 javascript/ajax 下载文件并将数据发送到烧瓶
- flutter - 由于不支持的依赖项,Flutter web 失败
- computer-vision - 如何处理文本 - “程序入口点 SHGetKnownFolderPath 无法位于动态链接库 SHELL32.dll 中。”?