parsing - 从动态变化的 url 源解析表
问题描述
我想从下面的 url 解析跨越许多页面的表格
https://www.marketscreener.com/tools/stock-screener/
但是,页面 url 地址会在每次点击时动态变化(即使表中的数据保持不变)。我不太熟悉最近的网站/网页开发技术。我有一些经验,requests/lxml.xpath
但是如何将动态 url 地址传递给“ requests.get
”我试图从Network
chrome 的选项卡中获取源容器,但这似乎也不起作用。
编辑_1:
除了@Andrej Kesely 评论,基本上我想要的输出是.//table//tbody/td/tr//a href
我可以通过常规lxml.xpath
函数获得的 href 数据。在此之前,我真正面临的挑战是 url 地址不断变化。所以,我在requests.get
级别传递静态 url 时遇到了麻烦。希望我说清楚。
解决方案
推荐阅读
- system-verilog-dpi - 在 systemverilog 和 DPI-C 之间使用定义
- qt - 当文本包含阿拉伯语单词时如何检查文本的自动对齐
- haskell - 为什么第三个 let-in 语句有错误?
- ios - 如何将多个数组字符串加入单个数组?
- node.js - Upsert 和 $inc 数组中的子文档
- dart - 颤动单选按钮的问题
- html - 在chrome中选择高于文本框和按钮
- amazon-web-services - 使用自定义 SAML 2.0 应用程序实施 AWS SSO
- php - PHP Laravel 按周从 db 获取数据
- angular - Angular observable 没有从烧瓶服务器捕获新值