xml - 我们如何使用 Google 表格中的 =IMPORTXML 函数从自定义属性或使用 Angular 生成的属性中获取数据?
问题描述
站点 URL 如下:https://fyers.in/margin-calculator/equity-margin/ 我想使用 Google 表格从符号列中抓取数据。
但是,不幸的是,我得到了#N/A 结果,我在 Google Sheet 中使用了 IMPORT XML 函数,如下所示
=进口XML(A1,B1)
A1= https://fyers.in/margin-calculator/equity-margin/ B1= //td[@data-title-text="Symbol"]
我相信这里的问题是因为网站是用 Angular 构建的,它可能会动态生成数据,或者 Google Sheets XML 不支持自定义属性,例如 data-title-text。
请让我知道我还能做些什么,谢谢。
解决方案
这有点难。网站使用动态渲染。这里肯定需要硒。但我们可以尝试使用 GoogleSheets。首先,在定位数据后,我使用 2 个 IMPORTXML 和 substring 函数来克服单元格大小限制。接下来,我使用 ARRAYFORMULA+QUERY 加入结果。然后,我拆分和移调。最后,我使用 STXT 或 REGEXEXTRACT 提取符号。
推荐阅读
- python - 我只是为了获取更新的状态
- java - 允许重复记录时,如何检查 CSV 的内容是否已上传到数据库?
- bash - SSH 断开连接后在远程路径重新打开终端
- angular - 为什么我的服务中的构造函数只调用一次?
- python-3.x - 从导入的 python 模块获取脚本文件路径
- sql - 根据 SQL Server 中每个客户的事务日期时间序列的累计净流出流量
- python - 使用行和列绘制唯一项目 - Matplotlib
- jquery - 通过前缀触发复选框和 div
- python - 循环遍历 pandas 列以获取 wmd 相似性
- c++ - Dijkstra算法超过时间限制?