google-sheets - Googlesheet 中的 importxml 函数
问题描述
首先,我完全不称职,我为完成这项工作而进行的长达数小时的尝试都没有结果。所以,拜托,有人可以帮助我。
我有
table id="..........." tablesorter class="........"
它们位于同一行代码广告中,我可以一直抓取到第一个元素。对我来说,抓住第二个很重要。我正在尝试不同的方式,但没有
在图像中,在左侧突出显示的下拉菜单部分中,可以选择不同的美国市场(纳斯达克、道琼斯、标准普尔 500 等)。当我选择道琼斯以外的市场时,页面的 URL 始终保持不变,而我在右侧突出显示的部分发生了变化(tablesorter class = "............")。在我的工作表中,我已经这样做了,但它不能让我抓取不同的市场(只有您在打开网页时看到的默认表格)
解决方案
您的主要问题是IMPORTXML只能从网站中的静态内容中检索信息。因此,该函数无法检索任何动态插入的内容。
在您的情况下,您可以通过访问网站https://it.investing.com/equities/americas然后禁用其上的 JavaScript 来检查哪些内容不是静态的。如果您使用的是 Chrome,请按照本指南执行此操作。
由于 Javascript 会将动态内容添加到站点,当您禁用它时,您会观察到随着下拉菜单更改的信息实际上并没有改变,这意味着它是动态插入的,因此无法访问IMPORTXML
。我在下面附上了一张图片,显示了这一点。
作为解决此问题的方法,您将需要使用其他网络抓取技术。
推荐阅读
- nd4j - 如何将较小的 INDArray 复制到较大的 INDArray
- java - Java 使用 MongoCollection.countDocuments() 执行缓慢甚至超时,但不推荐使用 count() 方法是可以的
- kubernetes - Helm 和 Kustomize 有什么区别?
- excel - 提取两个特定字符或数字之间的单词
- ruby - 如果消息为空,则 Logstash 删除整行
- angular - 订阅者内部的订阅者在离子项目中无法正常工作
- java - 由于 GSON 库中的 CLOB 数据类型导致的异常
- javascript - 我有一个问题 javascript 切换索引
- react-native - 在 IOS 13 中从服务器获取消息时未设置徽章
- tensorflow-model-garden - 如何使用模型/官方/视觉/检测训练自定义模型进行对象检测?