首页 > 解决方案 > 从动态页面捕获结果

问题描述

我在谷歌表格中使用 javascript,但如果可能的话,我可以使用 .net 技术来解决这个问题,因为我在谷歌表格中看不到这样做的方法(还)。

我想从网站捕获页面内容。信息不是静态的。根据我传递的参数,我会得到不同的结果。

例如,https://www.hapag-lloyd.com/en/online-business/tracing/tracing-by-booking.html?blno=HLCUEUR181027806#

这将返回与提单编号 HLCUEUR181027806 关联的页面,然后我可以使用 Google 表格的 ImportXML 函数对其进行解析。

我似乎无法使用 Google Sheet 的 ImportXML 功能,因为它不适用于根据提供的参数更改内容的动态页面。

问题是,这是否可以通过任何方式,使用任何技术,以编程方式发送对动态页面的请求,等待结果返回,并捕获其输出,以便我可以解析它并找到从中获取关键信息。

我了解 .net、c# 和学习 Web 开发。

请参阅相关问题:

从 ImportXML 获取日期时遇到问题。需要选项

标签: javascriptc#restweb-servicesgoogle-sheets

解决方案


您需要一个可以加载页面并等待它呈现的无头浏览器(原因是 javascript 在客户端呈现页面)然后解析 html。

您可以在此页面中选择任何支持 .net 的

您的另一个选择是查看流量并使用私有 Api(效率更高但更难)


推荐阅读