web-scraping - 从investing.com 获取历史股票价格到谷歌表格
问题描述
寻找获取特定日期(例如 31.1.2020)股票价格的方法。我知道我可以使用IMPORTHTML
orIMPORTXML
一起来INDEX
获取表。但是,当我使用浏览器在investing.com 上搜索特定日期时,没有该日期的直接URL,而是向我显示最新的股票价格。这是我要找的股票
解决方案
恐怕investing.com 不提供API
https://www.investing-support.com/hc/en-us/articles/115005473825-Do-you-provide-an-API-
因此,您将无法使用 Google 表格或 Apps 脚本非常轻松地(如果有的话)做到这一点。原因是网站上的大部分内容看起来都是用 JavaScript 生成的,因此它不是您首次进入网站时显示的原始 HTML 的一部分。HTML 就是IMPORTHTML
得到的。
要在不使用 API 的情况下获取您正在寻找的信息,将涉及浏览器自动化。也就是说,模拟用户可能进行的点击,然后获取数据。这可能非常挑剔,并且每当网站出于任何原因更改其布局或 HTML 时都容易中断(对于繁忙的网站来说,这种情况往往会经常发生)。
我建议使用具有表格友好 HTML 格式的不同服务。比这更好的是,我会研究一个具有 API 并使用 Apps Script 与之交互的服务。最后,如果你需要它来投资.com,你可以研究像Puppeteer这样可以自动化浏览器的东西(尽管它比公式或 API 复杂一点)。
推荐阅读
- angular - 复杂对象中的复杂对象在角度 7 中未定义
- c# - 将 Windows-Forms ComboSox 数据源设置为列表中对象的特定属性
- node.js - 测试 AWS S3 Presigned Url 返回 403 Forbidden (Nodejs)
- java - 有界通配符和向队列添加新元素
- python - 每次运行此代码时,我都会得到 Traceback(最近一次调用),如何解决这个问题?
- c# - 是否可以使用 HttpClient / RestSharp 自动生成标头?
- java - 如何在提交之前解锁乐观锁定(在 Hibernate 中)?
- html - 在 shinyWidgets 的 pickerInput 中将子文本右对齐
- python - 如何通过 ID 将 Tkinter 窗口嵌入到另一个窗口(就像 Plug in pyGTK 一样)?
- html - HTML5 中的默认字体颜色是什么?