首页 > 解决方案 > 如何通过使用 R 选择正确的输入从网站下载数据(查询不会更改 URL)

问题描述

我是网络抓取的新手。我想从这个网站提取数据:https ://bpstat.bportugal.pt/dados/explorer

我已经设法使用 httr 包使用 GET() 函数获得响应(即使每次运行代码时都不是肯定的)。

library(httr)
URL <- "https://bpstat.bportugal.pt/dados/explorer"
r <- GET(URL)
r
Response [https://bpstat.bportugal.pt/dados/explorer]
  Date: 2020-04-09 22:25
  Status: 200
  Content-Type: text/html; charset=utf-8
  Size: 3.36 kB

我想发送一个请求,其中包含我将手动提供的这些信息:

我见过几个例子,比如: -使用 httr R 包发送一个 POST 请求, 但我不知道我需要提供什么输入......

标签: rweb-scrapinghttr

解决方案


该网站有一个记录在案的 API,您可以使用它来提取数据,而不是尝试在https://bpstat.bportugal.pt/data/docs/上抓取页面

输出是 JSON-stat,您可以使用https://github.com/ajschumacher/rjstat使它们更易于处理。


推荐阅读