首页 > 解决方案 > 使用 R 进行网页抓取 - 多页表格

问题描述

我有这个网站,它有一个包含许多页面的表格。有人可以帮我将该表的所有页面读入 R 吗?

网站: https ://www.fdic.gov/bank/individual/failed/banklist.html

标签: htmlrjsonxmlweb-scraping

解决方案


您可以使用 rvest 包抓取整个 HTML 表。请参阅下面的代码。该代码自动识别整个表并读入所有 555 个条目。

require(rvest)

URL <- "https://www.fdic.gov/bank/individual/failed/banklist.html"

failed_banks <- URL %>%
  read_html() %>%
  html_table() %>%
  as.data.frame()

推荐阅读