html - 使用 R 进行网页抓取 - 多页表格
问题描述
我有这个网站,它有一个包含许多页面的表格。有人可以帮我将该表的所有页面读入 R 吗?
网站: https ://www.fdic.gov/bank/individual/failed/banklist.html
解决方案
您可以使用 rvest 包抓取整个 HTML 表。请参阅下面的代码。该代码自动识别整个表并读入所有 555 个条目。
require(rvest)
URL <- "https://www.fdic.gov/bank/individual/failed/banklist.html"
failed_banks <- URL %>%
read_html() %>%
html_table() %>%
as.data.frame()
推荐阅读
- python - 产生意外输出的 Python 函数
- python - 熊猫分隔具有列表类型值的列
- c++ - memset VS 通过一个简单的循环“for”归零
- c++ - Visual Studio C++:在另一个项目中使用一个项目生成的静态库
- reactjs - 直接从 react 发送文件到 sftp
- c# - 优化配方/成分选择算法
- node.js - 解码通用 Node.js 错误。格式是什么以及如何阅读?
- vba - For循环工作但指责错误 - VBA
- sql - 我的列条目与多个“_”字符混合在一起,如何将第一个“_”之前的数字替换为函数,同时保留其余部分
- numerical-methods - cvxpy + mosek:指定的下限不是数字(nan)