首页 > 解决方案 > 使用 Rcurl 从网站逐页解析

问题描述

我想使用 Rcurl 函数解析这个页面并作为数据框返回。

这是第一页 https://bank.codes/swift-code/india/

这是第二页

https://bank.codes/swift-code/india/page/2/

所以这个页面一直运行到第 76 页

https://bank.codes/swift-code/india/page/76/

我想将此页面从第一页解析到 76 以将它们作为表格返回。

任何建议或帮助将不胜感激。

更新

这个我试过

library(urltools)

url <- c("https://bank.codes/swift-code/india/", 
         "https://bank.codes/swift-code/india/page/2/",
         "https://bank.codes/swift-code/india/page/3/", 
         "https://bank.codes/swift-code/india/page/4/")

urltools::url_parse(url)



urltools::url_parse(url)
  scheme     domain port                     path parameter fragment
1  https bank.codes <NA>        swift-code/india/      <NA>     <NA>
2  https bank.codes <NA> swift-code/india/page/2/      <NA>     <NA>
3  https bank.codes <NA> swift-code/india/page/3/      <NA>     <NA>
4  https bank.codes <NA> swift-code/india/page/4/      <NA>     <NA>

这不会返回我的代码

标签: rrcurl

解决方案


推荐阅读