首页 > 解决方案 > 协助在 R 中抓取 html 文档

问题描述

我需要帮助来了解如何在 R 中导入以下 html 文档中显示的表格。

https://www.agerborsamerci.it/listino/listino.html

我是网络抓取世界的新手,所以我还想问您是否可以简要解释一下您是如何做到这一点的。

非常感谢您的帮助和时间

标签: rweb-scraping

解决方案


第一步将是这样的

library( rvest )

url    <- "https://www.agerborsamerci.it/listino/web.htm"
file   <- read_html( url )
tables <- html_nodes( file, "table" )
table1 <- html_table( tables[1], fill = TRUE )

但在那之后,你将不得不做一些(阅读:可能很多)数据整理来获得漂亮、干净、整洁的数据。


推荐阅读