首页 > 解决方案 > 无法使用 R 中的 download.file 下载网页

问题描述

我尝试了以下代码来下载 html 文件。代码运行没有错误,但返回的文件非常小(~2kb)并且无法打开。

url <- "http://racing.hkjc.com/racing/information/english/Horse/OtherHorse.aspx?HorseNo=L042#htop"
download.file(url, destfile)

我不确定连接速度是否会影响 download.file 是否可以返回正确的结果,因为有时可以在多次尝试后下载网页。任何帮助或替代解决方案将不胜感激。谢谢。

标签: rweb-scraping

解决方案


有很多清理工作要做,但这是基本方法

library(rvest)

read_html(url) %>% 
html_nodes(xpath ='/html/body/div/form/table[3]') %>% 
html_table(fill=T)

推荐阅读