r - 使用 XML 包“Null”错误在 R 中进行 Webscraping
问题描述
我正在尝试将桌子从 HKJC 拿到 R 中。
对于 url1,它一直有效。
对于 url2&url3,它有时只工作并且有错误信息。(函数(类,fdef,mtable)中的错误:无法找到签名“NULL”的函数“readHTMLTable”的继承方法</p>
对于 url4,它在任何时候都不起作用。
library(XML)
url1 = url1 = "http://racing.hkjc.com/racing/info/meeting/RaceCard/English/Local/20180627/HV/1"
starter = readHTMLTable(url1,which=9,encoding = "UTF-8")
url2 = "http://racing.hkjc.com/racing/Info/meeting/Results/English/Local/20180627/HV/1"
result1 = readHTMLTable(url2,which=4,encoding = "UTF-8")
url3 = "http://racing.hkjc.com/racing/Info/meeting/Results/English/Local/20180627/HV/1"
result2 = readHTMLTable(url3,which=5,encoding = "UTF-8")
url4 = "http://racing.hkjc.com/racing/information/English/Racing/DisplaySectionalTime.aspx?RaceDate=27/06/2018&RaceNo=1&All=False"
section = readHTMLTable(url4,which=4,encoding = "UTF-8")
我已经阅读了许多与该主题相关的有用主题。但是,我觉得有必要发帖,因为这个问题似乎是这个网页独有的。
非常感谢您的帮助!
解决方案
似乎只是重定向到
http:racing.hkjc.com/racing/information/English/Racing/DisplaySectionalTime.aspx
所以也许这就是它无法从原始 URL 读取 HTML 表的原因,因为它真的不存在?
推荐阅读
- r - 检索每个值的数据范围并对它们进行排序
- linkedin - LinkedIn v2 API:如何将 ugcPost-URN 转换为共享 URN?
- python - 调用 Flash restful 服务时在烧瓶上显示错误。TypeError:“响应”类型的对象不是 JSON 可序列化的
- jsf - 如何在 JSF 中创建对象实例
- c# - 使用 docker-compose 使用 dotnet 核心的 MongoDB 连接超时
- powerbi - 如何动态更改 PowerBI 中 DATEADD 函数的间隔类型?
- php - 我正在尝试向 mysql 插入一个 php 变量,但是它会自动插入 0 而不是变量的值
- javascript - 如何使用 JavaScript 手动将列插入 HTML 表?
- c - 严格的别名规则 uint8_t 缓冲区到结构
- javascript - 用于干预解析的浏览器扩展