r - 如何在 R 中使用 purrr 和 rvest 从网页中抓取成绩单?
问题描述
我正在尝试提取此网页上可用的所有成绩单。我已经能够使用以下代码成功提取演讲的日期和标题R
:
library(purr)
library(rvest)
url_kremlin <- "http://kremlin.ru/events/president/transcripts/page/"
map(1:10, safely(function(i) {
pg <- read_html(paste0(url_kremlin, i))
data.frame(date = html_text(html_nodes(pg, ".dt-published")),
title = html_text(html_nodes(pg, ".p-name")),
link = html_nodes(pg, ".p-name") %>%
html_node("p") %>% html_attr("href"))
})) -> kremlin_df
不过,我无法提取成绩单的文本。有谁知道我做错了什么?我应该使用什么来成功提取成绩单?
解决方案
推荐阅读
- salesforce - 使用 APEX 每周发送电子邮件模板
- google-apps-script - 一天内服务调用次数过多:urlfetch 尚未打开 Google 表格
- ruby-on-rails - 在这个例子中,为什么服务器发送事件中有一个循环?
- bash - 如何停止 bash 引用引号?
- arrays - 如何将 Go 结构的一部分定义为 JSON 字符串?
- python - 在创建模型时将用户添加到多对多字段
- python - 如何在文本框中包含绘图线型图例的图像
- kaitai-struct - Kaitai Struct中外部ksy文件中引用Kaitai Struct文件(ksy)
- c# - 数据库集
没有MyModel的物理表时,属性得到空值? - python - 如何使用 statsmodels.formula 测试 SLR 中的回归系数是否相等?