r - 刮掉谷歌新闻级的变化
问题描述
我正在尝试使用从上一篇文章(https://stackoverflow.com/a/60549550/16439932)中找到的以下脚本来抓取谷歌新闻,但“dat”为空。似乎 .VDXfz 类不再存在。我应该如何更换它?
html_dat <- read_html(paste0("https://news.google.com/search?q=coronavirus&hl=en-US&gl=US&ceid=US%3Aen"))
dat <- data.frame(Link = html_dat %>%
html_nodes('.VDXfz') %>%
html_attr('href')) %>%
mutate(Link = gsub("./articles/","https://news.google.com/articles/",Link))
news_dat <- data.frame(
Title = html_dat %>%
html_nodes('.DY5T1d') %>%
html_text(),
Link = dat$Link,
Description = html_dat %>%
html_nodes('.Rai5ob') %>%
html_text()
)
解决方案
推荐阅读
- angular - 如何在使用 Angular 6 中的 ngx-file-drop 上传之前预览图像?
- c# - Visual Studio 2017 数据集设计器不工作
- javascript - Puppeteer:在异步函数中使用 await 调用的 javascript 函数中抛出自定义错误消息
- python - 如何使用pivot _table从给定数据中以以下格式在anaconda python中创建一个pivot
- python - Write Python output neatly in a txt file?
- python - Duplicacy in Index of Pandas Series
- javascript - JavaScript 对象的 @r 属性是什么?
- java - 错误膨胀类 android.widget.GridLayout 应用程序崩溃
- javascript - 我应该如何处理 Microsoft Edge 控制台错误?代码中几乎没有疑问
- javascript - Node.js 在控制台外记录键盘事件