首页 > 解决方案 > 网页抓取 R - 我可以从这个页面提取数据还是只提取图片?

问题描述

我正在查看此 ULR: https ://finanzen.handelsblatt.com/22394404/lng-japan-korea-marker-platts 谁能告诉我是否可以提取图表数据或仅提取包含数据的图表?

我真的不熟悉这种结构,并且在检查页面时没有进一步了解。

提前谢谢了!

标签: rweb-scraping

解决方案


围绕“rvest”做一些研究。这是一个片段;

library(rvest)

url <- 'https://finanzen.handelsblatt.com/22394404/lng-japan-korea-marker-platts'
pg <- read_html(url)

pg %>% html_nodes('h1') %>% html_text()
pg %>% html_nodes('.vhb-full-width .vhb-after') %>% html_text()

## > pg %>% html_nodes('h1') %>% html_text()
##[1] "LNG Japan/Korea Marker (Platts" 
##> pg %>% html_nodes('.vhb-full-width .vhb-after') %>% html_text()
##[1] "9,81"

推荐阅读