r - 使用 library(xml2) [in R] 解析 XML 数据
问题描述
我正在尝试解决 Coursera 中的数据清理课程。我在编码中遇到了麻烦:
如何解析 XML 数据(使用库:xml2)并使用它来查找餐馆数量?
如何将 XML 解析为数据框?
从这里阅读巴尔的摩餐厅的 XML 数据: https ://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml
邮政编码 21231 的餐厅有多少?
library(xml2)
x <- read_xml("https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml")
y <- as.numeric(xml_path(xml_find_all(x, "//row[@zipcode='21231']]")))
y
或者
library(rvest)
library(purrr)
pg <- read_html ("https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml")
html_nodes(pg, "//row[@zipcode='21231']]") %>%
map(xml_attrs) %>%
map_df(~as.list(.))
我尝试用两种方式编写代码,但都没有奏效。任何帮助将不胜感激。谢谢。
解决方案
寻找这样的东西?
length( xml_find_all( x, './/zipcode[text()="21231"]' ) )
[1] 127
推荐阅读
- android - 使用带有延迟的协程验证单元测试中调用的方法
- python - 带有 Windows 更新的 Python MIMEImage 或 win32com 错误 TypeError('Could not guess image MIME subtype')
- renpy - 如何在 Ren'Py 中启动 DDLC 模组模板?
- php - 2 空间文本文件存储与 LARAVEL
- javascript - 通过 JS Executor 或 Action 类拖放在 Selenium WebDriver 中不起作用
- node.js - 使用带有 mongo db 的 node js 后端时,空数组作为邮递员的响应
- javascript - 我可以知道哪个平台与 firebase 分析博览会一起使用
- xilinx - 使用 xsct 在 Zynq 7000 上停止 CPU 0 时停止 APU
- python - 在 VSCode 中执行 Python 代码时,如何让 cmd 提示保持打开状态?
- javascript - 如果条件不适用于 CSS 显示 None