r - 将 XML 导入 R
问题描述
我正在尝试将 xml 文件导入 R 并将其转换为数据框,但无法获取不同的节点。许多节点中都有字符(例如:“),所以我很难指定它们被拉出。当我向下移动层次结构时,我也不完全清楚如何拉出较低级别的节点。
我正在使用xmlParse
和xmlToDataFrame
doc <- xmlParse("http://www.orphadata.org/data/xml/en_product6.xml")
doc2 <-xmlToDataFrame(nodes=getNodeSet(doc,"//Disorder"))[c("OrphaNumber")]
#this works but when I try to add more nodes with unusual characters or lower levels it fails.
doc3 <-xmlToDataFrame(nodes=getNodeSet(doc,"//Disorder"))[c("OrphaNumber","Name lang="en"")]
#or when I try to grab a lower node
doc4 <-xmlToDataFrame(nodes=getNodeSet(doc,"//Disorder"))[c("OrphaNumber","/DisorderGeneAssociation")]
预期结果是
head(doc3)
OrphaNumber Name lang="en"
166024 Multiple epiphyseal dysplasia,
166035 Brachydactyly-short stature-retinitis pigmentosa syndrome
head(doc4)
OrphaNumber DisorderGeneAssociationStatus
166024 <SourceOfValidation>22587682[PMID]
166035 <SourceOfValidation>28285769[PMID]</SourceOfValidation>
解决方案
推荐阅读
- eclipse-plugin - 如何在 RCP 4 应用程序中自定义
- php - 根据给定的输入数组 input[2,4,1,6] 打印模式
- bash - Bash 中的逻辑或 (||) 后跟冒号
- php - 为什么我的数据没有插入数据库
- java - 将每个 ID 的数据从 firebase 读取到微调器中
- angular - 错误 TS2300:将我的代码移动到 Angular CLI 后标识符重复
- ios - 在 swift 中使用 Alamofire 的 Json 请求失败
- laravel - 如何在不需要使用 Laravel 的情况下传递方法,尝试获取非对象的属性“id”
- c# - 在 c# (^) 符号中使用 Excel 公式
- command-line-interface - 角度飞镖的命令行