首页 > 解决方案 > 如何仅使用 R 获取链接

问题描述

<item xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:type="itemWithRetweets" link="http://twitter.com/MEDClementz/statuses/1001775473305817090" id="1001775473305817090">

如何从上面仅获取链接和 id ^

所需的输出:

       link                                                         
[1] http://twitter.com/MEDClementz/statuses/1001775473305817090    
           id
[1] 1001775473305817090

标签: rxmlstringrxml2

解决方案


最好使用xml解析器而不是使用正则表达式

library(xml2)
x <- read_xml('<item xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:type="itemWithRetweets" link="http://twitter.com/MEDClementz/statuses/1001775473305817090" id="1001775473305817090"></item>')

xml_attr(x,"link")
xml_attr(x,"id")

结果:

> xml_attr(x,"link")
[1] "http://twitter.com/MEDClementz/statuses/1001775473305817090"
> xml_attr(x,"id")
[1] "1001775473305817090"

推荐阅读