首页 > 解决方案 > 使用rentrez包从NCBI核苷酸结果中提取元信息

问题描述

我有一个入藏号列表,我需要从中系统地提取相关信息。我发现该rentrez软件包至少可以使用 R 和该rentrez软件包获取此信息。问题是我似乎无法以一种易于提取信息的格式获取数据。entrez_fetch使用以下代码时,该函数应该检索信息并将其解析为 R 数据帧:

data <- entrez_fetch(db = "nucleotide", id = "AB022765.1", rettype="native", parsed = TRUE)

但我收到以下错误:Error: XML content does not seem to be XML:

我还尝试使用XML包将数据转换为数据帧:

data <- entrez_fetch(db = "nucleotide", id = "AB022765.1", rettype="native")
doc <- xmlToDataFrame(test)

但我仍然得到同样的错误。有没有人对我如何解决这个问题有任何建议。例如,我想从核苷酸数据库上的特定登录号中提取“菌株”名称。

谢谢!

标签: xmlncbirentrez

解决方案


推荐阅读