首页 > 解决方案 > 什么是带注释的数据框?

问题描述

我是新的 SO 用户,但也是 R 的新用户(-ish)。我最近遇到了带注释的数据帧。我试图尽职尽责地寻找一个好的解释,并且我已经阅读了以下关于带注释的数据帧https://www.rdocumentation.org/packages/Biobase/versions/2.32.0/topics/AnnotatedDataFrame的内容。但我不明白 AnnotatedDataFrame 是什么。

它实际上是两个数据框(一个元数据和另一个数据)的列表吗?

为这个烦人的问题道歉,但我不清楚我在做什么。任何澄清表示赞赏。谢谢!

标签: rclassbioconductor

解决方案


正如您已阅读文档,

描述。AnnotatedDataFrame 由两部分组成。有一组样本和在这些样本上测量的变量值。还对测量的每个变量进行了描述。AnnotatedDataFrame 的组件可以通过 pData 和 varMetadata 访问。

Annotation-dataframe 基本上是我们在数据操作中使用的概念,我举一个例子,希望你能清楚。

假设你有 10 篇文章(一个网站),你想对它们进行分析,比如找出每篇文章中每个单词使用了多少个名词,有多少个形容词等等。所以首先你将每个单词从文章中分离出来,并将它们放在指定的行中,然后呢?那么你有一个单词列表,但你需要将它们映射到一个作为元数据的字段,这样你就可以在那些上运行一个训练有素的机器学习模型来知道哪些单词是什么,为你需要转换数据做准备进入一个现在被注释的数据,我们称之为 Annotated-Dataframe。


推荐阅读