首页 > 解决方案 > 解决它。R中dataMeta包的build_dict函数中使用的option_description是什么?

问题描述

我有一个包含大约 100,000 条推文的数据集,并附有他们的情绪分数。原始数据集只有两列,一列用于推文,另一列用于情绪得分。

我正在尝试使用 dataMeta 包为它构建一个数据字典。这是我到目前为止编写的代码:

#Data Dictionary
var_desc<-c("Sentiment Score 0 for Negative sentences and 4 for Positive sentences","The tweets collected")
var_type<-c(0,1)

#Creating the Linker Data Frame
linker <- build_linker(tweets_train, variable_description = var_desc, variable_type = var_type)
linker

#Build the data dictionary
dict<-build_dict(my.data = tweets_train,linker=linker,option_description = NULL, prompt_varopts = F)
kable(dict,format="html",caption="Data dictionary for the Training dataset")

我的问题出在数据字典中,我提供了变量名称和变量描述,但我认为在变量选项列中它试图打印我想要避免的全部 100,000 条推文。我是否可以手动设置该列。build_dict 函数中的 option_description 是否有帮助?我试着从网上得到一些关于它的想法,但没有用。这是我到目前为止一直关注的链接:

https://cran.r-project.org/web/packages/dataMeta/vignettes/dataMeta_Vignette.html

这是我第一次尝试构建数据字典,因此很困难。任何建议将不胜感激。提前致谢。

标签: rmetadatadata-sciencedata-analysis

解决方案


推荐阅读