r - 解决它。R中dataMeta包的build_dict函数中使用的option_description是什么?
问题描述
我有一个包含大约 100,000 条推文的数据集,并附有他们的情绪分数。原始数据集只有两列,一列用于推文,另一列用于情绪得分。
我正在尝试使用 dataMeta 包为它构建一个数据字典。这是我到目前为止编写的代码:
#Data Dictionary
var_desc<-c("Sentiment Score 0 for Negative sentences and 4 for Positive sentences","The tweets collected")
var_type<-c(0,1)
#Creating the Linker Data Frame
linker <- build_linker(tweets_train, variable_description = var_desc, variable_type = var_type)
linker
#Build the data dictionary
dict<-build_dict(my.data = tweets_train,linker=linker,option_description = NULL, prompt_varopts = F)
kable(dict,format="html",caption="Data dictionary for the Training dataset")
我的问题出在数据字典中,我提供了变量名称和变量描述,但我认为在变量选项列中它试图打印我想要避免的全部 100,000 条推文。我是否可以手动设置该列。build_dict 函数中的 option_description 是否有帮助?我试着从网上得到一些关于它的想法,但没有用。这是我到目前为止一直关注的链接:
https://cran.r-project.org/web/packages/dataMeta/vignettes/dataMeta_Vignette.html
这是我第一次尝试构建数据字典,因此很困难。任何建议将不胜感激。提前致谢。
解决方案
推荐阅读
- android - 在“尾随”属性上使用文本小部件未显示在 GridTileBar 小部件中,但图标小部件显示
- firebase - RangeError(索引):无效值:有效值范围为空:0 | 颤振火力基地
- javascript - 使用 django 和 python 的 AJAX 发布请求
- azure-ad-b2c - 我无法通过 requireTokenSilent @azure/msal-browser 获取 accessToken
- python - 使用 Pandas 将数据框的一列转换为系列
- node.js - Sequelize.sync:当表不存在时创建索引
- php - 如何将下拉菜单中的 FontAwesome 图标类添加到我的网站
- admob - Facebook Audience Network:需要 Facebook 登录吗?
- amazon-web-services - AWS 事件驱动方法 - Cloud Watch 与 S3 事件通知
- python - 如何使用 cv2.imwrite 从地图中保存图像