r - 如何在 tbl_summary() 表中标记变量 *values*?
问题描述
我似乎无法让我的变量值标签显示在我的 tbl_summary() 表中。
我使用 {labelled} 包标记了我的变量和变量值,如下所示:
library(dplyr)
library(labelled)
library(gtsummary)
var_label(df$SEX) <- "Sex"
val_label(df$SEX, 1) <- "Male"
val_label(df$SEX, 2) <- "Female"
table <- df %>%
select(SEX) %>%
tbl_summary()
table
当我去制作我的汇总表时,“SEX”的变量标签显示得很好,但男性和女性值标签根本没有出现。相反,出现了 1 和 2 编码。我该如何解决?
在我阅读的文档中,它说“自动打印数据集中的标签属性”和“gtsummary 利用标签包”。
谢谢!
解决方案
谢谢你的深思熟虑的帖子。我需要更新文档以使其更加清晰:“自动打印数据集中的变量标签属性。” 事实上,这并没有应用价值标签。对于haven_labelled 数据集(即带有值标签的数据框),它从来就不是用于分析或数据探索的类。相反,它是在从其他语言导入数据时创建的,其中数据类型与 R 没有一对一的关系。这是来自关于有标签的变量类的 tidyverse 博客文章。(https://haven.tidyverse.org/articles/semantics.html)
避风港的目标不是提供可以在分析中随处使用的标记向量。目标是提供一个中间数据结构,您可以将其转换为常规 R 数据帧。
目前,我建议您将带有值标签的变量转换为带有as_factor(df)
(可以在整个数据框上运行)的因子,以将带有标签的数据转换为因子。
利用上面的示例,这是我将运行的代码:
library(gtsummary)
library(tidyverse)
df %>%
haven::as_factor() %>%
select(SEX) %>%
tbl_summary()
具体到标记和 gtsummary 包,标记包作者提供了以下指导:https ://github.com/ddsjoberg/gtsummary/issues/488#issuecomment-682576441
快乐编程!
推荐阅读
- google-cloud-sql - Google Cloud SQL 5.7 - 数据库中的表消失
- apache-spark - 在 Spark 独立集群中启动多个结构化流应用程序
- windows - 如何通过 Windows 的命令行从当前 Firefox 窗口获取 URL?
- javascript - 如何让谷歌地图标记在 JavaScript 中再次反弹
- javascript - Onclick 功能在外部 javascript 文件中不起作用
- python - 如何在与另一个与其他模型具有多对多关系的应用程序上向用户添加评论?
- javascript - 如何避免在javascript中生成重复的html代码
- php - 关于 ORDER BY 使用 Prepared Statements 的两个问题
- c - 为什么不能在 GNU C 基本内联 asm 语句中使用局部变量?
- regex - 带有可选子组的 RegEx 可选组