首页 > 解决方案 > 如何离散化只有 2 个不同值的变量?

问题描述

我正在尝试将变量 DEATH 离散化为两个箱。DEATH 只能是 0 或 1 的值我使用的命令如下:

使用等频分箱的无监督离散化将 Death 转换为因子变量

burn$DEATH<-discretize(burn$DEATH, method="interval", breaks=2)
summary(burn$DEATH)

但是,我的输出是整个值范围。我想显示 0 和 1 的个人计数。

我当前的输出:

summary(burn$DEATH)

[0,1] 
 1000 

我认为用户指定的方法将是解决方案,但是当我尝试这样做时,我收到一条错误消息,指出“x 必须是数字”

burn$FACILITY <- discretize(burn$FACILITY, method="fixed", breaks=c(-Inf,0, 1, Inf))

附加说明:这是一个类,所以我假设他们不希望我们使用我们尚未讨论的方法。如果可能的话,我更喜欢使用离散化方法!有人建议我使用 factor() 命令,但是如果我这样做,我如何查看带有级别的摘要统计信息?

标签: rdiscretization

解决方案


推荐阅读