首页 > 解决方案 > 计算R中向量的基尼杂质

问题描述

我正在研究 R 中的一个问题,并尝试将 Gini 指数计算为二进制分类问题的一部分,最初是针对所有值都不同的向量。我有点困惑,因为我希望得到 1 的结果以获得完美的 ienquality,但是使用 Gini 函数我得到了不同的结果,例如使用库Gini()中的函数DescTools

samplevector <- c(0:20)
Gini(samplevector)
[1] 0.3666667

我在这里想念什么?

标签: rclassification

解决方案


您缺少基尼指数计算的内容。在您的示例中,您给出的收入向量在基尼指数的意义上并不完全不平等。如果您想要索引为 1:

samplevector <- c(rep(0,100),100)
Gini(samplevector)

[1] 1

samplevector是一种完全不平等的收入分配:有人拥有一切,其他人一无所有。相反:

samplevector <- c(rep(100,100))
Gini(samplevector)

[1] 8.760354e-18

在这里,每个人的收入都相同,您的基尼指数几乎为 0。在您的示例中,您有一个中间情况。


推荐阅读