首页 > 解决方案 > 将变量(具有接近最大值和最小值的许多数据点)转换为均匀分布?

问题描述

我需要在 R 中制作一些模型,并且我的一些预测器遇到了一些问题。它们分布在 0 和 1 之间,它们给出了土地覆盖类型的百分比。例如 0.3 表示 30% 的区域被森林覆盖。

这是其中一个的直方图和密度图:

直方图 密度图

我想将这些预测变量转换为 R 内的均匀分布(它不必是完美的)。我不知道要使用什么转换,因为有很多数据点接近它们的最大值和最小值。

任何帮助表示赞赏,谢谢!

标签: rdatasettransformation

解决方案


我不清楚你为什么需要这样做——大多数统计方法对预测变量的分布没有要求——但是

rank(x)/(length(x)+1)

将为您提供一个新变量,该变量均匀分布在 0 和 1 之间(并且永远不会恰好是 0 或 1)


推荐阅读