首页 > 解决方案 > 使用多个变量/参数在 R 中可视化“corrplot”

问题描述

我正在使用作为包的corrplot一部分的函数来可视化我拥有的数据通道之间的相关性。我的问题是我是否可以将两个“因素”或参数分配给圆圈......所以,例如,我可以让圆圈的大小代表相关性,而圆圈的颜色代表其他东西,例如滞后?我的数据实际上是互相关数据,我已经确定了最大相关/滞后,并且希望能够在图中将两者可视化,这就是我想要这样做的原因。corrplotR

基本上我想要实现的与这个问题相同:R:使用 corrplot 使用圆圈的大小和颜色来可视化两个变量(例如,相关性和 p 值),但是,这两种解决方案都不适用于我和我从 Github 安装软件包时遇到错误。

我有一个滞后和相关的向量:

CCO_lag = (0,   NaN ,   -2 ,  NaN  ,  -5  ,  -4  ,  -6  ,  -3  ,   0 ,  NaN ,    1  ,   3  , NaN   ,  0   , -3  , NaN) 
CCO_r = c(-0.4757 ,      NaN   , 0.5679    ,   NaN   , 0.5582  ,  0.5899 ,   0.5857 ,   0.6256 ,  -0.4646   ,    NaN ,  -0.6286 , -0.4699    ,   NaN ,  -0.7710  ,  0.5869  ,     NaN `)

假设我想在一个1x16正方形中将其可视化,corrplot我希望圆圈的大小取决于 in 的相关值,CCO_r而圆圈的颜色取决于 in 的滞后值CCO_lag

任何人都可以帮忙吗?

谢谢!

标签: rcorrelationcross-correlationr-corrplot

解决方案


这对我来说似乎不太像相关图,但我们可以这样做:

CCO_lag = c(0,   NaN ,   -2 ,  NaN  ,  -5  ,  -4  ,  -6  ,  -3  ,   0 ,  NaN ,    1  ,   3  , NaN   ,  0   , -3  , NaN) 
CCO_r = c(-0.4757 ,      NaN   , 0.5679    ,   NaN   , 0.5582  ,  0.5899 ,   0.5857 ,   0.6256 ,  -0.4646   ,    NaN ,  -0.6286 , -0.4699    ,   NaN ,  -0.7710  ,  0.5869  ,     NaN )

d = data.frame(id = 1:length(CCO_lag), CCO_lag, CCO_r)

ggplot(d, aes(x = id, y = "A", size = CCO_r, color = CCO_lag)) +
  geom_point() +
  scale_y_discrete(breaks = NULL) +
  labs(y = "", x = "")

在此处输入图像描述

如果你有矩阵:

lag_mat = matrix(CCO_lag, 4)
r_mat = matrix(CCO_r, 4)
row = c(row(lag_mat))
col = c(col(lag_mat))

dd = data.frame(
  lag = c(lag_mat), r = c(r_mat), row, col
)

ggplot(dd, aes(x = row, y = col, size = r, color = lag)) +
  geom_point() +
  theme(panel.grid = element_blank())

在此处输入图像描述

请注意,矩阵的顶部是第 1 行,下面是编号较高的行,但图的底部是较低的 y 值,上面是编号较高的 y 值。你可能想改变它,或者它可能没问题。您可以添加scale_y_reverse()到您的情节以切换它。


推荐阅读