首页 > 解决方案 > 在 R 中绘制转换图

问题描述

我的数据结构如下:

transition_list <- list(c('A', 'B'), c('A', 'C', 'D'))

我想绘制列表的转换矩阵。我们可以将列表中的每个向量视为一个个体,并将向量的每个元素视为个体的连续状态。

该图应采用以下方式:我希望边缘具有从一个状态到另一个状态的概率,通过整个列表进行估计。也就是说,这里从 A 到 B 的概率应该是 1/2,从 A 到 C 的概率应该是 1/2。我无法连接向量,因为这将提供从 B 到 A 的概率 1,这不是它的实际情况。

我知道这个问题是相似的,但我需要一个向量列表而不是一个向量。

标签: rggplot2plotplotlymarkov-chains

解决方案


我没有为您创建绘图,但我可以创建绘图所需的数据。我的方法是迭代的,为了避免编写 for 循环,我使用了包中的map函数。purrr

首先,我冒昧地扩展了您的数据:

transition_list <- list(c('A', 'B', 'D', 'X'), c('A', 'C', 'D', 'X'), c('A', 'B', 'E', 'X'))

接下来,这些是我们将需要的包:

library(purrr)
library(dplyr)

首先,我正在编写一个自定义函数,它将一个向量转换为一个数据框。每个“步骤”都会产生两个值:fromto。因此,我的循环长度等于向量的长度减一。

browse_individual <- function(states) {
  map_df(
    1:(length(states)-1),
    ~list(from = states[.x], to = states[.x+1])
  )
}

这段代码非常简洁,但这就是它的作用:第一个参数map_df是我们要循环的内容。那是向量的长度减一。第二个参数是我们希望为每一步返回的内容,它是一个包含两个元素的列表,包含当前元素 asfrom和下一个元素 as to。特定函数map_df将输出(列表列表)转换为数据框。

接下来,我们需要将此函数应用于列表中的每个向量。

state_changes <- map_df(transition_list, browse_individual)

这里我map_df再次使用。循环的每一步的输出都是一个数据框(即browse_individual返回的那个)。所有这些数据帧都组合成一个数据帧,称为state_changes.

以下部分是一些dplyr代码,用于计算更改发生的频率并计算给定from位置的可能性。

state_change_prob <- state_changes %>%
  count(from, to) %>%
  group_by(from) %>%
  mutate(prob = n / sum(n)) %>%
  select(from, to, prob) %>%
  ungroup()

最后,我们得到这样的结果:

> state_change_prob
#> # A tibble: 7 x 3
#>   from  to     prob
#>   <chr> <chr> <dbl>
#> 1 A     B     0.667
#> 2 A     C     0.333
#> 3 B     D     0.5  
#> 4 B     E     0.5  
#> 5 C     D     1    
#> 6 D     X     1    
#> 7 E     X     1 

我希望这是对您问题的回答,并且您可以根据此数据格式构建绘图。


推荐阅读