首页 > 解决方案 > Pyemma 转换矩阵返回意外大小的数组

问题描述

我正在使用pyemma做一些马尔可夫操作。具体来说,我想建立一个状态转换矩阵。在大多数情况下,pyemma 工作正常,但在某些情况下,转换矩阵所表示的状态数与数据中实际存在的状态数不同。

例如:

import numpy as np
from pyemma import msm 

sequence = np.array([21, 21, 32 ,32 ,55 ,22 ,33 ,11 ,11 ,22 ,44 ,44 ,44 ,33 ,11 ,44 ,99])
vals = np.unique(sequence)
#note there are 8 unique states so we expect 8 by 8 transition matrix

model = msm.estimate_markov_model(sequence, 1)
transitionMatrix = model.transition_matrix
#transition matrix is 4 by 4 

为什么转移矩阵不是 8 乘 8?

提前致谢。

标签: pythonmarkov-chains

解决方案


如果你从数据中估计,PyEMMA 将使用最大的连接状态子集来进行估计。背景是,当转换矩阵未连接时,您无法为转换矩阵提供唯一的度量,例如,每个状态都可以从任何其他状态到达。

您可以通过查看生成的 MSM 对象来检查连接的状态:

打印(msm.active_set)

产生一些对应于离散状态索引的整数.


推荐阅读