首页 > 解决方案 > 为覆盖所有的二维矩阵生成三个不重叠的掩码

问题描述

我有一个二维数组,我想通过掩码生成将它分成 3 个非重叠和随机子矩阵。例如,我有一个如下矩阵:

input = [[1,2,3],
         [4,5,6],
         [7,8,9]]

我想要三个随机的零一掩码,如下所示:

mask1 = [[0,1,0],
        [1,0,1],
        [0,0,0]]
mask2 = [[1,0,0],
         [0,1,0],
         [1,0,0]]
mask3 =[[0,0,1],
        [0,0,0],
        [0,1,1]]

但是我的输入矩阵太大了,我需要快速完成。我还想确定每个掩码的比率作为输入。在上面的示例中,所有掩码的比率都相等。为了生成一个随机掩码,我使用以下代码:

np.random.choice([0, 1],size=(size of matrix[0],size of matrix[1]))

我的问题是如何制作不重叠的蒙版。

标签: pythonarraysnumpy

解决方案


IIUC,你可以做一个0、1、2的随机矩阵,然后提取m == 0、m == 1、m == 2的值:

groups = np.random.randint(0, 3, (5,5))
masks = (groups[...,None] == np.arange(3)[None,:]).T

但是,这不能保证每个掩码中的元素数量相等。为此,您可以置换平衡分配:

a = np.arange(25).reshape(5,5)  # dummy input
groups = np.random.permutation(np.arange(a.size) % 3).reshape(a.shape)
masks = (groups[...,None] == np.arange(3)[None,:]).T

如果您希望随机概率在一个组中:

groups = np.random.choice([0,1,2], p=[0.3, 0.6, 0.1], size=a.shape)

或者其他的东西。您需要做的就是决定如何将单元格分配给groups,然后您就可以构建您的蒙版。

例如:

In [431]: groups = np.random.permutation(np.arange(a.size) % 3).reshape(a.shape)

In [432]: groups
Out[432]: 
array([[1, 0, 0, 2, 0],
       [1, 2, 0, 0, 1],
       [2, 0, 2, 0, 2],
       [1, 1, 2, 1, 0],
       [2, 2, 1, 1, 0]], dtype=int32)

In [433]: masks = (groups[...,None] == np.arange(3)[None,:]).T

In [434]: masks
Out[434]: 
array([[[False, False, False, False, False],
        [ True, False,  True, False, False],
        [ True,  True, False, False, False],
        [False,  True,  True, False, False],
        [ True, False, False,  True,  True]],

       [[ True,  True, False,  True, False],
        [False, False, False,  True, False],
        [False, False, False, False,  True],
        [False, False, False,  True,  True],
        [False,  True, False, False, False]],

       [[False, False,  True, False,  True],
        [False,  True, False, False,  True],
        [False, False,  True,  True, False],
        [ True, False, False, False, False],
        [False, False,  True, False, False]]])

这给了我一个完整的面具:

In [450]: masks.sum(axis=0)
Out[450]: 
array([[1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1]])

并且合理平衡。如果单元格的数量是 3 的倍数,那么这些数字都会一致。

In [451]: masks.sum(2).sum(1)
Out[451]: array([9, 8, 8])

如果您愿意,可以使用.astype(int)将 bool 数组转换为 0 和 1 的 int 数组。


推荐阅读