python - 根据起始索引有效地填充掩码
问题描述
我有一个 2D 数组(对于这个例子,实际上可以是 ND),我想为它创建一个遮罩来遮盖每一行的末尾。例如:
np.random.seed(0xBEEF)
a = np.random.randint(10, size=(5, 6))
mask_indices = np.argmax(a, axis=1)
我想转换mask_indices
为布尔掩码。目前,我想不出比这更好的方法
mask = np.zeros(a.shape, dtype=np.bool)
for r, m in enumerate(mask_indices):
mask[r, m:] = True
因此对于
a = np.array([[6, 5, 0, 2, 1, 2],
[8, 1, 3, 7, 1, 9],
[8, 7, 6, 7, 3, 6],
[2, 7, 0, 3, 1, 7],
[5, 4, 0, 7, 6, 0]])
和
mask_indices = np.array([0, 5, 0, 1, 3])
我想看看
mask = np.array([[ True, True, True, True, True, True],
[False, False, False, False, False, True],
[ True, True, True, True, True, True],
[False, True, True, True, True, True],
[False, False, False, True, True, True]])
此操作是否有矢量化形式?
一般来说,我希望能够在除定义索引点的维度之外的所有维度上执行此操作。
解决方案
I. 沿最后一个轴(行)的 Ndim 数组掩码
对于沿行屏蔽的 n-dim 数组,我们可以这样做 -
def mask_from_start_indices(a, mask_indices):
r = np.arange(a.shape[-1])
return mask_indices[...,None]<=r
样品运行 -
In [177]: np.random.seed(0)
...: a = np.random.randint(10, size=(2, 2, 5))
...: mask_indices = np.argmax(a, axis=-1)
In [178]: a
Out[178]:
array([[[5, 0, 3, 3, 7],
[9, 3, 5, 2, 4]],
[[7, 6, 8, 8, 1],
[6, 7, 7, 8, 1]]])
In [179]: mask_indices
Out[179]:
array([[4, 0],
[2, 3]])
In [180]: mask_from_start_indices(a, mask_indices)
Out[180]:
array([[[False, False, False, False, True],
[ True, True, True, True, True]],
[[False, False, True, True, True],
[False, False, False, True, True]]])
二、沿通用轴的 Ndim 数组屏蔽
对于沿通用轴掩蔽的 n-dim 数组,它将是 -
def mask_from_start_indices_genericaxis(a, mask_indices, axis):
r = np.arange(a.shape[axis]).reshape((-1,)+(1,)*(a.ndim-axis-1))
mask_indices_nd = mask_indices.reshape(np.insert(mask_indices.shape,axis,1))
return mask_indices_nd<=r
样品运行 -
数据数组设置:
In [288]: np.random.seed(0)
...: a = np.random.randint(10, size=(2, 3, 5))
In [289]: a
Out[289]:
array([[[5, 0, 3, 3, 7],
[9, 3, 5, 2, 4],
[7, 6, 8, 8, 1]],
[[6, 7, 7, 8, 1],
[5, 9, 8, 9, 4],
[3, 0, 3, 5, 0]]])
索引设置和屏蔽沿axis=1
-
In [290]: mask_indices = np.argmax(a, axis=1)
In [291]: mask_indices
Out[291]:
array([[1, 2, 2, 2, 0],
[0, 1, 1, 1, 1]])
In [292]: mask_from_start_indices_genericaxis(a, mask_indices, axis=1)
Out[292]:
array([[[False, False, False, False, True],
[ True, False, False, False, True],
[ True, True, True, True, True]],
[[ True, False, False, False, False],
[ True, True, True, True, True],
[ True, True, True, True, True]]])
索引设置和屏蔽沿axis=2
-
In [293]: mask_indices = np.argmax(a, axis=2)
In [294]: mask_indices
Out[294]:
array([[4, 0, 2],
[3, 1, 3]])
In [295]: mask_from_start_indices_genericaxis(a, mask_indices, axis=2)
Out[295]:
array([[[False, False, False, False, True],
[ True, True, True, True, True],
[False, False, True, True, True]],
[[False, False, False, True, True],
[False, True, True, True, True],
[False, False, False, True, True]]])
其他场景
A. 扩展到给定的结束/停止索引以进行屏蔽
为了扩展解决方案,当我们获得屏蔽的结束/停止索引时,即我们正在寻找矢量化mask[r, :m] = True
,我们只需将发布的解决方案中的最后一个比较步骤编辑为以下 -
return mask_indices_nd>r
B. 输出一个整数数组
在某些情况下,我们可能希望获得一个 int 数组。在那些上,简单地查看输出。因此,如果out
是发布的解决方案的输出,那么我们可以简单地分别执行out.view('i1')
or out.view('u1')
forint8
和uint8
dtype 输出。
对于其他数据类型,我们需要.astype()
用于 dtype 转换。
C. 用于停止索引的包含索引的屏蔽
对于包含索引的掩码,即索引将包含在停止索引的情况下,我们需要简单地在比较中包含相等性。因此,最后一步将是 -
return mask_indices_nd>=r
D. 对于起始索引的索引排他屏蔽
这是当给定开始索引并且这些索引不被屏蔽,但仅从下一个元素开始直到结束时屏蔽的情况。因此,类似于上一节中列出的推理,对于这种情况,我们将最后一步修改为 -
return mask_indices_nd<r
推荐阅读
- android - Android/Kotlin onClick 从一个片段
- php - 如何使用 sprintf 函数添加 Html 标签
- docker - 如何使用 docker-nginx-certbot 创建我的域(包括 www)的 SSL 证书?
- java - Java执行过滤器和分组并使用2个列表执行媒体
- c++ - 打开 Gnome 终端选项卡,在 Ubuntu 18.04 LTS 上使用 C++ 运行命令
- javascript - 如何使我的 html 网站中的图片可点击?
- python - 检查每个偶数索引是否包含偶数并且每个奇数索引是否包含给定列表的奇数的程序存在问题
- symbolicc++ - 尝试将此数据类型包含在另一个头文件中时出现冲突类型错误我不确定为什么
- php - 与 if 语句相比,switch 语句如何加载?
- r - 在 Rstudio 项目中重命名无标题