首页 > 解决方案 > 在 numpy 数组中查找 X 值并替换为随机值

问题描述

考虑一个 numpy 数组列表,其值在随机位置分配为 -1 或 1。

a = np.array([1,-1,1,1,-1,1,-1,-1,1,-1])
b = np.array([-1,-1,1,-1,1,1,-1,1,-1,-1])

我需要对这些数组执行操作,例如求和和逐点乘法。

例如,在对 2 个数组求和后,我将得到一个新的数组,其值为 -2,0 和 2。

c = a + b
c = [ 0 -2 2 0 0 2 -2 0 0 -2]

现在我想将它“标准化”回-1和1。

对于 2 和 -2,这很容易:

c[c < 0] = -1

c[c > 0] = 1

问题是 0。对于他们,我想随机选择 -1 或 1。

所需的输出如下:

c =  [ 1 -1 1 -1 -1 1 -1 1 -1 -1]

概括地说,我的问题是如何在一个数组中找到所有等于 x 的 N 个值,然后将每个值替换为一个随机数。

我的问题是如何以最“pythonic”和最快的方式做到这一点?

谢谢

标签: pythonarraysnumpyvectorization

解决方案


只是发布我到目前为止得到的答案的最终结果。如果以后有人有更好的解决方案,请分享!

我计时了我找到的 3 个解决方案,其中一个我做了。

def Norm1(HV):
    HV[HV > 0] = 1
    HV[HV < 0] = -1
    zind = np.where(HV == 0)[0]
    HV[zind] = np.array([np.random.choice([1, -1]) for _ in zind])
    return HV

def norm2(HV):
    if HV == 0: 
        return np.random.choice(np.array([-1,1])) 
    else: 
        return HV / HV * np.sign(HV)                                                                         

Norm2 = np.vectorize(norm2)

def Norm3(HV):
    HV[HV > 0] = 1
    HV[HV < 0] = -1
    mask = HV==0;
    HV[mask] = np.random.choice((-1,1),HV[mask].shape)
    return HV

def generate(size):
    return np.random.binomial(1, 0.5, size=size) * 2 - 1

def Norm4(arr):
    np.floor_divide(arr, 2, out=arr)
    positions = (arr == 0)
    size = sum(positions)
    np.add.at(arr, positions, generate(size)

时间是:

%%timeit
d = Norm1(c)
203 µs ± 5.9 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%%timeit
d = Norm2(c)
33.4 ms ± 1.03 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

%%timeit
d = Norm3(c)
217 µs ± 11.5 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

%%timeit
d = Norm4(c)
21 ms ± 1.23 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

因此,就目前而言,答案13似乎是最好的。它们之间的差异看起来很小,但是在尝试了更多的运行之后,数字 1 总是略微领先

感谢您的帮助!我将在问题中添加一些对高清计算的引用,因为这是此应用程序中的核心问题,因此如果需要,有人会更容易找到它。


推荐阅读