首页 > 解决方案 > 实现 Numba 时遇到嵌套的 Numpy 数组

问题描述

我有一个 Numpy 数组,其中包含来自 56 个 x 射线(arr1,float32 数组)的信息,其中一列包含与 arr1 相关的 56 个数组 [95200,2](arr2,对象数组)。我的目标是遍历这两个数组并为arr2 (arr_out)中的每一行创建一个包含来自arr1的信息的新数组。

作为一种实践方式,我想实施 Numba 以加快速度,但这确实会引发我无法解决的 Numba 错误。

如果我要正确理解,这主要是由 arr2 引起的,因为它是一个对象数组,但是我无法让我的头脑努力寻找解决方案。

有人可以推我一下吗?

我当前的代码;

@numba.jit
def fill():
    arr_out = np.empty((0,6))
    row, column = arr1.shape
    for row in range(0,row):
        print('Row number: {}'.format(row))
        matrix = arr2[row]
        matrix_rows = len(matrix)-1

        for m_row in range(0, matrix_rows):
            inp_arr = [np.hstack((arr1[row, 0:4],matrix[matrix_row]))]
            arr_out = np.vstack((arr_out, inp_arr))

    return arr_out

编辑:我忘了显示警告;

Compilation is falling back to object mode WITH looplifting enabled because Function "fillspec" failed type inference due to: Untyped global name 'arr2': Unsupported array dtype: object

File "<ipython-input-44-7e98fec24979>", line 7:
def fillspec():
    <source elided>
        print('Row number: {}'.format(row))
        matrix = arr2[row]

还有其他的,但如果我理解正确的话,它们与这个初始警告有关。(我不觉得警告转储会增加我的问题:))

(在这种情况下,术语嵌套数组是正确的,对吧?)

编辑2:正如所指出的, arr2 的定义很可能很重要;为了将 arr1 定义为 float 我取出 arr2 这样;

arr2 = arr_orig[:,8]
arr1 = np.delete(arr_orig,8, axis=1)
arr1  = arr1.astype(np.float32)

这将 arr2 保留为对象数组,但是 arr2 内的嵌套数组定义为浮点数。

标签: arraysnumpynumba

解决方案


感谢@hpaulj 的遮阳篷,我正在努力解决一个简单的问题。

我的解决方案是将每个循环结果列表放入一个列表中,然后在关闭循环后将列表转换为一个数组。最初需要很长时间的地方,现在只需要不到 2 分钟(这确实让我有些怀疑;))。

感谢大家的帮助!

边注; 我在循环上放了一个计时器,并注意到每个循环的时间都在增加。这与@hpaulj 的 awnser 相结合,促使我重建。


推荐阅读