arrays - 实现 Numba 时遇到嵌套的 Numpy 数组
问题描述
我有一个 Numpy 数组,其中包含来自 56 个 x 射线(arr1,float32 数组)的信息,其中一列包含与 arr1 相关的 56 个数组 [95200,2](arr2,对象数组)。我的目标是遍历这两个数组并为arr2 (arr_out)中的每一行创建一个包含来自arr1的信息的新数组。
作为一种实践方式,我想实施 Numba 以加快速度,但这确实会引发我无法解决的 Numba 错误。
如果我要正确理解,这主要是由 arr2 引起的,因为它是一个对象数组,但是我无法让我的头脑努力寻找解决方案。
有人可以推我一下吗?
我当前的代码;
@numba.jit
def fill():
arr_out = np.empty((0,6))
row, column = arr1.shape
for row in range(0,row):
print('Row number: {}'.format(row))
matrix = arr2[row]
matrix_rows = len(matrix)-1
for m_row in range(0, matrix_rows):
inp_arr = [np.hstack((arr1[row, 0:4],matrix[matrix_row]))]
arr_out = np.vstack((arr_out, inp_arr))
return arr_out
编辑:我忘了显示警告;
Compilation is falling back to object mode WITH looplifting enabled because Function "fillspec" failed type inference due to: Untyped global name 'arr2': Unsupported array dtype: object
File "<ipython-input-44-7e98fec24979>", line 7:
def fillspec():
<source elided>
print('Row number: {}'.format(row))
matrix = arr2[row]
还有其他的,但如果我理解正确的话,它们与这个初始警告有关。(我不觉得警告转储会增加我的问题:))
(在这种情况下,术语嵌套数组是正确的,对吧?)
编辑2:正如所指出的, arr2 的定义很可能很重要;为了将 arr1 定义为 float 我取出 arr2 这样;
arr2 = arr_orig[:,8]
arr1 = np.delete(arr_orig,8, axis=1)
arr1 = arr1.astype(np.float32)
这将 arr2 保留为对象数组,但是 arr2 内的嵌套数组被定义为浮点数。
解决方案
感谢@hpaulj 的遮阳篷,我正在努力解决一个简单的问题。
我的解决方案是将每个循环结果列表放入一个列表中,然后在关闭循环后将列表转换为一个数组。最初需要很长时间的地方,现在只需要不到 2 分钟(这确实让我有些怀疑;))。
感谢大家的帮助!
边注; 我在循环上放了一个计时器,并注意到每个循环的时间都在增加。这与@hpaulj 的 awnser 相结合,促使我重建。
推荐阅读
- php - PHP - 自定义对象数组的顺序,即 C1、C2、C3 到 C2、C1、C3
- gams-math - 在 GAMS 中,如何编写变量函数?
- sql - Oracle to_date() 返回错误的日期 +2 天
- excel - Excel: How do I sort by the two digits after a dash?
- python-3.x - 打开压缩文件,三个管道(“|||”)后面的字符不可见
- python - IndexError:列表索引超出范围 - itens = [{}]
- java - Checking if a user input that should be an int is a string
- javascript - TypeError: Cannot read property "9" from undefined
- php - 从 PHP 5.3 应用程序调用 mysql 存储函数
- c++ - window doesnt show image SDL