python - numpy.insert() 函数将数组插入错误的索引
问题描述
在这里,我的代码实现了文本文件的值;并将矩阵创建为多维数组,但问题是代码创建了更多的二维数组,我无法操作,我需要二维数组,我该怎么做?
解释我的代码的算法:
代码 Moto:我的代码从特定文件夹中获取值,每个文件夹包含 7 个“txt”文件,从一个用户生成,这样多个文件夹包含多个用户的多个数据。
第1步:开始第一个for循环,并使用特定文件夹中有多少个文件夹来控制它,并在变量'path'中存储第一个文件夹的第一个路径。
step2:使用第二个for循环打开路径并获取7个txt文件的数据。在feats之后,它关闭第二个for循环并执行其余代码。
step3:将7个txt文件的数据合并到一个一维数组中。
step4:使用获取 2 个文件夹的数据创建 2d 数组
step5(这里出现问题):在二维数组ind inser id数组中创建一行
import numpy as np
import array as arr
import os
f_path='Result'
array_control_var=0
#for feacth directory path
for (path,dirs,file) in os.walk(f_path):
if(path==f_path):
continue
f_path_1= path +'\page_1.txt'
#Get data from page1 indivisualy beacuse there string type data exiest
pgno_1 = np.array(np.loadtxt(f_path_1, dtype='U', delimiter=','))
#only for page_2.txt
f_path_2= path +'\page_2.txt'
with open(f_path_2) as f:
str_arr = ','.join([l.strip() for l in f])
pgno_2 = np.asarray(str_arr.split(','), dtype=int)
#using loop feach data from those text file.datda type = int
for j in range(3,8):
#store file path using variable
txt_file_path=path+'\page_'+str(j)+'.txt'
if os.path.exists(txt_file_path)==True:
#genarate a variable name that auto incriment with for loop
foo='pgno_'+str(j)
else:
break
#pass the variable name as string and store value
exec(foo + " = np.array(np.loadtxt(txt_file_path, dtype='i', delimiter=','))")
#marge all array from page 2 to rest in single array in one dimensation
f_array=np.concatenate((pgno_2,pgno_3,pgno_4,pgno_5,pgno_6,pgno_7), axis=0)
#for first time of the loop assing this value
if array_control_var==0:
main_f_array=f_array
if array_control_var==1:
#here use np.array()
main_f_array=np.array([main_f_array,f_array])
else:
main_f_array=np.insert(main_f_array, array_control_var, f_array, 0)
array_control_var+=1
print(main_f_array)
我想要这样的输出
初始 [[0,0,0],[0,0,0,]]
插入后 [[0,0,0],[0,0,0],[0,0,0]]
但输出是
[array([0, 0, 0]) array([0, 0, 0]) 0 0 0]
解决方案
正如我评论的那样,收集带有insert
(或变体concatenate
)的数组很难做到正确,而且工作时速度很慢。它每次都会构建一个全新的数组。将数组收集到一个列表中,并在最后构建一个数组更容易、更快。列表追加是高效的,并且易于使用。
也就是说,您报告的结果看起来很可疑。我可以通过以下方式重现它:
In [281]: arr = np.zeros(2, object)
In [282]: arr
Out[282]: array([0, 0], dtype=object)
In [283]: arr[0] = np.array([0,0,0])
In [284]: arr[1] = np.array([0,0,0])
In [285]: arr
Out[285]: array([array([0, 0, 0]), array([0, 0, 0])], dtype=object)
In [286]: np.insert(arr, 2, np.array([0,0,0]), 0)
Out[286]: array([array([0, 0, 0]), array([0, 0, 0]), 0, 0, 0], dtype=object)
在较早的迭代中,main_f_array
必须已将其创建为对象 dtype 数组。
如果它是一个“正常”的二维数组,插入会有所不同:
In [287]: arr1 = np.zeros((2,3),int)
In [288]: np.insert(arr1, 2, np.array([0,0,0]), 0)
Out[288]:
array([[0, 0, 0],
[0, 0, 0],
[0, 0, 0]])
或者像我认为你想要的那样迭代:
In [289]: f_array = np.array([0,0,0])
In [290]: main = f_array
In [291]: main = np.array([main, f_array])
In [292]: main
Out[292]:
array([[0, 0, 0],
[0, 0, 0]])
In [293]: main = np.insert(main, 2, f_array, 0)
In [294]: main
Out[294]:
array([[0, 0, 0],
[0, 0, 0],
[0, 0, 0]])
推荐阅读
- c++ - 遵循单一定义规则,但 C++ 抛出重定义错误
- python-3.x - 计算多对向量的点积的更好方法?
- excel - 将 INDEX-MATCH 动态范围公式添加到工作簿命名范围的代码?
- android - 安卓 Cmake 3.18.1 配置
- python - 如何舍入列表中的下一个数字?
- javascript - 禁用在 selenium (Node.js) 中打开的选项卡
- python - 带有 Google 表格的 Python 无法写入 Col B
- python - 为什么不识别 praw 模块?
- javascript - 无法使用设置变量javascript
- java - 在java中将数据存储在字节数组中