首页 > 解决方案 > 将某些列更改为零

问题描述

我有一个非常大的数据集 XposMay (125,800 000)。为了方便起见,我在下面制作了较小的版本。我想查看 SomAprilMay 中的哪些值小于 3,并将相应的列删除为零。这是我下面的代码,它不会将任何内容更改为零。

SomAprilMay=[0,0,0,1,0,1,2,3,4,15,12,14,1,10]
XposMay=[[50,51,52,53,54,55,56,57,58,59,60,61,62,63],
         [50,51,52,53,54,55,56,57,58,59,60,61,62,63],
         [50,51,52,53,54,55,56,57,58,59,60,61,62,63]]
Xpos1May=XposMay
a=[]
b=[]
for k in range (0,len(SomAprilMay)):
    if SomAprilMay[k] < 3:
        a.append(SomAprilMay[k])
        b.append(k)
for m in range (0,len(XposMay)):
       Xpos1May[:][b[m]]=0

由于 SomAprilMay 的前 7 和最后一个元素 < 3,因此想要的结果是:

Xpos1May = [[0,0,0,0,0,0,0,57,58,59,60,61,62,0],
            [0,0,0,0,0,0,0,57,58,59,60,61,62,0],
            [0,0,0,0,0,0,0,57,58,59,60,61,62,0]]

我该怎么做呢?

标签: pythonzero

解决方案


我建议使用 numpy 数组来完成这项任务,因为这比遍历整个事情要快。但是,SomAprilMay 和 XposMay 列表的尺寸不相等,所以我假设您在那里打错字并在最后的 1 之前添加了另外 14 个。这段代码

import numpy as np
SomAprilMay=np.array([0,0,0,1,0,1,2,3,4,15,12,14,14,1])
XposMay=np.array([[50,51,52,53,54,55,56,57,58,59,60,61,62,63],
         [50,51,52,53,54,55,56,57,58,59,60,61,62,63],
         [50,51,52,53,54,55,56,57,58,59,60,61,62,63]])
XposMay.T[SomAprilMay < 3] = 0
XposMay

然后产生所需的

array([[ 0,  0,  0,  0,  0,  0,  0, 57, 58, 59, 60, 61, 62,  0],
       [ 0,  0,  0,  0,  0,  0,  0, 57, 58, 59, 60, 61, 62,  0],
       [ 0,  0,  0,  0,  0,  0,  0, 57, 58, 59, 60, 61, 62,  0]])

推荐阅读