python - 如果满足另一个数组中值的条件,则对 numpy 数组中的值求和
问题描述
我面临一个矢量化函数的问题,以便它有效地应用于 numpy 数组。
我的节目条目:
- Nb_particles线的pos_part 2D 阵列,3 列(基本上是 x,y,z 坐标,只有 z 与困扰我的部分相关)Nb_particles可以多达几十万。
- 具有Nb_particles值的prop_part一维数组。这部分我已经介绍过了,创建是用一些不错的 numpy 函数进行的;我只是在这里放了一个类似于真实值的基本分布。
- 一个z_distances 1D 数组,一个简单的 np.arange 介于 z=0 和 z=z_max 之间。
然后是需要时间的计算,因为我无法找到一种方法来正确地处理数组的 numpy 操作。我想做的是:
- 对于 z_distances 中的所有距离z_i ,如果对应的粒子坐标 z_particle < z_i ,则将prop_part中的所有值相加。这将返回一个与z_distances长度相同的一维数组。
到目前为止我的想法:
- 版本 0、for循环、枚举和np.where确实检索我需要求和的值的索引。显然很长。
- 版本 1,在新数组上使用遮罩(z 坐标和粒子属性的组合),并在遮罩数组上求和。好像比v0好
- 版本 2,另一个掩码和一个np.vectorize,但我知道它效率不高,因为 vectorize 基本上是一个for循环。似乎仍然比 v0 好
- 版本 3,我正在尝试在可以直接应用于 z_distances 的函数上使用掩码,但到目前为止它还没有工作。
所以,我在这里。可能与排序和累积总和有关,但我不知道该怎么做,所以任何帮助将不胜感激。请在下面找到代码以使事情更清楚
提前致谢。
import numpy as np
import time
import matplotlib.pyplot as plt
# Creation of particles' positions
Nb_part = 150_000
pos_part = 10*np.random.rand(Nb_part,3)
pos_part[:,0] = pos_part[:,1] = 0
#usefull property creation
beta = 1/1.5
prop_part = (1/beta)*np.exp(-pos_part[:,2]/beta)
z_distances = np.arange(0,10,0.1)
#my version 0
t0=time.time()
result = np.empty(len(z_distances))
for index_dist, val_dist in enumerate(z_distances):
positions = np.where(pos_part[:,2]<val_dist)[0]
result[index_dist] = sum(prop_part[i] for i in positions)
print("v0 :",time.time()-t0)
#A graph to help understand
plt.figure()
plt.plot(z_distances,result, c="red")
plt.ylabel("Sum of particles' usefull property for particles with z-pos<d")
plt.xlabel("d")
#version 1 ??
t1=time.time()
combi = np.column_stack((pos_part[:,2],prop_part))
result2 = np.empty(len(z_distances))
for index_dist, val_dist in enumerate(z_distances):
mask = (combi[:,0]<val_dist)
result2[index_dist]=sum(combi[:,1][mask])
print("v1 :",time.time()-t1)
plt.plot(z_distances,result2, c="blue")
#version 2
t2=time.time()
def themask(a):
mask = (combi[:,0]<a)
return sum(combi[:,1][mask])
thefunc = np.vectorize(themask)
result3 = thefunc(z_distances)
print("v2 :",time.time()-t2)
plt.plot(z_distances,result3, c="green")
### This does not work so far
# version 3
# =============================
# t3=time.time()
# def thesum(a):
# mask = combi[combi[:,0]<a]
# return sum(mask[:,1])
# result4 = thesum(z_distances)
# print("v3 :",time.time()-t3)
# =============================
解决方案
通过完全用 numpy 编写你的第一个版本,你可以获得更多的性能。将 python 替换sum
为np.sum
. 而不是for i in positions
列表理解,只需传递positions
您正在创建的掩码。事实上,这np.where
不是必需的,我最好的版本如下所示:
#my version 0
t0=time.time()
result = np.empty(len(z_distances))
for index_dist, val_dist in enumerate(z_distances):
positions = pos_part[:, 2] < val_dist
result[index_dist] = np.sum(prop_part[positions])
print("v0 :",time.time()-t0)
# out: v0 : 0.06322097778320312
如果 z_distances 很长,您可以使用numba
. 第一次运行calc
通常会产生一些开销,我们可以通过为一小部分`z_distances运行函数来消除这些开销。下面的代码在我的笔记本电脑上实现了大约两倍于纯 numpy 的加速。
import numba as nb
@nb.njit(parallel=True)
def calc(result, z_distances):
n = z_distances.shape[0]
for ii in nb.prange(n):
pos = pos_part[:, 2] < z_distances[ii]
result[ii] = np.sum(prop_part[pos])
return result
result4 = np.zeros_like(result)
# _t = time.time()
# calc(result4, z_distances[:10])
# print(time.time()-_t)
t3 = time.time()
result4 = calc(result4, z_distances)
print("v3 :", time.time()-t3)
plt.plot(z_distances, result4)
推荐阅读
- javascript - 如何处理和验证后端和前端之间的会话
- python - 如何从另一个数据框中的dict创建数据框?
- angular - 如何在没有附加组件的情况下在多个地方重用 HTML
- javascript - 解析 RSS 提要信息并显示在 HTML 页面上
- cassandra - Cassandra插入值消失
- c++ - 如果任何列中都不需要图像/图标,MFC CListCtrl 是否合适?
- python-3.x - Python 代码在行中使用 3 次时交换 csv 列(连续 3 天)
- c# - 如何修复我的 c# 二进制搜索算法?
- visual-studio-2015 - Visual Studio 2017/IIS Express:无法连接到已配置的开发 Web 服务器
- api - 如何验证 Analytics 360 是否与 BigQuery 成功关联?