首页 > 解决方案 > 区间优化搜索

问题描述

我的目标是使用给定的算法找到某个分布的概率密度函数。

这个算法要求我搜索一个浮点数放置在哪个区间。即使代码运行完美,它也需要太长时间。我一直在寻找一种优化代码的方法,但没有想到。

在每次迭代中,我检查浮点数是否在区间内:如果是这种情况,我希望在数组 p 中与我正在考虑的位置保持一致。

这是我的代码:

import numpy as np
import pylab as plt
import random as rd

n = [10,100,1000]
N = [10**6]
dy = 0.005
k_max = int(1/dy-1)
y = np.array([(j+0.5)*dy for j in range(k_max+1)])
intervals = np.linspace(0,1,k_max+2)

def p(y,n,N):

   p = np.zeros(len(y))

   Y = np.array([sum(np.array([rd.random() for k in range(n)]))/n for j in range(N)])
   z = np.array([sum(np.array([rd.random() for k in range(n)])) for l in range(N)])

   for j in Y:
       for i in range(len(y)-1):
           if intervals[i] <= j < intervals[i+1]:
               p[i] += 1

   return(p/(dy*N))

for a in n:
    pi = p(y,a,N[0])

    plt.plot(y,pi,label = 'n = ' + str(a))

plt.title('Probability Density Function')
plt.xlabel('x')
plt.ylabel('p(x)')
plt.show()

编辑:我已按要求添加了完整代码。 编辑 2:修复了错误间隔。

标签: pythonoptimizationmicro-optimization

解决方案


可以在这里进行快速简单的优化:

   for j in Y:
       for i in range(len(y)-1):
           if intervals[i] <= j < intervals[i+1]:
               p[i] += 1

由于在区间 [0, 1] 上intervalslen(y)均匀间隔的数字组成,这也是Y值的范围,我们不需要搜索jin的位置intervals,而是可以计算它。

    for j in Y: p[int(j*(len(y)-1))] += 1

我们也可以删除未使用的

   z = np.array([sum(np.array([rd.random() for k in range(n)])) for l in range(N)])

剩余执行时间的最大部分由

   Y = np.array([sum(np.array([rd.random() for k in range(n)]))/n for j in range(N)])

这里的内部转换np.array非常耗时;最好把它们都排除在外:

   Y = [sum([rd.random() for k in range(n)])/n for j in range(N)]

推荐阅读