首页 > 解决方案 > 最优列表理解(过滤现有列表)

问题描述

我在表单中有一个大列表(1e8+ 个条目)[index:boolean]。我想找到为真值的索引。在这项任务中的表现是最重要的。

目前,从我在 Python 3.7.2 中可以看出,这样做的最佳方法是使用列表推导,如下所示:

return [i for i, j in enumerate(numbers) if j]

我还尝试了以下方法(尽管它似乎只是早期 Python 版本的首选方法):

return list(filter(lambda a: a, numbers))

第二种方法比第一种方法慢约 25%。

目前,此操作大约需要 (0.8*x) 时间,而我的算法的实际逻辑部分需要 'x' 时间。(例如,如果逻辑需要 10 秒,从列表中提取正值大约需要 8 秒)。我曾希望这个操作会快得多。

标签: pythonlistoptimizationmicro-optimization

解决方案


在这项任务中的表现是最重要的

然后你应该考虑使用一个 numpy 数组:

import numpy as np
from random import choice
from timeit import Timer

bools = True, False
li = [choice(bools) for _ in range(int(1e8))]
arr = np.array(li)  

print(Timer(lambda: np.nonzero(arr)).repeat(1, 1))

输出

[0.4524359999999916]

那是0.4524359999999916几秒钟。


推荐阅读