python - numpy：对操作结果执行“任何”或“全部”的有效方法

问题描述

假设您有两个 NumPy 数组a和b，并且您想要测试的任何值a是否大于的对应值b。

现在你可以计算一个布尔数组并调用它的any方法：

(a > b).any()

这将在内部完成所有循环，这很好，但它需要对所有对执行比较，即使第一个结果评估为True。

或者，您可以对标量比较进行显式循环。a在和b形状相同的情况下（因此不需要广播）的示例实现可能如下所示：

any(ai > bi for ai, bi in zip(a.flatten(), b.flatten()))

这将受益于True遇到第一个结果后停止处理的能力，但所有成本都与 Python 中的显式循环相关（尽管在理解内）。

有没有办法，无论是在 NumPy 本身还是在外部库中，您都可以传递您希望执行的操作的描述，而不是该操作的结果，然后让它在内部执行操作（优化低级代码）在一个“任何”循环中，可以从中中断？

可以假设某种接口，例如：

from array_operations import GreaterThan, Any

expression1 = GreaterThan('x', 'y')
expression2 = Any(expression1)

print(expression2.evaluate(x=a, y=b))

如果存在这样的东西，就能够动态地创建函数而言，它显然可以具有除了对all和的有效评估之外的其他用途。any

有这样的吗？

标签： pythonarraysnumpy

解决此问题的一种方法是延迟/延迟/延迟评估。C++ 社区使用一种叫做“表达式模板”的东西来实现这一点；您可以在此处找到可访问的概述：http: //courses.csail.mit.edu/18.337/2015/projects/TylerOlsen/18337_tjolsen_ExpressionTemplates.pdf

在 Python 中，最简单的方法是使用 Numba。你基本上只是使用循环在 Python 中编写你需要的函数for，然后你用它来装饰它就@numba.njit完成了。像这样：

@numba.njit
def any_greater(a, b):
    for ai, bi in zip(a.flatten(), b.flatten()): 
        if ai > bi: 
            return True 
    return False

有/曾经有一个 NumPy 增强提案可以帮助您的用例，但我认为它尚未实施：https ://docs.scipy.org/doc/numpy-1.13.0/neps/deferred-ufunc-评估.html

python - numpy：对操作结果执行“任何”或“全部”的有效方法

问题描述

解决方案

推荐阅读