首页 > 解决方案 > num 向量化的空运行

问题描述

当我运行一个用 numpy 向量化的函数时,它总是比我预期的多执行一次。因此,在实际调用开始之前,似乎有一个空运行。最近,我因此遇到了麻烦。请参阅以下最小示例:

import numpy as np

class PERSON:
    def __init__(self, age):
        self.age = age

class TIME:
    def __init__(self):
        self.ages = np.array([0,0])

    def init_persons(self):
        vec_init_persons = np.vectorize(self.__scalar_init_person)
        self.persons = vec_init_persons(self.ages)

    def __scalar_init_person(self, age):
        return PERSON(age)

    def let_time_pass(self):
        vec_let_time_pass = np.vectorize(self.__scalar_let_time_pass)
        vec_let_time_pass(self.persons)

    def __scalar_let_time_pass(self, person):
        person.age += 1

time = TIME()
time.init_persons()
time.let_time_pass()

print("Age of person 1: {}".format(time.persons[0].age)) # output is 2 not 1!
print("Age of person 2: {}".format(time.persons[1].age)) # output is 1

通常,我会猜到,两个人的年龄都是 1。所以我的问题是:

  1. 现在有人知道这次试运行的目的吗?对我来说,我似乎只是一个潜在麻烦的来源。

  2. 示例说明了处理问题的pythonic方法是什么?

标签: numpyvectorizationdry-run

解决方案


从文档

的输出的数据类型vectorized是通过使用输入的第一个元素调用函数来确定的。这可以通过指定otypes参数来避免。

提供该vectorize功能主要是为了方便,而不是为了性能。该实现本质上是一个 for 循环。


推荐阅读