首页 > 解决方案 > 什么时候不能将矢量化应用于熊猫处理?

问题描述

我知道这可能是一个特别模棱两可的问题,但我一直在尝试使用 pandas 矢量化优化代码,因为我使用的是 Bigdata。我也了解向量化的基本思想,如果一个函数可以对整个数组进行操作,而不必考虑数组的各个元素,那么它就可以用于向量化。我想了解在结构中的数据元素存在条件的情况下,如果函数的参数是列表、字典等,是否可以应用矢量化。

让我举一个基本的例子:假设我有一个接受 python 列表的函数,将这个列表的元素映射到另一个列表中的值。然后在映射列表和第三个列表之间执行类似 Jaccard 相似度的操作。

矢量化是可能的,还是只能使用像 pandas.dataframe.apply() 这样的顺序函数?

标签: pythonpandasoptimizationvectorization

解决方案


推荐阅读