python - 对 pandas 系列“any”、“max”、“sum”与 python 内置函数的性能好奇
问题描述
在使用 pandas/numpy 的 python 应用程序中寻求性能通常受益于使用 pandas/numpy 实现的方法而不是自己实现的代码,例如通过循环。这可能是对我遇到的问题的不好介绍,但是在下面的屏幕截图中(如果我没有测试过),我期望使用该系列方法的版本比 python 内置程序运行得更快。既然不是这样,这意味着我在这个例子上建立了一个错误的直觉,但我还没有找到原因。所以问题是,为什么在这种情况下使用 python 内置函数比在系列中应用的方法具有更高的性能(我是否遗漏了其他东西?)?
解决方案
我错过了其他东西吗?
你假设你总是会得到相同的结果,这是不正确的。sum
显示和的不同输出的示例pandas.Series.sum
是
import pandas as pd
s = pd.Series([1.0,2.0,float("nan")])
print(s.sum())
print(sum(s))
输出
3.0
nan
推荐阅读
- android - 如何将base64 Android保存到MySQL数据库?
- reactjs - 缺少 JSDoc @param "props.children" 类型。和缺少 JSDoc @param "props.children" 类型。使用 React Native 功能组件
- java - 如何在微调器下拉菜单上打开新活动单击
- reactjs - 我在哪里可以找到 react-bulma-components 的可用图标?
- python - 即使存在,也无法在 Selenium 中找到第二个元素
- c++ - 在对象中使用来自非对象 API 的函数的指针问题
- python - 如何使用我的 `ndarray` 在 matplotlib 中为以下几行设置动画?
- vba - VBA函数将多个变量传递回Sub
- python - ax.locator_params(nbins=k) 在 matplotlib 中不起作用
- python-3.x - opencv 不使用所有 GPU 内存