首页 > 解决方案 > Pandas 数据帧高效算法

问题描述

我开始大量使用 pandas 数据帧,并且我对算术效率有疑问。

大多数时候,我的数据框是从左到右构建的,我在末尾附加一个新列,新列是从 df.xml 中已有的值构建的。目前,它只依赖于行,没有聚合。

我的问题是,最有效的方法是什么?我喜欢构建函数来包含我的算术。那么我是否构建一个接受单个值的函数,然后使用

.apply(lambda x: my_func(x['col']), axis=1)

或者我应该制作脱离系列的功能?那我可以说 df['new']=my_func(df['col'])

谢谢!

标签: pythonpython-3.xpandasdataframe

解决方案


推荐阅读