首页 > 解决方案 > 深入挖掘 Pandas 的实现

问题描述

我不能轻易理解 Pandas 所做的后端。

例如,我创建了一个均值的 df。如我所愿,df.mean只取数字列的平均值,忽略我的对象列,例如“学校名称”。我注意到,在尝试创建总和数据框时,df.sum尝试获取诸如“学校名称”之类的对象的总和,我在文档中看到您可以添加参数numeric_only=True。但是,如果您没有设置该参数,则文档声明两者df.mean和“将首先尝试使用所有内容”。df.sum所以我的问题变成了,“为什么在df.mean没有设置参数的情况下工作numeric_only?”

在尝试调查df.mean时,quickdocs 将我带到了cls.mean = _make_stat_function(...nanops.nanmean). 好的,在尝试调查nanmean时没有可用于numeric_only. 在快速文档中定义的唯一参数nanmean如下 def nanmean(values, axis=None, skipna=True, mask=None)

那么我在哪里可以找到 Pandas 的实现之类的东西df.mean呢?如果不是快速文档,我需要使用什么流程?

我的问题不是df.mean特别关于,而是,我需要单击什么才能轻松找到源代码,因为它看起来 quickdocs 略过了一些?我也在 PyCharm 工作。

标签: pythonpandas

解决方案


推荐阅读