首页 > 解决方案 > Pandas 和 Numpy 的不同标准差

问题描述

我试图计算std一个数组,我尝试使用numpyandpandas来查找std,但我所取得的结果是不合逻辑的,我有两个不同std的相同数组!

为什么会发生这种情况?

>>> import numpy as np
>>> import pandas as pd

>>> a = np.arange(10)+1
>>> a
array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])
>>> a.std()
2.8722813232690143
>>> b = pd.DataFrame(a)
>>> b.std()
0    3.02765
dtype: float64

标签: pythonpandasnumpy

解决方案


差异在于自由度,numpy 中的默认值是ddof=0,pandas 中的默认值是ddof=1

print(a.std())
2.8722813232690143
print(a.std(ddof=0))
2.8722813232690143

print(a.std(ddof=1))
3.0276503540974917

b = pd.DataFrame(a)
print(b.std())
0    3.02765
dtype: float64
print(b.std(ddof=1))
0    3.02765
dtype: float64

print(b.std(ddof=0))
0    2.872281
dtype: float64

推荐阅读