首页 > 解决方案 > 如何使用 pandas 获取数据

问题描述

我在获取数据时遇到问题。我有这个数据框:

在此处输入图像描述

我需要按 'fabricante' == 'Kellogs' 过滤并获得 'calorias' 列,我这样做了:

在此处输入图像描述

我需要第二列(卡路里)来引入这个函数:

def valor_medio_intervalo(fabricante, variable, confianza):

   subconjunto = None          # Select only the data: (fabricante, variable) from 'cereal_df'

  inicio, final  = None, None  # put the statistical function here.

  return inicio, final

这是我最后一部分的代码:

def valor_medio_intervalo(fabricante, variable, confianza):
  
  
  
  subconjunto = cereal_df.loc[cereal_df['fabricante'] == fabricante][variable]
  
  inicio, final  = sm.stats.DescrStatsW(variable).tconfint_mean(alpha = 1-confianza) 

  return inicio, final

错误:

在此处输入图像描述

如果你能帮助我,我会非常感激

标签: pythonarrayspandasstatistics

解决方案


你打电话DescrStatsW('calorias')

但你肯定想要DescrStatsW(subconjunto),对吧?我只是在阅读https://www.statsmodels.org/stable/generated/statsmodels.stats.weightstats.DescrStatsW.html ,它解释了您应该传入 1 列或 2 列的numpy 数组或数据框。


推荐阅读