首页 > 解决方案 > 如何使用 groupby 获取 pandas 数据框列的斜率

问题描述

我正在尝试查找数据框列(标记为“计数”)的斜率和值并显示为新列表。问题是有多个公司名称,必须首先使用 groupby 进行分组。另一件事是每家公司都是按日期划分的,我认为这是一个对象,所以我认为它必须首先转换为日期时间或值?

让我们称之为df:

样本:

  |  Date        |Domain|Count|
 +---------------+------+-----+
 0|Feb,1,2019    | c1   |  8  |
 1|March 1, 2019 | c1   |  5  |
 2|April 1,2019  | c1   |  4  |
 3|Feb,1,2019    | c2   |  2  |
 4|March 1, 2019 | c2   |  6  |
 5|April 1,2019  | c2   |  9  |
 6|Feb,1,2019    | c3   |  1  |
 7|March 1, 2019 | c3   |  3  |
 8|April 1,2019  | c3   |  7  |

想显示为:

    slope | intercept | yval | pval
c1  456       667        5      6
c2  3          4         6      8 

(编了这些数字)

df.groupby('Domain').apply(lambda v: linregress(v.Date, v.Count)[0])

sklearn reg.fit 也可能在这里工作?

标签: pythonpandasplotsklearn-pandasgraphing

解决方案


推荐阅读