首页 > 解决方案 > 如何在pyspark中为计数模型实现负二项式回归?

问题描述

我已经使用 glm.nb() 在 R 中实现了它,并且还使用 stats models api 在 python 中实现了它。但在 pyspark 中找不到合适的。

library(MASS)                # r-code
freg <- formula(ClaimNb ~ DriverAge + CarAge + Density + Brand + Power + Gas + offset(log(Exposure)))
regnb2 <- glm.nb(freg,data = CONTRACTS.f)
summary(regnb2)

from statsmodels.formula.api import glm     # python-code
regnb2 = glm(formula = form, data = contracts ,family = sm.families.NegativeBinomial(alpha=1)).fit()
print(regnb2.summary())

需要 pyspark 版本。

提前致谢。

标签: pyspark

解决方案


推荐阅读