pyspark - 如何在pyspark中为计数模型实现负二项式回归?
问题描述
我已经使用 glm.nb() 在 R 中实现了它,并且还使用 stats models api 在 python 中实现了它。但在 pyspark 中找不到合适的。
library(MASS) # r-code
freg <- formula(ClaimNb ~ DriverAge + CarAge + Density + Brand + Power + Gas + offset(log(Exposure)))
regnb2 <- glm.nb(freg,data = CONTRACTS.f)
summary(regnb2)
from statsmodels.formula.api import glm # python-code
regnb2 = glm(formula = form, data = contracts ,family = sm.families.NegativeBinomial(alpha=1)).fit()
print(regnb2.summary())
需要 pyspark 版本。
提前致谢。
解决方案
推荐阅读
- vb.net - 如何使用 APPCOMMAND_MICROPHONE_VOLUME_MUTE
- aws-api-gateway - 如果在 Terraform 模块中创建了 aws_api_gateway_integration,如何在 aws_api_gateway_deployment 资源上填充depends_on?
- ios - 无法在 ViewController 之间移动
- java - 循环中的加密和解密在 Java 中的第一次迭代后给出更快的结果
- html - @media print page size=A4 正在生成一个稍大的页面,并且边框正在渗入上一页
- node.js - Nodejs中多个客户端到单个服务器之间的连接
- sql-server - 不支持 KBMMW ORM MetaExists(mwmdtTable)
- laravel - "" 目录不存在 - php artisan into do droplet 由 forge 创建
- hibernate - 将 Hibernate SELECT 语句记录到它们自己的日志文件中
- reactjs - React 内部的工作循环持续多长时间?