首页 > 解决方案 > H2O 中的平均残差公式

问题描述

我试图找出 H2O 中用于 Tweedie 分布的平均残差损失函数的确切公式。

或者,一般来说,Tweedie 分布因变量的平均残差是多少?

到目前为止,我找到了这个页面(http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/glm.html#tweedie-models)其中tweedie分布的偏差公式给出为:

H2O 文档中的 Tweedie 偏差

但是,在 H2O 代码中,可在此页面第 103 行的 github 上找到(https://github.com/h2oai/h2o-3/blob/master/h2o-core/src/main/java/hex/Distribution.java# L103)公式的指定方式不同(忽略欧米茄,它只是权重,并且缺少求和):

2 * w * (Math.pow(y, 2 - tweediePower) / ((1 - tweediePower) * (2 - tweediePower)) - y * exp(f * (1 - tweediePower)) / (1 - tweediePower) + exp(f * (2 - tweediePower)) / (2 - tweediePower))

方程形式为:

代码中使用的 Tweedie Deviance

那么,是文档错误还是实施错误?我将不胜感激任何帮助!

谢谢!

标签: statisticsh2oglmgbmtweedie

解决方案


感谢您指出这一点,虽然位于此处的后端方程式是正确的(因此实现是正确的),但文档中的方程式似乎不正确。我创建了这张Jira 票证来更新文档中的等式。票证包含正确的方程式以及推导它的有用信息。


推荐阅读