首页 > 解决方案 > 如何比较不同统计检验的结果?

问题描述

我不知道这是不是一个好问题。

情况就是这样,假设我有一个比例/连续因变量和一堆自变量。我的最终目标是建立一个模型来使用这些自变量来预测/估计因变量。我相信这是一个常见的设置。

关键是我知道所有变量的物理含义,但我不知道它们的详细关系(甚至相关与否)。我想更多地从分析/解释的角度构建模型,以便我可以从模型而不是黑匣子中获得一些真实世界的见解。

我的方法是尝试使用 CHAID 算法来构建决策树类型的模型。在每个分支,我想统计测试每个自变量,看看它与因变量之间是否存在关系。然后,根据测试结果,我想选择最强大的一个来构建我的树。

问题是,与大多数变量是分类的 CHAID 算法不同,在我的情况下,因变量是规模,而自变量是分类或规模,这意味着我可能需要对不同的变量进行不同的统计检验,例如 t 检验和 ANOVA 用于分类的和回归的连续的。我想知道我应该如何公平地比较这些结果以选择最强大的结果?(如 CHAID 中的修正步骤)

关于我计划的任何部分的任何想法对我来说都非常重要!谢谢!

标签: statisticsregressionanovat-teststatistical-test

解决方案


推荐阅读