statistics - 如何比较不同统计检验的结果?
问题描述
我不知道这是不是一个好问题。
情况就是这样,假设我有一个比例/连续因变量和一堆自变量。我的最终目标是建立一个模型来使用这些自变量来预测/估计因变量。我相信这是一个常见的设置。
关键是我知道所有变量的物理含义,但我不知道它们的详细关系(甚至相关与否)。我想更多地从分析/解释的角度构建模型,以便我可以从模型而不是黑匣子中获得一些真实世界的见解。
我的方法是尝试使用 CHAID 算法来构建决策树类型的模型。在每个分支,我想统计测试每个自变量,看看它与因变量之间是否存在关系。然后,根据测试结果,我想选择最强大的一个来构建我的树。
问题是,与大多数变量是分类的 CHAID 算法不同,在我的情况下,因变量是规模,而自变量是分类或规模,这意味着我可能需要对不同的变量进行不同的统计检验,例如 t 检验和 ANOVA 用于分类的和回归的连续的。我想知道我应该如何公平地比较这些结果以选择最强大的结果?(如 CHAID 中的修正步骤)
关于我计划的任何部分的任何想法对我来说都非常重要!谢谢!
解决方案
推荐阅读
- reactjs - 我们很抱歉。该卖家不接受以您的货币付款。请返回给卖家,并在react中选择另一种付款方式
- r - 带参数渲染时如何缓存中间结果?
- groovy - 如何将“println”命令输出重定向到 Groovy 中的文件
- docker - Synology Docker UrBackup can't delete folder => Operation not permitted
- javascript - How to use tilesLoaded in angular 8?
- python - matlab vs python中的数据结构和格式?
- json - 使用 circe-optics 从 json 中检索空值
- java - keyCode == KeyEvent.KEYCODE_BUTTON_Y 冻结焦点,之后无法导航
- php - SMTP 错误:以下收件人失败:SMTP 错误:以下收件人失败
- sql - oracle 中的 Unnest(String_to_array) 转换