average - 如何平均和平等比较具有不同数量数据元素的类别?
问题描述
我正在提取包含许多列出值的类别列表。然后我平均并进行比较 i。这是一般解释。
例子:
- 类别 1 有 2 个元素
- 类别 2 有 5 个元素
- 第 3 类有 9 个元素
- 第 4 类有 10 个元素
- 第 5 类有 17 个元素
- 第 6 类有 26 个元素
- 第 7 类有 55 个元素
在每个类别中,都有包含分数的单个元素。我正在尝试将整个类别的平均分数与另一个类别进行同等比较。
问题是因为每个类别包含不同数量的元素,所以评估的平均比较是不一样的。例如,将具有 2 个元素的类别 1 与具有 55 个元素的类别 7 进行比较。
如果类别 1 有 55 个元素,那么我可以说我同样将总价值与具有 55 个元素的类别进行比较。
我的第一个想法是说每个类别必须有 10 个分数才能平等比较。
对于第 1 类,我想只取 2 个分数,然后添加 8 个零以表明该类别由于没有其余 8 个而较弱,而与第 7 类相比,它是 52 个中最强的前 10 分,但我认为这不会提供任何有用的结果。
这同样适用于具有 5 个元素的类别 2,将 5 个零分解为 10。同样适用于具有 9 个元素的类别 3,将 1 个零分解为 10。
我想做的是找到一种方法来比较苹果和苹果,方法是知道每个类别都与设定的 10 分限制进行比较,以衡量相对于其他类别的得分更强。
有没有可以解决这个问题的过程或方法?有没有更好的方法来解决这个问题?
谢谢!
解决方案
我们无法为您决定哪个聚合函数最适合您的情况。通常,人们使用平均值或最大值,例如:
select category, count(1), avg(score), max(score) from scores group by category
推荐阅读
- google-sheets - Google表格:如果日期在今天和六个月前之间,则显示值
- r - 可变长度与随机森林不同
- laravel - 需要使用 Guzzle 7 向 uri 添加动态作业 ID
- r - 验证 s3 对象的最佳方法
- reactjs - React 在我的浏览器/机器上不起作用
- python - 带有 https 的 Python mitmproxy
- python - cosec(x) 上的 SymPy diff 函数正在返回 Derivative(cosec(x),x)
- node.js - 使用nodeJS从mongoDB查询一整天数据的问题
- sql - 将新数据附加到数据库行中的现有数据?
- r - 卒中数据集上的 GAM 和神经网络