首页 > 解决方案 > 查找计算元组流中项目平均值的哈希函数

问题描述

我是这个话题的新手,我正在努力学习,所以我的问题可能有点令人困惑。我的问题实际上是:我有一个以元组 [Country, state, person] 形式出现的数据流。现在在这个数据流上,我想执行计算该州平均人数的操作。我想通过将密钥作为[国家,州]来做到这一点。对于每个唯一的元组,哈希函数会更新包含计数的存储桶。

例如:如果我有一个元组 [USA, Ohio, person1],那么当它进入存储桶 2 时会更新,并且每次包含 USA 和 Ohio 的元组进入时,这个计数都会不断增加。这会给我来自美国 - 俄亥俄州的总人数,但我对如何找到它的平均值感到困惑,即属于 [美国,俄亥俄州] 的平均人数。我希望这能澄清一些事情。

标签: hashbigdatahash-functiondata-stream

解决方案


推荐阅读