首页 > 解决方案 > 在正态分布中拟合 mongo 用户集合

问题描述

我有一个 mongo 集合,它保留了用户的特征,例如年龄、就业状况等,如下所示:

{"_id":{"$oid":"5f0bfe85a960f54c082c1bdd"},
"user_id":"5f0809e5df54cbb9a41a3f12",
"age":30,
"sex":2,
"employment":1,
"education":3
}

我想找到远离典型用户的异常用户,因为这是由集合中的各种文档塑造的。为了实现这一点,我想使集合符合正态分布。我注意到gaussian-fit这里提供的节点库https://www.npmjs.com/package/gaussian-fit。我的理解是,在数据变量中,我应该传递集合中每个字段的值......?有没有办法对集合及其数据如何分布做出一般性结论?

标签: node.jsmongodbnormal-distribution

解决方案


为了检查不同变量字段的分布情况,我使用了 Mongo Atlas,将集合部署在集群中,然后使用 Charts 创建直方图,使用 bin 或不使用 bin 检查它们的分布情况,并获得它们的可视化图片,如下所示:

在此处输入图像描述


推荐阅读