首页 > 解决方案 > elasticsearch 用于 DWH 可视化的 POC

问题描述

我只是在探索 ELK 堆栈,我们正在寻找使用弹性搜索来进行 DWH 分析和可视化。我无法想象的一种情况是,如何保留仓库中的现有数据以转换为文档。

例如

我们的跨国数据包括 device_ids 及其各自的状态,就状态而言,我们每天有 30000 个 ids(大约)。像“事务表 T1”列:Date,Device_id,type,alarm1,state,comments

“查找表”T2 列:device_id,user_id

这 30000 个加上 device_id 与 5000 个(大约)用户映射,基于他们可以看到各自的设备状态。

问题是,如果我在弹性搜索中对这种结构进行规范化,那么我最终每天将拥有 30000*5000 = 1.5 亿个文档,这不是肯定的方法。

与在 RDBMS 中一样,您保持规范化结构以最小化数据大小和加载效率,我们可以在弹性搜索中对这些数据进行建模,以便在 kibana 的最终输出中保持基于用户的访问不变。我不熟悉如何在弹性搜索中建模。

感谢您对此的建议。

标签: jsonelasticsearchbigdatakibanaelastic-stack

解决方案


推荐阅读