elasticsearch - ElasticSearch:解释所有文档“_size”和“store.size_in_bytes”API 端点总和之间的差异?
问题描述
我注意到,如果我将_size
所有 ElasticSearch 文档的属性汇总在一个索引中,我会得到一个值 about 180 GB
,但如果我转到_stats
同一索引的 API 端点,我会得到一个size_in_bytes
值 for all primaries
to be 100 GB
。
根据我的理解,该_size
属性应该是_source
字段的大小,并且索引当前存储该_source
字段,所以它不应该至少与 的总和一样大_size
吗?
解决方案
_size 似乎存储了源文档的实际大小。当实际将源存储在存储字段中时,Elasticsearch 会对其进行压缩(如果我没记错的话,默认为 LZ4)。所以我希望它在磁盘上的大小小于实际大小。如果源中没有任何二进制数据,压缩率也会显着提高。
推荐阅读
- java - 判断api请求是来自CURL还是POSTMAN?
- jquery - 使用 Jquery 在单击时选择列表中的下一个元素
- python - 在 Python 中绘制有向图?
- javascript - 如何为 vanilla-lazyload 动态设置图像高度和宽度
- node.js - Mongoose findByIdAndUpdate 销毁缺失的字段
- android - 如何在单击按钮时从“领域数据库”中删除数据?
- javascript - 如何禁用 gridStack 自动定位功能?
- performance - 未处理的异常如何导致 Azure 应用服务缓慢?
- java - 在Java 8中通过流将列表转换为具有父子关系的嵌套列表
- angular - 如何将配置参数传递给角度库?