首页 > 解决方案 > solr 中的每个集合有多少个分片合适?

问题描述

我有一个 Solr 云(7.4 版),有 2 个节点(每个节点都有 10Gb SSD 硬盘和 256Gb 内存和 50Gb 堆)和 10 个集合。

一个集合有120亿个文档,其余集合有10亿个文档。

我们不知道有多少分片适合我的用例。

如何确定合适的着色器数量以及每个集合适用的 Shard 数量?

它有公式吗?

标签: solrsolrcloud

解决方案


分片应该位于不同的硬件上以获得最佳性能(这就是你分片的原因)。现在有 2 个节点,您几乎应该选择 2 个分片。但是为了获得您所追求的性能,您可能需要更多节点并添加更多分片。

自然,性能不仅仅是分片/节点数量的一个因素,还包括每个节点有多少内存(堆和堆外)、CPU、读/写混合、网络速度、磁盘 I/O 速度等。提及与索引大小和预期负载相比的 autoCommit / autoSoftCommit 设置。


推荐阅读