solr - solr 中的每个集合有多少个分片合适?
问题描述
我有一个 Solr 云(7.4 版),有 2 个节点(每个节点都有 10Gb SSD 硬盘和 256Gb 内存和 50Gb 堆)和 10 个集合。
一个集合有120亿个文档,其余集合有10亿个文档。
我们不知道有多少分片适合我的用例。
如何确定合适的着色器数量以及每个集合适用的 Shard 数量?
它有公式吗?
解决方案
分片应该位于不同的硬件上以获得最佳性能(这就是你分片的原因)。现在有 2 个节点,您几乎应该选择 2 个分片。但是为了获得您所追求的性能,您可能需要更多节点并添加更多分片。
自然,性能不仅仅是分片/节点数量的一个因素,还包括每个节点有多少内存(堆和堆外)、CPU、读/写混合、网络速度、磁盘 I/O 速度等。提及与索引大小和预期负载相比的 autoCommit / autoSoftCommit 设置。
推荐阅读
- firebase - 托管在 Firebase 中的 Telegram 机器人没有响应
- list - Scala spark 如何与 List[Option[Map[String, DataFrame]]] 交互
- reactjs - React PrivateRoute 陷入路由循环
- java - 如何使用下载的二进制文件将 Apache Derby 作为 Gradle 依赖项包含在内
- html - 如何强制显示 favicon.ico 而不是 favicon.png?
- javascript - 阻塞请求不在 PM2 上同时运行
- class - Delphi RTTI 对象检查器
- javascript - 为什么我的 javascript 显示参考错误“提示未定义”
- fluent - 如何在 ANSYS fluent 控制台中设置位数
- python - Pandas:将带有 if/else 条件的 for 循环转换为 apply 方法(lambda 函数)