首页 > 解决方案 > MongoDB 在负载下执行缓慢

问题描述

我们使用 8 核、32GB RAM 的 mongodb 3.4.14。我正在使用 Jmeter 执行负载测试,有 70 个线程我有可接受的输出。但随着负载的增加,SLA 呈指数级增长,吞吐量急剧下降。我尝试增加ulimit分片,下一步是分片,除此之外还有其他我可以做的性能优化吗?

更新

@Jeet,这是调查结果:

  1. 有很多聚合查询吗?你有什么样的集合结构,即

负载测试在单个聚合查询上运行,并且文档的结构也具有相同的字段集。修复文档大小会有所帮助吗?我该怎么做?

  1. 有很多嵌套数组吗?

答:没有嵌套查询。

  1. 它是单个实例还是副本集?尝试将具有读写功能的副本集放入不同的节点。

目前我们只想在单个节点上运行。

  1. 查询是否从多个集合返回数据?

不,只有 1 个集合。

  1. 检查您的实例在多少百分比的操作中出现页面错误?

在有 500 个用户的情况下,我看不到太多页面错误,只有 2 位数字。

  1. 在高锁/队列期间检查您的日志以查找具有高 nscanned 或 scanAndOrder 的操作,并相应地编制索引。

我怎样才能检查它?

  1. 检查您对 CPU 密集型运算符的查询,例如 $all、$push/$pop/$addToSet,以及对大型文档的更新,尤其是对具有大型数组(或大型子文档数组)的文档的更新。

是的,在上述负载下,CPU 已满,响应延迟。我们正在做一个 groupBy 然后用限制排序。

  1. 如果您的数据库是写繁重的,请记住每个数据库一次只能写入一个 CPU(由于该线程持有写锁)。考虑将部分数据移动到它自己的数据库中。

我们的数据库主要是读取繁重的,该集合将每天填充一次。

除此之外,我尝试通过将以下代码放入 for 循环中进行简单测试:

Document findQuery = new Document("userId", "Sham");
FindIterable<Document> find = collection.find(findQuery);
MongoCursor<Document> iterator = find.iterator();

使用 executor 启动进程:

ExecutorService executorService = Executors.newFixedThreadPool(100);

即使这样,性能也很慢,需要 900 毫秒才能返回。

1 个请求 = 每个请求 150 毫秒

100 个请求 = 每个请求 900 毫秒

当我看到 500 个用户的统计数据如下:

insert query update delete getmore command dirty used flushes vsize   res qrw arw net_in net_out conn                time
    *0    *0     *0     *0       0     1|0  0.0% 0.0%       0  317M 28.0M 0|0 0|0   156b   45.1k    3 Oct 12 15:31:19.644
    *0    *0     *0     *0       0     1|0  0.0% 0.0%       0  317M 28.0M 0|0 0|0   156b   45.1k    3 Oct 12 15:31:20.650
    *0    *0     *0     *0       0     3|0  0.0% 0.0%       0  317M 28.0M 0|0 0|0   218b   46.1k    3 Oct 12 15:31:21.638
    *0    *0     *0     *0       0     2|0  0.0% 0.0%       0  317M 28.0M 0|0 0|0   158b   45.4k    3 Oct 12 15:31:22.638
    *0    *0     *0     *0       0     1|0  0.0% 0.0%       0  317M 28.0M 0|0 0|0   157b   45.4k    3 Oct 12 15:31:23.638
    *0   376     *0     *0       0   112|0  0.0% 0.0%       0  340M 30.0M 0|0 0|0  64.9k   23.6m   26 Oct 12 15:31:24.724
    *0    98     *0     *0       0   531|0  0.0% 0.0%       0  317M 27.0M 0|0 0|0   109k   6.38m    3 Oct 12 15:31:25.646
    *0    *0     *0     *0       0     2|0  0.0% 0.0%       0  317M 27.0M 0|0 0|0   215b   45.6k    3 Oct 12 15:31:26.646
    *0    *0     *0     *0       0     1|0  0.0% 0.0%       0  317M 27.0M 0|0 0|0   157b   45.1k    3 Oct 12 15:31:27.651
    *0    *0     *0     *0       0     2|0  0.0% 0.0%       0  317M 27.0M 0|0 0|0   159b   45.8k    3 Oct 12 15:31:28.642

标签: javamongodbperformance

解决方案


这也取决于您发出的查询类型,请检查是否存在以下几点 -

  • 有很多聚合查询吗?你有什么样的集合结构,即
  • 有很多嵌套数组吗?
  • 它是单个实例还是副本集?尝试将具有读写功能的副本集放入不同的节点。
  • 查询是否从多个集合返回数据?
  • 检查您的实例在多少百分比的操作中出现页面错误?
  • 在高锁/队列期间检查您的日志以查找具有高 nscanned 或 scanAndOrder 的操作,并相应地编制索引。
  • 检查您对 CPU 密集型运算符的查询,例如 $all、$push/$pop/$addToSet,以及对大型文档的更新,尤其是对具有大型数组(或大型子文档数组)的文档的更新。
  • 如果您的数据库是写繁重的,请记住每个数据库一次只能写入一个 CPU(由于该线程持有写锁)。考虑将部分数据移动到它自己的数据库中。

随着时间的推移,这是几件会降低性能的事情。我在这里介绍了最常见的用例,但是请查看这篇文章以获得更多见解。


推荐阅读