首页 > 解决方案 > Cassandra 的意外行为

问题描述

我在 4 DC 中有一个 cassandra 集群(3.11.2 版本)。

有时,每个 DC 中的节点都开始工作。有很多读修复操作,很多成功提示。

指标:

它发生大约1小时。在这个时候,节点失去了彼此和自身的连接:

[cluster3-timeouter-0] com.datastax.driver.core.Host.STATES - [] Defuncting Connection[/{{local_ip}}:9042-1, inFlight=0, closed=false]
    com.datastax.driver.core.exceptions.ConnectionException: [/{{local_ip}}:9042] Heartbeat query timed out
        at com.datastax.driver.core.Connection$11.onTimeout(Connection.java:1191)
        at com.datastax.driver.core.Connection$ResponseHandler$1.run(Connection.java:1380)
        at io.netty.util.HashedWheelTimer$HashedWheelTimeout.expire(HashedWheelTimer.java:625)
        at io.netty.util.HashedWheelTimer$HashedWheelBucket.expireTimeouts(HashedWheelTimer.java:700)
        at io.netty.util.HashedWheelTimer$Worker.run(HashedWheelTimer.java:428)
        at io.netty.util.concurrent.DefaultThreadFactory$DefaultRunnableDecorator.run(DefaultThreadFactory.java:144)

我不明白,为什么会这样。这不是压实,因为压实指标中没有异常。有什么想法为什么会发生吗?

标签: cassandra

解决方案


推荐阅读