首页 > 解决方案 > Apache Ignite 2.9.0 集群发现错误

问题描述

我们在 AKS 中有一个 apache ignite 集群。我们已经设置了具有 3 个节点的 ignite 集群。我可以看到 sys.nodes 和 sys.baseline_nodes 中显示了 3 个节点。以下是 1 个节点的缓存配置 -

    <property name="discoverySpi">
        <bean class="org.apache.ignite.spi.discovery.tcp.TcpDiscoverySpi">
            <property name="ipFinder">
                <bean class="org.apache.ignite.spi.discovery.tcp.ipfinder.kubernetes.TcpDiscoveryKubernetesIpFinder">
                    <property name="namespace" value="ignite"/>
                    <property name="serviceName" value="ignite-service"/>
                </bean>
            </property>
        </bean>
    </property>
    
    <property name="addressResolver">
            <bean class="org.apache.ignite.configuration.BasicAddressResolver">
                <constructor-arg>
                    <map>
                        <entry key="127.0.0.1" value="52.2XX.X.XX"></entry>
                    </map>
                </constructor-arg>
            </bean>
        </property>

但是为什么日志文件充满了以下消息?

[16:56:11,649][严重][grid-nio-worker-tcp-comm-0-#23][TcpCommunicationSpi] 无法处理选择器键 [ses=GridSelectorNioSessionImpl [worker=DirectNioClientWorker [super=AbstractNioClientWorker [idx=0] , bytesRcvd=42792440, bytesSent=867699, bytesRcvd0=0, bytesSent0=0, select=true, super=GridWorker [name=grid-nio-worker-tcp-comm-0, igniteInstanceName=null, finished=false, heartbeatTs=1610470568808 , hashCode=1382623580, interrupted=false, runner=grid-nio-worker-tcp-comm-0-#23]]], writeBuf=java.nio.DirectByteBuffer[pos=0 lim=32768 cap=32768], readBuf= java.nio.DirectByteBuffer[pos=0 lim=32768 cap=32768], inRecovery=null, outRecovery=null, closeSocket=true, outboundMessagesQueueSizeMetric=oaiiprocessors.metric.impl.LongAdderMetric@69a257d1, super=GridNioSessionImpl [locAddr=/10.244. 2.21:47100, rmtAddr=/10.240.0.5:44211,createTime=1610470564646, closeTime=0, bytesSent=18, bytesRcvd=0, bytesSent0=0, bytesRcvd0=0, sndSchedTime=1610470564646, lastSndTime=1610470564646, lastRcvTime=1610470564646, readsPaused=false, filterChain=FilterChain[parserfilters =oaiiutil.nio.GridDirectParser@f7f9f74,directMode=true],GridConnectionBytesVerifyFilter],accepted=true,markedForClose=false]]] java.io.IOException:连接由 sun.nio.ch.FileDispatcherImpl.read0 处的对等方重置(本机方法) 在 sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:39) 在 sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:223) 在 sun.nio.ch.IOUtil.read(IOUtil.java: 192) 在 sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:380) 在 org.apache.ignite.internal.util.nio.GridNioServer$DirectNioClientWorker.processRead(GridNioServer.java:1330) 在 org.apache.ignite .internal.util.nio.GridNioServer$AbstractNioClientWorker.processSelectedKeysOptimized(GridNioServer.java:2472) 在 org.apache.ignite.internal.util.nio.GridNioServer$AbstractNioClientWorker.bodyInternal(GridNioServer.java:2239) 在 org.apache.ignite。 internal.util.nio.GridNioServer$AbstractNioClientWorker.body(GridNioServer.java:1880) at org.apache.ignite.internal.util.worker.GridWorker.run(GridWorker.java:120) at java.lang.Thread.run( Thread.java:748) [16:56:11,688][SEVERE][tcp-disco-sock-reader-[]-#12734-#14234][TcpDiscoverySpi] 无法初始化连接(这可能是由于短时网络而发生的问题,如果不影响节点发现可以忽略) [sock=Socket[addr=/10.240.0.5,port=10858,localport=47500]] java.net.SocketTimeoutException: Read timed out at java.net.SocketInputStream.socketRead0 (本机方法)在 java.net。SocketInputStream.socketRead(SocketInputStream.java:116) 在 java.net.SocketInputStream.read(SocketInputStream.java:171) 在 java.net.SocketInputStream.read(SocketInputStream.java:141) 在 java.io.BufferedInputStream.fill(BufferedInputStream .java:246) 在 java.io.BufferedInputStream.read1(BufferedInputStream.java:286) 在 java.io.BufferedInputStream.read(BufferedInputStream.java:345) 在 org.apache.ignite.spi.discovery.tcp.ServerImpl$ org.apache.ignite.spi.IgniteSpiThread.run(IgniteSpiThread.java:58) 上的 SocketReader.body(ServerImpl.java:6757)org.apache.ignite.spi.discovery.tcp.ServerImpl$SocketReader.body(ServerImpl.java:6757) 在 org.apache.ignite.spi.IgniteSpiThread.run(IgniteSpiThread.爪哇:58)org.apache.ignite.spi.discovery.tcp.ServerImpl$SocketReader.body(ServerImpl.java:6757) 在 org.apache.ignite.spi.IgniteSpiThread.run(IgniteSpiThread.爪哇:58)

标签: cluster-computingignite

解决方案


看起来您的网络正在关闭非活动连接,因此“连接由对等方重置”。

Apache Ignite 不能影响连接重置,但它会通过重新建立连接来解决。


推荐阅读