首页 > 解决方案 > 新节点加入或释放时点燃集群卡住

问题描述

我有 3 个节点集群和 20 多个客户端,它在 spark 上下文中运行。最初它工作正常,但每当新节点即客户端尝试与集群连接时随机出现问题。集群无法运行。当它卡住时我有以下日志。如果我明确地重新启动任何 Ignite 服务器,然后它的发布和工作正常。我使用的是 Ignite 2.4.0 版本。Ignite 2.5.0 版本中也产生了同样的问题。

客户端日志等待分区映射交换失败 [topVer=AffinityTopologyVersion [topVer=44, minorTopVer=0], node=4d885cfd-45ed-43a2-8088-f35c9469797f]。转储可能是原因的待处理对象:

        GridDhtPartitionsExchangeFuture [topVer=AffinityTopologyVersion [topVer=44, minorTopVer=0], evt=NODE_JOINED, evtNode=TcpDiscoveryNode [id=4d885cfd-45ed-43a2-8088-f35c9469797f, addrs=[0:0:0:0:0:0:0:1%lo, 10.13.10.179, 127.0.0.1], sockAddrs=[/0:0:0:0:0:0:0:1%lo:0, /127.0.0.1:0, hdn6.mstorm.com/10.13.10.179:0], discPort=0, order=44, intOrder=0, lastExchangeTime=1527651620413, loc=true, ver=2.4.0#20180305-sha1:aa342270, isClient=true], done=false]

未能等待分区映射交换 [topVer=AffinityTopologyVersion [topVer=44, minorTopVer=0], node=4d885cfd-45ed-43a2-8088-f35c9469797f]。转储可能是原因的待处理对象:

        GridDhtPartitionsExchangeFuture [topVer=AffinityTopologyVersion [topVer=44, minorTopVer=0], evt=NODE_JOINED, evtNode=TcpDiscoveryNode [id=4d885cfd-45ed-43a2-8088-f35c9469797f, addrs=[0:0:0:0:0:0:0:1%lo, 10.13.10.179, 127.0.0.1], sockAddrs=[/0:0:0:0:0:0:0:1%lo:0, /127.0.0.1:0, hdn6.mstorm.com/10.13.10.179:0], discPort=0, order=44, intOrder=0, lastExchangeTime=1527651620413, loc=true, ver=2.4.0#20180305-sha1:aa342270, isClient=true], done=false]

未能等待初始分区映射交换。可能的原因是: ^-- 事务处于死锁状态。^-- 长时间运行的事务(如果是这种情况,请忽略)。^-- 未释放的显式锁。

仍在等待初始分区映射交换 [fut=GridDhtPartitionsExchangeFuture [firstDiscoEvt=DiscoveryEvent [evtNode=TcpDiscoveryNode [id=4d885cfd-45ed-43a2-8088-f35c9469797f, addrs=

服务器端日志条带池中可能出现饥饿。线程名称:sys-stripe-0-#1 队列:[消息关闭 [msg=GridIoMessage [plc=2,topic=TOPIC_CACHE,topicOrd=8,ordered=false,timeout=0,skipOnTimeout=false,msg=GridDhtTxPrepareResponse [nearEvicted =null, futId=869dd4ca361-fe7e167d-4d80-4f57-b004-13359a9f2c11, miniId=1, super=GridDistributedTxPrepareResponse [txState=null, part=-1, err=null, super=GridDistributedBaseMessage [ver=GridCacheVersion [topVer=139084030, order=1527604094903,nodeOrder=1],committedVers=null,rollbackVers=null,cnt=0,super=GridCacheIdMessage [cacheId=0]]]]]],消息关闭[msg=GridIoMessage [plc=2,topic=TOPIC_CACHE, topicOrd=8,ordered=false,timeout=0,skipOnTimeout=false,msg=GridDhtAtomicSingleUpdateRequest [key=KeyCacheObjectImpl [part=984,val=null,hasValBytes=true],val=BinaryObjectImpl [arr=true,

标签: ignitein-memory-databasegridgain

解决方案


推荐阅读