Mycat心跳机制梳理 |
您所在的位置:网站首页 › mycat心跳检测 › Mycat心跳机制梳理 |
if (c == null) { it.remove(); continue; } // SQL执行超时的连接关闭 if (c.isBorrowed() && c.getLastTime() < TimeUtil.currentTimeMillis() - sqlTimeout) { LOGGER.warn("found backend connection SQL timeout ,close it " + c); c.close(“sql timeout”); } // 清理已关闭连接,否则空闲检查。 if (c.isClosed()) { it.remove(); } else { // very important ,for some data maybe not sent if (c instanceof AbstractConnection) { checkConSendQueue((AbstractConnection) c); } c.idleCheck(); } } } 2)DataHost中空闲连接心跳检测 检测频率:dataNodeIdleCheckPeriod,默认值:5分钟,见io.mycat.MycatServer 关键代码: for (PhysicalDBPool node : nodes.values()) { node.heartbeatCheck(heartPeriod); } PhysicalDatasource.heatBeatCheck 上述代码主要就是遍历ConQueue(Mycat后端连接池存放的地方),选出需要进行心跳的连接,然后执行conHeartBeatHandler.doHeartBeat。 重点关注一下检测checkIfNeedHertBeat方法: private void checkIfNeedHeartBeat( LinkedList heartBeatCons, ConQueue queue, ConcurrentLinkedQueue checkLis, long hearBeatTime, long hearBeatTime2) { int maxConsInOneCheck = 10; Iterator checkListItor = checkLis.iterator(); while (checkListItor.hasNext()) { BackendConnection con = checkListItor.next(); // @1 if (con.isClosedOrQuit()) { checkListItor.remove(); continue; } if (validSchema(con.getSchema())) { if (con.getLastTime() < hearBeatTime && heartBeatCons.size() < maxConsInOneCheck) { checkListItor.remove(); // @2 // Heart beat check con.setBorrowed(true); heartBeatCons.add(con); // @3 } } else if (con.getLastTime() < hearBeatTime2) { // not valid schema conntion should close for idle // exceed 2*conHeartBeatPeriod checkListItor.remove(); con.close(" heart beate idle "); } } } 上面的逻辑是,获取ConQueue中的所有连接(ConcurrentLinkedQueue),然后获取一个遍历器, 进行遍历,然后判断该连接是否需要加入到心跳检测中,如果符合,就先移除,然后加入到待检测列表中。 上述这个步骤,乍一看没什么问题,但如果你与获取连接一起考虑,就会发现问题,我们知道,获取连接,也是从ConQueue的(ConcurrentLinkedQueue中poll一个,这样就会产生这样一个问题,对于一个连接c,有可能放入到检测列表中,并同时分配给其他线程,造成一个连接,在同一时间,会又做心跳检测,又执行其他SQL,造成结果混乱。 分析上述代码出现场景: t1 线程运行到代码@1,t2线程获取数据库连接,使用poll()方法,获取一个连接,有可能就是获取的这个连接正好与t1代码@1的连接一样, 然后t1运行到代码@2,将移除,但并不会返回成功与否,然后运行代码@3,将连接放入到待检测列表中,此时一个连接,同时被多个线程使用,并且,最后一个使用,会改变连接的响应处理器,造成第二个线程的响应处理器会获得第一个线程的响应结果。 3)检测频率:dataNodeHeartbeatPeriod,默认值10s,见io.mycat.MycatServer 【验证数据节点是否正常】,也就是readhost,writerhost的存活状态检测。 关键代码:MySQLDetector 上述代码引起了我一个疑问,为什么heartbeat方法没调用一次,就要新建一个SQLJob对象,为什么嗯? 我们先重点看一下看一下该方法的调用链: 一个PhysicalDatasource对应一个readerhost或writerhost。 跟踪代码发现,PhysicalDatasource拥有一个(private DBHeartbeat heartbeat),一个MySQLHeartbeat拥有一个MySQLDetector, 那为什么执行MySQLDetector时,确需要将SQLJob声明为volatile,并没次调用都新建一个对象,估计是因为每次心跳检查都需要一个独立的 OneRawSQLQueryResultHandler resultHandler = new OneRawSQLQueryResultHandler( fetchColms, this);故这里每次都新建了SQLJob。 此处,应该有一个可优化 的点:由于心跳连接运行比较频繁,默认10s一次,故此处连接的重用性问题值得思考。 上述BUG,是由我公司生产环境下跑出的,因为项目组反映,一条查询连接,竟然返回了心跳检测的响应结果: 附上本次代码修改后的代码: PhysicalDatasource.checkIfNeedHeartBeat private void checkIfNeedHeartBeat( LinkedList heartBeatCons, ConQueue queue, ConcurrentLinkedQueue checkLis, long hearBeatTime, long hearBeatTime2) { int maxConsInOneCheck = 10; Iterator checkListItor = checkLis.iterator(); while (checkListItor.hasNext()) { BackendConnection con = checkListItor.next(); if (con.isClosedOrQuit()) { checkListItor.remove(); continue; } if (validSchema(con.getSchema())) { if (con.getLastTime() < hearBeatTime && heartBeatCons.size() < maxConsInOneCheck) { 自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。 深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前! 因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。 既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化! 由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新 如果你觉得这些内容对你有帮助,可以添加V获取:vip1024b (备注Java) 一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长! 5k-1712861784096)] 最后[外链图片转存中…(img-gikGmO8t-1712861784098)] [外链图片转存中…(img-iaUIVUBJ-1712861784098)] [外链图片转存中…(img-BIpza2XG-1712861784099)] 一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长! [外链图片转存中…(img-Ux1cKazb-1712861784100)] |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |