Mycat心跳机制梳理

您所在的位置:网站首页 mycat心跳检测 Mycat心跳机制梳理

Mycat心跳机制梳理

2024-07-16 08:10| 来源: 网络整理| 查看: 265

if (c == null) {

it.remove();

continue;

}

// SQL执行超时的连接关闭

if (c.isBorrowed() && c.getLastTime() < TimeUtil.currentTimeMillis() - sqlTimeout) {

LOGGER.warn("found backend connection SQL timeout ,close it " + c);

c.close(“sql timeout”);

}

// 清理已关闭连接,否则空闲检查。

if (c.isClosed()) {

it.remove();

} else {

// very important ,for some data maybe not sent

if (c instanceof AbstractConnection) {

checkConSendQueue((AbstractConnection) c);

}

c.idleCheck();

}

}

}

2)DataHost中空闲连接心跳检测

检测频率:dataNodeIdleCheckPeriod,默认值:5分钟,见io.mycat.MycatServer

关键代码:

for (PhysicalDBPool node : nodes.values()) {

node.heartbeatCheck(heartPeriod);

}

PhysicalDatasource.heatBeatCheck

上述代码主要就是遍历ConQueue(Mycat后端连接池存放的地方),选出需要进行心跳的连接,然后执行conHeartBeatHandler.doHeartBeat。

重点关注一下检测checkIfNeedHertBeat方法:

private void checkIfNeedHeartBeat(

LinkedList heartBeatCons, ConQueue queue,

ConcurrentLinkedQueue checkLis,

long hearBeatTime, long hearBeatTime2) {

int maxConsInOneCheck = 10;

Iterator checkListItor = checkLis.iterator();

while (checkListItor.hasNext()) {

BackendConnection con = checkListItor.next(); // @1

if (con.isClosedOrQuit()) {

checkListItor.remove();

continue;

}

if (validSchema(con.getSchema())) {

if (con.getLastTime() < hearBeatTime

&& heartBeatCons.size() < maxConsInOneCheck) {

checkListItor.remove(); // @2

// Heart beat check

con.setBorrowed(true);

heartBeatCons.add(con); // @3

}

} else if (con.getLastTime() < hearBeatTime2) {

// not valid schema conntion should close for idle

// exceed 2*conHeartBeatPeriod

checkListItor.remove();

con.close(" heart beate idle ");

}

}

}

上面的逻辑是,获取ConQueue中的所有连接(ConcurrentLinkedQueue),然后获取一个遍历器,

进行遍历,然后判断该连接是否需要加入到心跳检测中,如果符合,就先移除,然后加入到待检测列表中。

上述这个步骤,乍一看没什么问题,但如果你与获取连接一起考虑,就会发现问题,我们知道,获取连接,也是从ConQueue的(ConcurrentLinkedQueue中poll一个,这样就会产生这样一个问题,对于一个连接c,有可能放入到检测列表中,并同时分配给其他线程,造成一个连接,在同一时间,会又做心跳检测,又执行其他SQL,造成结果混乱。

分析上述代码出现场景:

t1 线程运行到代码@1,t2线程获取数据库连接,使用poll()方法,获取一个连接,有可能就是获取的这个连接正好与t1代码@1的连接一样,

然后t1运行到代码@2,将移除,但并不会返回成功与否,然后运行代码@3,将连接放入到待检测列表中,此时一个连接,同时被多个线程使用,并且,最后一个使用,会改变连接的响应处理器,造成第二个线程的响应处理器会获得第一个线程的响应结果。

3)检测频率:dataNodeHeartbeatPeriod,默认值10s,见io.mycat.MycatServer 【验证数据节点是否正常】,也就是readhost,writerhost的存活状态检测。

关键代码:MySQLDetector

上述代码引起了我一个疑问,为什么heartbeat方法没调用一次,就要新建一个SQLJob对象,为什么嗯?

我们先重点看一下看一下该方法的调用链:

一个PhysicalDatasource对应一个readerhost或writerhost。

跟踪代码发现,PhysicalDatasource拥有一个(private DBHeartbeat heartbeat),一个MySQLHeartbeat拥有一个MySQLDetector,

那为什么执行MySQLDetector时,确需要将SQLJob声明为volatile,并没次调用都新建一个对象,估计是因为每次心跳检查都需要一个独立的

OneRawSQLQueryResultHandler resultHandler = new OneRawSQLQueryResultHandler( fetchColms, this);故这里每次都新建了SQLJob。

此处,应该有一个可优化 的点:由于心跳连接运行比较频繁,默认10s一次,故此处连接的重用性问题值得思考。

上述BUG,是由我公司生产环境下跑出的,因为项目组反映,一条查询连接,竟然返回了心跳检测的响应结果:

附上本次代码修改后的代码:

PhysicalDatasource.checkIfNeedHeartBeat

private void checkIfNeedHeartBeat(

LinkedList heartBeatCons, ConQueue queue,

ConcurrentLinkedQueue checkLis,

long hearBeatTime, long hearBeatTime2) {

int maxConsInOneCheck = 10;

Iterator checkListItor = checkLis.iterator();

while (checkListItor.hasNext()) {

BackendConnection con = checkListItor.next();

if (con.isClosedOrQuit()) {

checkListItor.remove();

continue;

}

if (validSchema(con.getSchema())) {

if (con.getLastTime() < hearBeatTime

&& heartBeatCons.size() < maxConsInOneCheck) {

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。 img img img img img img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip1024b (备注Java) img

最后

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长! img

5k-1712861784096)]

最后

[外链图片转存中…(img-gikGmO8t-1712861784098)]

[外链图片转存中…(img-iaUIVUBJ-1712861784098)]

[外链图片转存中…(img-BIpza2XG-1712861784099)]

一个人可以走的很快,但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎扫码加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长! [外链图片转存中…(img-Ux1cKazb-1712861784100)]



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3