实际工作中,有时会遇到一种场景,Doris开启了2阶段提交,任务出现失败,但是没有及时感知到,导致事务超时被清理了,可以看到重试的错误日志是事务没有被发现,后续也不能通过checkpoint来重启了。比如我的checkpoint是十分钟一次,我要如何判断我最近这次的事务是否是正常提交后程序失败,还是ckp成功了但是在提交事务时失败了,最后都会导致事务没有被发现的错误。需要根据不同的失败来决定指定重启时的timestamp
实际工作中,有时会遇到一种场景,Doris开启了2阶段提交,任务出现失败,但是没有及时感知到,导致事务超时被清理了,可以看到重试的错误日志是事务没有被发现,后续也不能通过checkpoint来重启了。比如我的checkpoint是十分钟一次,我要如何判断我最近这次的事务是否是正常提交后程序失败,还是ckp成功了但是在提交事务时失败了,最后都会导致事务没有被发现的错误。需要根据不同的失败来决定指定重启时的timestamp