Doris的2阶段提交有时报commit transaction failed原因排查和重启方式

Viewed 7

Doris版本2.1.9
现在flinksql往Doris写入数据,稳定运行的任务,过几天就会报一下事务提交失败。Caused by: org.apache.doris.flink.exception.DorisRuntimeException: commit transaction failed {
"status": "ANALYSIS_ERROR",
"msg": "TStatus: errCode = 2, detailMessage = transaction [121366051] not found"
}
1.一般遇到这种错误如何排查原因呢?现在出现了好几次,但是一直没找到原因
2.当从最近的一次checkpoint重启时,还是一直会报commit transaction failed,一把遇到这种场景,比较好的重启任务的方式是啥呢?

1 Answers

这个问题出现的原因是找不到FE中的事物ID了,可能是过期了,也有可能是FE 当时出现切主了。
可以按照这个FQA中提到的参数调整一下 label 的过期时间。同时看看FE当时的状态。
image.png