FE 不稳定影响正常查询

Viewed 56

遇到两次,有两个 非 master FE 突然有大量查询 ERROR(doris_fe_query_err 指标)。
排查发现这两个 FE 有元数据落后 master 的异常。
e2614c4b52e0f6a211afd3426d96e1c3.png
还有大量 missed_versions is empty 的报错:
image.png
master FE 还有剔除过于落后 FE 的情况
在这些报错之前,发现了获取不到某张表的锁异常:
36bce5dd69f70dad11b7790f14833139.png
巧合的是,我们有一个查询,涉及的表,正好是获取不到锁的表,查询时间也和故障时间吻合。此查询也有报错
[E-217]The depth of the expression tree is too big, make it less than 600

此问题影响了其他 大量正常 sql,不知道这是不是bug

2 Answers

你可以修改下这个be的参数,默认是600, max_depth_of_expr_tree。
不过不这里的查询报错可以发一下都是哪些?

发生 [E-217]The depth of the expression tree is too big, make it less than 600 报错的 sql,执行状态是 ERR,这个倒是符合预期,毕竟超限了。但怀疑此 sql引发 FE 不稳定(包括元数据落后 master 太多被剔除),影响其他正常 sql。 其他 sql 报错:
image.png
image.png