doris运行报错the report queue size exceeds the limit: 100 current: 101

Viewed 42

背景:doris版本3.0.4,服务器类型x86、arm
doris集群每运行大约1个月左右,就会出现建表超时,无法操作数据的情况。查看fe.warn.log日志可以看到the report queue size exceeds the limit: 100 current: 101的错误。在fe.conf添加report_queue_size = 200配置参数也没有效果,运行一段时间后依然报错。且无论doris运行在x86还是arm服务器上都存在该问题

1 Answers

确定几个点:

  1. FE是什么磁盘?
  2. 查看监控看bdbje write的写入延迟怎么样,在fe.log 中搜 logInsertTransactionState,可以看到write bdb的延时
  3. 是否有频繁的一些大的 insert into values 语句,如果FE磁盘是HDD的话可能会导致editlog 写的太慢出现问题。

建议版本拉齐到 3.0.8 ,之前也有一些锁的问题会导致出现这个问题