doris_fe_image_write短时间上涨到77,并维持不动

Viewed 33

Doris版本:2.0.8 doris manager监控image_write不为1,持续报错,请问这是什么原因,如何才能进行修复。
eb52dd68a9df4ed414db1cc52990664.png

doris manager截图
62060b013608be3c1528a8e2c23a897.png
44e4c4e3f3400c43e489be93f2e1875.png

3 Answers

这里image_write 异常的问题,应该是这块,JVM内存使用超过70% 后不做checkpoint,所以没能生成image文件,这里可以看看JVM内存为什么会升高。

  1. 是否导入任务压力大
  2. 导入任务label 保留时间长
  3. 是否有开启profile

目前建议调整的方式:

  1. 如果profile开启的话需要全局关闭 set global enable_profile = false;

  2. 导入任务多的话,可能是label堆积,可以修改label的保留时间
    fe.conf
    label_keep_max_second = 14400;
    streaming_label_keep_max_second = 14400;

  3. 将FE JVM GC算法修改为G1(2.1+ 版本已经改为G1)

CMS算法修改为G1 算法

G1 JAVA OPTS

JAVA_OPTS="-Djavax.security.auth.useSubjectCredsOnly=false -Xss4m -Xmx8192m -XX:+UnlockExperimentalVMOptions -XX:+UseG1GC -XX:MaxGCPauseMillis=200 -XX:+PrintGCDateStamps -XX:+PrintGCDetails -Xloggc:$DORIS_HOME/log/fe.gc.log.$CUR_DATE -Dlog4j2.formatMsgNoLookups=true"

-Xmx改成一致的,注意下CUR_DATE这个环境变量,在老版本可能叫DATE
image.png

这个报错和这个指标没关系。是个waring日志,现在delete任务有问题吗?

image.png 是因为这个吗?目前没有看见error日志,没发现存在delete任务问题