BE节点持续高CPU和内存

Viewed 35

版本:3.0.4
f0a10bc1cc52cc611f59aab73e5342a.png
问题描述如上图所示

3个BE节点,其中一个的CPU和内存一直很高,在机器上执行top -H 也看不出来什么东西,有没有大佬有排查流程什么的吗,怎么解决

2 Answers

可以使用top -H -b -n 1 -p be进程号看到线程级别的cpu使用,可以大致判断是哪些线程的cpu比较高
也可以部署一个这个脚本试试https://selectdb.feishu.cn/docx/GbDldTOBYoSKDbxEuCncWup0nGf

日志如下,请教一下后续

2025-05-26 17:22:47
正在监控进程:doris_be (PID: 3872923), Shell PID: 2037268
CPU 使用率达到 98.4%,超过90%,开始计算线程的 CPU 使用率
635.3 Pipe_normal
282.5 doris_be
147 TaskWP_CLONE
58.8 CumuCompactionT
58.8 memory_maintena

2025-05-26 17:22:57
正在监控进程:doris_be (PID: 3872923), Shell PID: 2037268
CPU 使用率达到 99%,超过90%,开始计算线程的 CPU 使用率
647 Pipe_normal
317.8 doris_be
105.8 TaskWP_CLONE
35.3 BaseCompactionT
29.4 MemTableFlushTh
11.8 memory_maintena
11.8 TaskWP_PUBLISH_
5.9 brpc_heavy
5.9 brpc_light

2025-05-26 17:23:08
正在监控进程:doris_be (PID: 3872923), Shell PID: 2037268
CPU 使用率达到 99.5%,超过90%,开始计算线程的 CPU 使用率
641.4 Pipe_normal
200.3 doris_be
76.4 TaskWP_CLONE
64.8 brpc_heavy
59 brpc_light
58.8 memory_maintena
53.1 FragmentMgrAsyn
35.3 CumuCompactionT
29.5 TabletPublishTx
23.5 MemTableFlushTh
17.6 compaction_task
11.8 Scan_normal
5.9 PipeNoGSchePool
5.9 SegmentFileWrit
5.9 SpillIOThreadPo
5.9 TaskWP_PUBLISH_
5.9 update_wal_dir_