Apache Doris 中文技术论坛
Questions Tags Users Badges

数据倾斜问题

Asked Jul 7, 2025 Modified Jan 1, 0001
Viewed 59
2.1 cluster

有一个宽表,双分区日期+车厂号,每个车厂数据量差异较大,如何合理的设置分桶,才能避免数据倾斜问题

edited Jan 1, 0001
xiaoxiaole1
asked Jul 7, 2025
1 Answers

双分区是怎么写的呢? Doris 中目前只支持 Range 或 List 分区。
如果没有可以将数据打散的列,可以走 random bucket。
其次,合理分桶数量:手动设置分桶数

edited Jan 1, 1970
阿渊@SelectDB (没回帖直接加我主页微信)9350
answered Jul 14, 2025
Related Questions
AUTO LIST PARTITION 分区名长度为何限制 50?能否配置放宽/取消?
我们通过hive catalog外表同步数据,有时候hive表会很大导致内存占满了会杀掉其他任务,限制内存又会导致同步任务失败,有什么方法可以稳定一下呢,同步效率慢一点什么的也没问题
1 answers
doris2.1.11重复建表报错内容异常,不会提示表已经存在
1 answers
doris be启动报错
2 answers
Doris的json解析问题
1 answers
使用docker-compose配置doris FE启动成功 但BE启动失败
1 answers

Terms of service Privacy policy

Powered by Answer - the open-source software that powers Q&A communities.
Made with love © 2026 Apache Doris 中文技术论坛.