Apache Doris 中文技术论坛
Questions Tags Users Badges

数据倾斜问题

Asked Jul 7 Modified Jan 1, 0001
Viewed 54
2.1 cluster

有一个宽表,双分区日期+车厂号,每个车厂数据量差异较大,如何合理的设置分桶,才能避免数据倾斜问题

edited Jan 1, 0001
xiaoxiaole1
asked Jul 7
1 Answers

双分区是怎么写的呢? Doris 中目前只支持 Range 或 List 分区。
如果没有可以将数据打散的列,可以走 random bucket。
其次,合理分桶数量:手动设置分桶数

edited Jan 1, 1970
阿渊@SelectDB8245
answered Jul 14
Related Questions
频繁使用 StreamLoader 接口导入大批量数据(几十亿至一百亿)出现性能明显下降,有无较好的实践?
1 answers
doris be崩溃 版本v2.1.7
1 answers
服务器异常关机导致表副本损坏,提示version_error
1 answers
通过Spark Doris Connector的方式访问Doris表,提示报错fragment_executor execute failed
2 answers
Routine Load kafka 连接数
1 answers
Fe-master内存利用率不断升高
1 answers

Terms of service Privacy policy

Powered by Answer - the open-source software that powers Q&A communities.
Made with love © 2025 Apache Doris 中文技术论坛.