数据倾斜问题

Viewed 47

有一个宽表,双分区日期+车厂号,每个车厂数据量差异较大,如何合理的设置分桶,才能避免数据倾斜问题

1 Answers

双分区是怎么写的呢? Doris 中目前只支持 Range 或 List 分区。
如果没有可以将数据打散的列,可以走 random bucket。
其次,合理分桶数量:手动设置分桶数