Doris 4.0.2 分桶问题

Viewed 74

如果唯一类型的表数据量很少,但又频繁更新,频繁查询,且这样的表还不少,该如何分桶。
5个BE,存算分离。

我的考虑:

  1. 一个分桶,可能BE分配不均,导致查询和写入都在一个或两个BE上。
  2. 五个分桶,分配均匀,但频繁更新和查询可能会慢?毕竟一个表可能就几千或几万条数据,一个桶分下来就更少了。
2 Answers

按照数据量进行分桶,小表的话单个分桶就够了,一张表几千几万数据,不会有查询瓶颈的。

虽然每个表数据量很少,但是设计好分桶列,五个分桶应该也不至于比一个分桶慢吧,毕竟分桶裁剪等优化措施一样用得上?

一个分桶也可以试试,多副本会自动分散到多个BE,另外很多表应该也会自动分散到多个BE,看看整体上的均衡程度,关键还是看多个表之间的读写频率吧