Questions Tags Users Badges

前缀索引某场景下过滤失效

Asked Sep 3, 2024 Modified Sep 3, 2024

Viewed 119

2.1

版本：v2.1.5

有一张unique模型的表，使用sessionId作为unique key

查询模型：
select count(*) from table where sessionId in ('xxx','xxx'...)

问题：
当sessionId in的list中元素个数<=48个时，查询性能极高
而元素个数>48个时，前缀索引失效，表全扫

以下是当元素为48个和49个的profile对比
48个：

49个：

经验证，max_scan_key_num默认值为48，session变量 set max_scan_key_num = 49之后，即可恢复正常的性能；
但不能因为无法并行处理所有key range 就直接全扫，这个逻辑不合理

edited Sep 3, 2024

nokichen29

asked Sep 3, 2024

3 Answers

你可以先 set global max_scan_key_num=100（或者其他适应你的使用场景的值）临时解决你的问题。

当 scan key 数量超限的时候，目前 doris 会把多个 fixed key 合并成一个大的 key range 用来进行前缀索引过滤，同时保留之前的 scan key 用于进一步计算层的过滤。

目前来看 max_scan_key_num 默认值 48 可能不太合理，还有就是我们后续可能会优化这里的合并逻辑，选择合并成多个 key range 去做过滤。

edited Jan 1, 1970

zhiqiang51

answered Oct 14, 2024

问题状态：跟进中，有进展会更新回帖

edited Jan 1, 1970

黄海军@SelectDB5218

answered Sep 3, 2024

先用倒排索引来解决吧

edited Jan 1, 1970

____291

answered Sep 4, 2024

Related Questions

集群规划问题

多台BE节点异常宕机

doris2.0.7集群迁移到新搭建的doris2.1.11集群

2.1.11版本，新优化器，执行计划隐式类型转换丢失精度，导致数据不一致

doris配置ranger鉴权后，单表查询可以看到脱敏效果，但是关联查询后就失效了

doris 2.x 同步到哪个版本的doris 最稳定