Doris2.1.6倒排索引过滤查询不符合预期

Viewed 45

对某个字段创建倒排索引,USING INVERTED PROPERTIES("support_phrase" = "true", "parser" = "unicode", "lower_case" = "true")

查询不符合预期: 条件 responsebody MATCH_PHRASE 'A区'
预期结果: 检索包含'A区'关键字的数据:
实际结果是: 包含'A区' 或 包含 ‘区’的数据

总结后发现:
中英文混合时候,过滤条件中以 a、an、and、is、the、be等英文中关键字开头的时候,查询时会将这些字符串忽略,仅以后面的中文为关键字检索。

1 Answers

分词时候忽略掉开头英文这个,这里是这样的:a/A会被当成stop word,类似英语里面的a word这种,被cut了,可以在创建倒排时候设置properties "stopwords" = "none",这样就默认没有stop words了。