Quick: Remove expensive prefix filter from Elasticsearch file queries #1503

jarosenb · 2024-12-16T15:59:43Z

Overview:

This might be related to recent cluster upgrades, but search in the Data Depot has gotten really slow due to the Elasticsearch query planner evaluating filters in the wrong order. The prefix query is being evaluated first, which causes Elasticsearch to iterate over the entire index instead of just the small subset of results from the query_string query.

This diff replaces the prefix filter with an equivalent term filter using our existing path_hierarchy tokens.

remove expensive prefix filter from Elasticsearch file queries

ef20ab1

rstijerina approved these changes Dec 16, 2024

View reviewed changes

jarosenb merged commit 8aa9fb4 into main Dec 16, 2024
5 checks passed

jarosenb deleted the quick/20241216-file-search-perf branch December 16, 2024 16:29

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Quick: Remove expensive prefix filter from Elasticsearch file queries #1503

Quick: Remove expensive prefix filter from Elasticsearch file queries #1503

jarosenb commented Dec 16, 2024

Quick: Remove expensive prefix filter from Elasticsearch file queries #1503

Quick: Remove expensive prefix filter from Elasticsearch file queries #1503

Conversation

jarosenb commented Dec 16, 2024

Overview: