Optimize doc level monitor performance: Batch docs for percolate query searches based on available memory and cpu #1353

eirsep · 2023-12-22T23:36:18Z

Is your feature request related to a problem?
Doc level monitor execution does the following 2 memory, cpu sensitive operations in search path :

Fetch docs source for docs (> last read sequence number) for every shard per index
Accumulate docs source list per index and perform percolate queries this causes heap usage exceeded exception when docs in memory are too high

What solution would you like?
Collect docs from shards up until a threshold which factors heap usage and available memory. Perform percolate query. If more shards remain to be queried repeat the above process until all shards are queried in current execution of doc level monitor
TODO - factor in cpu usage also
What alternatives have you considered?
Perform percolate query per shard - caused CPU regression due to too many requests
Perform percolate query for all docs across all shards, indices being - aggravates heap usage exceed issue as more docs are queried
(Current) Perform percolate query per concrete index - still not determinisitc. may make too many percolate queries (if very few docs in memory from one index) or too less (if too many docs from one index in memory)

eirsep · 2023-12-22T23:47:52Z

#1331

eirsep added untriaged performance Make it fast! labels Dec 22, 2023

eirsep mentioned this issue Dec 22, 2023

[BUG] Handling heap usage exceed error opensearch-project/security-analytics#711

Closed

eirsep removed the untriaged label Dec 22, 2023

eirsep changed the title ~~Optimize doc level monitor performance: Batch docs for percolate query searches based on available memory~~ Optimize doc level monitor performance: Batch docs for percolate query searches based on available memory and cpu Dec 22, 2023

eirsep mentioned this issue Jan 2, 2024

Percolate query optimization: Fetch fields mentioned in queries instead of entire doc and batch percolate query by heap-based threshold #1331

Draft

1 task

eirsep mentioned this issue Feb 19, 2024

Add jvm aware setting and max num docs settings for batching docs for percolate queries #1435

Merged

eirsep closed this as completed Apr 5, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Optimize doc level monitor performance: Batch docs for percolate query searches based on available memory and cpu #1353

Optimize doc level monitor performance: Batch docs for percolate query searches based on available memory and cpu #1353

eirsep commented Dec 22, 2023 •

edited

Loading

eirsep commented Dec 22, 2023

Optimize doc level monitor performance: Batch docs for percolate query searches based on available memory and cpu #1353

Optimize doc level monitor performance: Batch docs for percolate query searches based on available memory and cpu #1353

Comments

eirsep commented Dec 22, 2023 • edited Loading

eirsep commented Dec 22, 2023

eirsep commented Dec 22, 2023 •

edited

Loading