Create large-logs-dataset challenge #634

kkrik-es · 2024-08-02T07:25:37Z

-- Cloned from @salvatore-campagna 's #632

Introduce a new large-logs-dataset challenge to elastic/logs track which duplicates data indexed by restoring
a snapshot multiple times. The number of snapshot restore operations is controlled by the variable snapshot_restore_counts which by default has a value of 100.

This would result in indexing raw_data_volume_per_day bytes multiplied by snapshot_restore_counts.
As an example if raw_data_volume_per_day is 50 GB then the index will have about 5 TB of raw data.
Note that the index, anyway, will include duplicated data.

This is meant to be used just as a fast way to increase the amount of data in an index skipping the expensive data
generation and indexing process.

Resolves #631

Create large-logs-dataset challenge

b0b70f6

kkrik-es self-assigned this Aug 2, 2024

kkrik-es added the enhancement label Aug 2, 2024

kkrik-es added 5 commits August 2, 2024 11:04

fix file suffix

f6da467

skip component templates

fc4a452

fixes

35a6069

parallel snapshot restore

1135701

typo

59da096

kkrik-es closed this Oct 22, 2024

kkrik-es deleted the new-large-logs-dataset-challenge branch October 22, 2024 14:18

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Create large-logs-dataset challenge #634

Create large-logs-dataset challenge #634

kkrik-es commented Aug 2, 2024 •

edited

Loading

Create large-logs-dataset challenge #634

Create large-logs-dataset challenge #634

Conversation

kkrik-es commented Aug 2, 2024 • edited Loading

kkrik-es commented Aug 2, 2024 •

edited

Loading