[Yaroslavzev] Homework #140

Yaroslavzev · 2024-04-28T20:36:47Z

В этом PR выполненное задание к первой неделе курса по оптимизации.

В результате проделанной оптимизации наконец удалось обработать файл с данными в заданный бюджет 30 секунд.
Измеренный прирост производительности составил 33 раз для обработки файла в 10 000 строк

Заданный бюджет выполнения программы в 30 секунд был достигнут на M1

spajic · 2024-04-30T18:44:30Z

case-study-template.md


-Вот как я построил `feedback_loop`: *как вы построили feedback_loop*
+Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за _время, которое у вас получилось_


_it was a placeholder_

spajic · 2024-04-30T18:46:12Z

case-study-template.md

+
+- флейм граф показал, что Array#select занимает значительное время исполнения
+- Array#select происводит поиск по всему массиву сессий и это занимает много времени. Для ускорения поиска, я изменил структуру оранизации сессий и в реализации V1 сессии сгруппированы по user_id в хеш. Таким образом, используются оптимизированный механизмы поиска ruby и достигается прирост происховодительности
+- Скрость выполнения увеличина в 4 раза для 4000 строк


тут главное, что асимптотика стала качественно лучше и приблизилась к линейное

Потому что фетч из хэша это O(1), а select из массива это O(N)

spajic · 2024-04-30T18:47:29Z

case-study-template.md

- как изменился отчёт профилировщика - исправленная проблема перестала быть главной точкой роста?
+- флейм граф показал, что Array#+ занимает значительное время исполнения
+- На основе https://github.com/fastruby/fast-ruby?tab=readme-ov-file#arrayconcat-vs-array-code Array#+ можно заменить на Array#concat
+- Замена Array#+ на Array#concat дала прирост как минимум 10% на 4000 строк


4000 строк это маловато уже

хорошая идея взять какую-то часть входных данных, чтобы программа не выполнялась вечность, но хоршо подбирать объём данных так, чтобы программа успевала покрутиться пару секунд. Если она завершается слишком быстро (“не успевает поработать”) могут возникнуть какие-то перекосы (например, на полном объёме основная часть времени тратится в основном цикле, а если данных мало - то большая часть уходит на инициализацию и финализацию, например на чтение из файла и запись потом в файл)

И плюс когда время уже на миллисекунды - больше влияние погрешностей.

spajic · 2024-04-30T18:47:57Z

case-study-template.md

+
+### Ваша находка №3
+
+- флейм граф показал, что метод String#split и Date#parse занимает значительное время


всегда лучше по одному делать, иначе не понятно что из двух изменений как сыграло

spajic · 2024-04-30T18:48:45Z

gemfile

@@ -0,0 +1,16 @@
+source 'https://rubygems.org'
+
+ruby '3.2.2'


spajic · 2024-04-30T18:49:00Z

profilers/perfomance/benchmark.rb

+    confidence: 95
+  )
+
+  x.report('slow string concatenation') do


spajic · 2024-04-30T18:50:24Z

profilers/perfomance/perfomance.rb

+    end
+
+    it 'works faster' do
+      expect { WorkV5.work(file_name) }.to perform_faster_than { WorkV4.work(file_name) }.at_least(1.05).times


perform_faster_than - nice 👍

spajic · 2024-04-30T18:51:20Z

profilers/perfomance/perfomance.rb

+
+    it 'performs perform_power' do
+      expect { |_n, i| InitWork.work(file_names[i]) }.to perform_power.in_range(8, 32_768).ratio(8)
+      expect { |_n, i| WorkV5.work(file_names[i]) }.to perform_linear


spajic · 2024-04-30T18:52:33Z

report/parser.rb

+  file_lines.each do |line|
+    cols = line.split(',')
+    users += [parse_user(line)] if cols[0] == 'user'
+    sessions += [parse_session(line)] if cols[0] == 'session'


вроде же в case-study пришли к тому, что так плохо массив наполнять, надо <<

spajic · 2024-04-30T18:53:16Z

report/report.rb

+  uniqueBrowsers = []
+  sessions.each do |session|
+    browser = session['browser']
+    uniqueBrowsers += [browser] if uniqueBrowsers.all? { |b| b != browser }


use Set / SortedSet

spajic · 2024-04-30T18:58:19Z

report/v5/parser.rb

@@ -0,0 +1,67 @@
+# frozen_string_literal: true
+
+module V5


А, я понял вашу концепцию, что есть 5 версий кода. Возможно тогда какие-то комменты выше не актуальны, но я уже запутался

spajic

Возможно я что-то лишнее накомментил из-за пяти версий, в целом всё гуд 👍

Yaroslavzev and others added 12 commits April 25, 2024 22:08

Add gemfile

284129a

add profilers and compexity

36b5ac6

divide work codebase

1aa4b2d

rubocop

453ba8f

use hash instead of array

e328c73

add case study result

0880b61

Array#+ to Array#concat

ba84cb4

String#split to String#match and remove Date#parse

9117ba9

refactor session aggregation

0c3d54f

remove huge files

e520c49

minor improvements

a97bec2

revert linter

be1f2f6

spajic reviewed Apr 30, 2024

View reviewed changes

gemfile

@@ -0,0 +1,16 @@

source 'https://rubygems.org'

ruby '3.2.2'

Copy link

Collaborator

spajic Apr 30, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

👍

spajic reviewed Apr 30, 2024

View reviewed changes

profilers/perfomance/benchmark.rb

confidence: 95

)

x.report('slow string concatenation') do

Copy link

Collaborator

spajic Apr 30, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

wrong name

spajic reviewed Apr 30, 2024

View reviewed changes

spajic approved these changes Apr 30, 2024

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Yaroslavzev] Homework #140

[Yaroslavzev] Homework #140

Yaroslavzev commented Apr 28, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic Apr 30, 2024

spajic left a comment


		Вот как я построил `feedback_loop`: как вы построили feedback_loop
		Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за _время, которое у вас получилось_


		### Ваша находка №3

		- флейм граф показал, что метод String#split и Date#parse занимает значительное время

[Yaroslavzev] Homework #140

Are you sure you want to change the base?

[Yaroslavzev] Homework #140

Conversation

Yaroslavzev commented Apr 28, 2024

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

spajic left a comment

Choose a reason for hiding this comment