diff --git a/_modules/mala/network/trainer.html b/_modules/mala/network/trainer.html
index 1356fe1c..4b2f5934 100644
--- a/_modules/mala/network/trainer.html
+++ b/_modules/mala/network/trainer.html
@@ -769,47 +769,207 @@ <h1>Source code for mala.network.trainer</h1><div class="highlight"><pre>
                         <span class="p">)</span>
                     <span class="n">loader_id</span> <span class="o">+=</span> <span class="mi">1</span>
             <span class="k">else</span><span class="p">:</span>
-                <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">no_grad</span><span class="p">():</span>
-                    <span class="k">for</span> <span class="n">snapshot_number</span> <span class="ow">in</span> <span class="n">trange</span><span class="p">(</span>
-                        <span class="n">offset_snapshots</span><span class="p">,</span>
-                        <span class="n">number_of_snapshots</span> <span class="o">+</span> <span class="n">offset_snapshots</span><span class="p">,</span>
-                        <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Validation&quot;</span><span class="p">,</span>
-                        <span class="n">disable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters_full</span><span class="o">.</span><span class="n">verbosity</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">,</span>
-                    <span class="p">):</span>
-                        <span class="c1"># Get optimal batch size and number of batches per snapshotss</span>
-                        <span class="n">grid_size</span> <span class="o">=</span> <span class="p">(</span>
-                            <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">snapshot_directories_list</span><span class="p">[</span>
-                                <span class="n">snapshot_number</span>
-                            <span class="p">]</span><span class="o">.</span><span class="n">grid_size</span>
-                        <span class="p">)</span>
+                <span class="c1"># If only the LDOS is in the validation metrics (as is the</span>
+                <span class="c1"># case for, e.g., distributed network trainings), we can</span>
+                <span class="c1"># use a faster (or at least better parallelizing) code</span>
 
-                        <span class="n">optimal_batch_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_correct_batch_size</span><span class="p">(</span>
-                            <span class="n">grid_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">mini_batch_size</span>
-                        <span class="p">)</span>
-                        <span class="n">number_of_batches_per_snapshot</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span>
-                            <span class="n">grid_size</span> <span class="o">/</span> <span class="n">optimal_batch_size</span>
+                <span class="k">if</span> <span class="p">(</span>
+                    <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">validation_metrics</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span>
+                    <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">validation_metrics</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;ldos&quot;</span>
+                <span class="p">):</span>
+
+                    <span class="n">errors</span><span class="p">[</span><span class="n">data_set_type</span><span class="p">][</span><span class="s2">&quot;ldos&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+                        <span class="bp">self</span><span class="o">.</span><span class="n">__calculate_validation_error_ldos_only</span><span class="p">(</span>
+                            <span class="n">data_loaders</span>
                         <span class="p">)</span>
+                    <span class="p">)</span>
 
-                        <span class="n">actual_outputs</span><span class="p">,</span> <span class="n">predicted_outputs</span> <span class="o">=</span> <span class="p">(</span>
-                            <span class="bp">self</span><span class="o">.</span><span class="n">_forward_entire_snapshot</span><span class="p">(</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">no_grad</span><span class="p">():</span>
+                        <span class="k">for</span> <span class="n">snapshot_number</span> <span class="ow">in</span> <span class="n">trange</span><span class="p">(</span>
+                            <span class="n">offset_snapshots</span><span class="p">,</span>
+                            <span class="n">number_of_snapshots</span> <span class="o">+</span> <span class="n">offset_snapshots</span><span class="p">,</span>
+                            <span class="n">desc</span><span class="o">=</span><span class="s2">&quot;Validation&quot;</span><span class="p">,</span>
+                            <span class="n">disable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters_full</span><span class="o">.</span><span class="n">verbosity</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">,</span>
+                        <span class="p">):</span>
+                            <span class="c1"># Get optimal batch size and number of batches per snapshotss</span>
+                            <span class="n">grid_size</span> <span class="o">=</span> <span class="p">(</span>
+                                <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">snapshot_directories_list</span><span class="p">[</span>
+                                    <span class="n">snapshot_number</span>
+                                <span class="p">]</span><span class="o">.</span><span class="n">grid_size</span>
+                            <span class="p">)</span>
+
+                            <span class="n">optimal_batch_size</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_correct_batch_size</span><span class="p">(</span>
+                                <span class="n">grid_size</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">mini_batch_size</span>
+                            <span class="p">)</span>
+                            <span class="n">number_of_batches_per_snapshot</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span>
+                                <span class="n">grid_size</span> <span class="o">/</span> <span class="n">optimal_batch_size</span>
+                            <span class="p">)</span>
+
+                            <span class="n">actual_outputs</span><span class="p">,</span> <span class="n">predicted_outputs</span> <span class="o">=</span> <span class="p">(</span>
+                                <span class="bp">self</span><span class="o">.</span><span class="n">_forward_entire_snapshot</span><span class="p">(</span>
+                                    <span class="n">snapshot_number</span><span class="p">,</span>
+                                    <span class="n">data_sets</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+                                    <span class="n">data_set_type</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="mi">2</span><span class="p">],</span>
+                                    <span class="n">number_of_batches_per_snapshot</span><span class="p">,</span>
+                                    <span class="n">optimal_batch_size</span><span class="p">,</span>
+                                <span class="p">)</span>
+                            <span class="p">)</span>
+                            <span class="n">calculated_errors</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_errors</span><span class="p">(</span>
+                                <span class="n">actual_outputs</span><span class="p">,</span>
+                                <span class="n">predicted_outputs</span><span class="p">,</span>
+                                <span class="n">metrics</span><span class="p">,</span>
                                 <span class="n">snapshot_number</span><span class="p">,</span>
-                                <span class="n">data_sets</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
-                                <span class="n">data_set_type</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="mi">2</span><span class="p">],</span>
-                                <span class="n">number_of_batches_per_snapshot</span><span class="p">,</span>
-                                <span class="n">optimal_batch_size</span><span class="p">,</span>
                             <span class="p">)</span>
+                            <span class="k">for</span> <span class="n">metric</span> <span class="ow">in</span> <span class="n">metrics</span><span class="p">:</span>
+                                <span class="n">errors</span><span class="p">[</span><span class="n">data_set_type</span><span class="p">][</span><span class="n">metric</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+                                    <span class="n">calculated_errors</span><span class="p">[</span><span class="n">metric</span><span class="p">]</span>
+                                <span class="p">)</span>
+        <span class="k">return</span> <span class="n">errors</span>
+
+    <span class="k">def</span> <span class="nf">__calculate_validation_error_ldos_only</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data_loaders</span><span class="p">):</span>
+        <span class="n">validation_loss_sum</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span>
+            <span class="mi">1</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">]</span>
+        <span class="p">)</span>
+        <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">no_grad</span><span class="p">():</span>
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;gpu&quot;</span><span class="p">]:</span>
+                <span class="n">report_freq</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">training_log_interval</span>
+                <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">synchronize</span><span class="p">(</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">]</span>
+                <span class="p">)</span>
+                <span class="n">tsample</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+                <span class="n">batchid</span> <span class="o">=</span> <span class="mi">0</span>
+                <span class="k">for</span> <span class="n">loader</span> <span class="ow">in</span> <span class="n">data_loaders</span><span class="p">:</span>
+                    <span class="k">for</span> <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="ow">in</span> <span class="n">loader</span><span class="p">:</span>
+                        <span class="n">x</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">to</span><span class="p">(</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">],</span>
+                            <span class="n">non_blocking</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
                         <span class="p">)</span>
-                        <span class="n">calculated_errors</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_errors</span><span class="p">(</span>
-                            <span class="n">actual_outputs</span><span class="p">,</span>
-                            <span class="n">predicted_outputs</span><span class="p">,</span>
-                            <span class="n">metrics</span><span class="p">,</span>
-                            <span class="n">snapshot_number</span><span class="p">,</span>
+                        <span class="n">y</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">to</span><span class="p">(</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">],</span>
+                            <span class="n">non_blocking</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
                         <span class="p">)</span>
-                        <span class="k">for</span> <span class="n">metric</span> <span class="ow">in</span> <span class="n">metrics</span><span class="p">:</span>
-                            <span class="n">errors</span><span class="p">[</span><span class="n">data_set_type</span><span class="p">][</span><span class="n">metric</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-                                <span class="n">calculated_errors</span><span class="p">[</span><span class="n">metric</span><span class="p">]</span>
+
+                        <span class="k">if</span> <span class="p">(</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">use_graphs</span>
+                            <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_validation_graph</span> <span class="ow">is</span> <span class="kc">None</span>
+                        <span class="p">):</span>
+                            <span class="n">printout</span><span class="p">(</span>
+                                <span class="s2">&quot;Capturing CUDA graph for validation.&quot;</span><span class="p">,</span>
+                                <span class="n">min_verbosity</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
                             <span class="p">)</span>
-        <span class="k">return</span> <span class="n">errors</span>
+                            <span class="n">s</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">Stream</span><span class="p">(</span>
+                                <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">]</span>
+                            <span class="p">)</span>
+                            <span class="n">s</span><span class="o">.</span><span class="n">wait_stream</span><span class="p">(</span>
+                                <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">current_stream</span><span class="p">(</span>
+                                    <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">]</span>
+                                <span class="p">)</span>
+                            <span class="p">)</span>
+                            <span class="c1"># Warmup for graphs</span>
+                            <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">stream</span><span class="p">(</span><span class="n">s</span><span class="p">):</span>
+                                <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">20</span><span class="p">):</span>
+                                    <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">amp</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span>
+                                        <span class="n">enabled</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">use_mixed_precision</span>
+                                    <span class="p">):</span>
+                                        <span class="n">prediction</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+                                        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters_full</span><span class="o">.</span><span class="n">use_ddp</span><span class="p">:</span>
+                                            <span class="n">loss</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                                <span class="n">prediction</span><span class="p">,</span> <span class="n">y</span>
+                                            <span class="p">)</span>
+                                        <span class="k">else</span><span class="p">:</span>
+                                            <span class="n">loss</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                                <span class="n">prediction</span><span class="p">,</span> <span class="n">y</span>
+                                            <span class="p">)</span>
+                            <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">current_stream</span><span class="p">(</span>
+                                <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">]</span>
+                            <span class="p">)</span><span class="o">.</span><span class="n">wait_stream</span><span class="p">(</span><span class="n">s</span><span class="p">)</span>
+
+                            <span class="c1"># Create static entry point tensors to graph</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">static_input_validation</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">empty_like</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">static_target_validation</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">empty_like</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
+
+                            <span class="c1"># Capture graph</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">_validation_graph</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">CUDAGraph</span><span class="p">()</span>
+                            <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">graph</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_validation_graph</span><span class="p">):</span>
+                                <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">amp</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span>
+                                    <span class="n">enabled</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">use_mixed_precision</span>
+                                <span class="p">):</span>
+                                    <span class="bp">self</span><span class="o">.</span><span class="n">static_prediction_validation</span> <span class="o">=</span> <span class="p">(</span>
+                                        <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="p">(</span>
+                                            <span class="bp">self</span><span class="o">.</span><span class="n">static_input_validation</span>
+                                        <span class="p">)</span>
+                                    <span class="p">)</span>
+                                    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters_full</span><span class="o">.</span><span class="n">use_ddp</span><span class="p">:</span>
+                                        <span class="bp">self</span><span class="o">.</span><span class="n">static_loss_validation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                            <span class="bp">self</span><span class="o">.</span><span class="n">static_prediction_validation</span><span class="p">,</span>
+                                            <span class="bp">self</span><span class="o">.</span><span class="n">static_target_validation</span><span class="p">,</span>
+                                        <span class="p">)</span>
+                                    <span class="k">else</span><span class="p">:</span>
+                                        <span class="bp">self</span><span class="o">.</span><span class="n">static_loss_validation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                            <span class="bp">self</span><span class="o">.</span><span class="n">static_prediction_validation</span><span class="p">,</span>
+                                            <span class="bp">self</span><span class="o">.</span><span class="n">static_target_validation</span><span class="p">,</span>
+                                        <span class="p">)</span>
+
+                        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_validation_graph</span><span class="p">:</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">static_input_validation</span><span class="o">.</span><span class="n">copy_</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">static_target_validation</span><span class="o">.</span><span class="n">copy_</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
+                            <span class="bp">self</span><span class="o">.</span><span class="n">_validation_graph</span><span class="o">.</span><span class="n">replay</span><span class="p">()</span>
+                            <span class="n">validation_loss_sum</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">static_loss_validation</span>
+                        <span class="k">else</span><span class="p">:</span>
+                            <span class="k">with</span> <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">amp</span><span class="o">.</span><span class="n">autocast</span><span class="p">(</span>
+                                <span class="n">enabled</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">use_mixed_precision</span>
+                            <span class="p">):</span>
+                                <span class="n">prediction</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+                                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters_full</span><span class="o">.</span><span class="n">use_ddp</span><span class="p">:</span>
+                                    <span class="n">loss</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                        <span class="n">prediction</span><span class="p">,</span> <span class="n">y</span>
+                                    <span class="p">)</span>
+                                <span class="k">else</span><span class="p">:</span>
+                                    <span class="n">loss</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                        <span class="n">prediction</span><span class="p">,</span> <span class="n">y</span>
+                                    <span class="p">)</span>
+                                <span class="n">validation_loss_sum</span> <span class="o">+=</span> <span class="n">loss</span>
+                        <span class="k">if</span> <span class="n">batchid</span> <span class="o">!=</span> <span class="mi">0</span> <span class="ow">and</span> <span class="p">(</span><span class="n">batchid</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span> <span class="o">%</span> <span class="n">report_freq</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+                            <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">synchronize</span><span class="p">(</span>
+                                <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">]</span>
+                            <span class="p">)</span>
+                            <span class="n">sample_time</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">tsample</span>
+                            <span class="n">avg_sample_time</span> <span class="o">=</span> <span class="n">sample_time</span> <span class="o">/</span> <span class="n">report_freq</span>
+                            <span class="n">avg_sample_tput</span> <span class="o">=</span> <span class="p">(</span>
+                                <span class="n">report_freq</span> <span class="o">*</span> <span class="n">x</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">/</span> <span class="n">sample_time</span>
+                            <span class="p">)</span>
+                            <span class="n">printout</span><span class="p">(</span>
+                                <span class="sa">f</span><span class="s2">&quot;batch </span><span class="si">{</span><span class="n">batchid</span><span class="w"> </span><span class="o">+</span><span class="w"> </span><span class="mi">1</span><span class="si">}</span><span class="s2">, &quot;</span>  <span class="c1"># /{total_samples}, &quot;</span>
+                                <span class="sa">f</span><span class="s2">&quot;validation avg time: </span><span class="si">{</span><span class="n">avg_sample_time</span><span class="si">}</span><span class="s2"> &quot;</span>
+                                <span class="sa">f</span><span class="s2">&quot;validation avg throughput: </span><span class="si">{</span><span class="n">avg_sample_tput</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+                                <span class="n">min_verbosity</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
+                            <span class="p">)</span>
+                            <span class="n">tsample</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+                        <span class="n">batchid</span> <span class="o">+=</span> <span class="mi">1</span>
+                <span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">synchronize</span><span class="p">(</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">]</span>
+                <span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">batchid</span> <span class="o">=</span> <span class="mi">0</span>
+                <span class="k">for</span> <span class="n">loader</span> <span class="ow">in</span> <span class="n">data_loaders</span><span class="p">:</span>
+                    <span class="k">for</span> <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="ow">in</span> <span class="n">loader</span><span class="p">:</span>
+                        <span class="n">x</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">])</span>
+                        <span class="n">y</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="o">.</span><span class="n">_configuration</span><span class="p">[</span><span class="s2">&quot;device&quot;</span><span class="p">])</span>
+                        <span class="n">prediction</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+                        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters_full</span><span class="o">.</span><span class="n">use_ddp</span><span class="p">:</span>
+                            <span class="n">validation_loss_sum</span> <span class="o">+=</span> <span class="p">(</span>
+                                <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                    <span class="n">prediction</span><span class="p">,</span> <span class="n">y</span>
+                                <span class="p">)</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
+                            <span class="p">)</span>
+                        <span class="k">else</span><span class="p">:</span>
+                            <span class="n">validation_loss_sum</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">network</span><span class="o">.</span><span class="n">calculate_loss</span><span class="p">(</span>
+                                <span class="n">prediction</span><span class="p">,</span> <span class="n">y</span>
+                            <span class="p">)</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
+                        <span class="n">batchid</span> <span class="o">+=</span> <span class="mi">1</span>
+
+        <span class="k">return</span> <span class="n">validation_loss_sum</span><span class="o">.</span><span class="n">item</span><span class="p">()</span> <span class="o">/</span> <span class="n">batchid</span>
 
     <span class="k">def</span> <span class="nf">__prepare_to_train</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">optimizer_dict</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Prepare everything for training.&quot;&quot;&quot;</span>
diff --git a/objects.inv b/objects.inv
index 29dd60c1..be43d64c 100644
Binary files a/objects.inv and b/objects.inv differ