diff --git a/overview/index.html b/overview/index.html
index d9c70f2..dcc0d94 100644
--- a/overview/index.html
+++ b/overview/index.html
@@ -331,6 +331,13 @@
     CP2K
   </a>
   
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#nwchem" class="md-nav__link">
+    NWChem
+  </a>
+  
 </li>
         
       </ul>
@@ -343,6 +350,33 @@
     Learning algorithms
   </a>
   
+    <nav class="md-nav" aria-label="Learning algorithms">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#sequential-learning" class="md-nav__link">
+    Sequential Learning
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#incremental-learning" class="md-nav__link">
+    Incremental Learning
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#committee-learning" class="md-nav__link">
+    Committee Learning
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
 </li>
       
     </ul>
@@ -715,7 +749,7 @@ <h2 id="molecular-simulation">Molecular simulation</h2>
 $$
 For example, for a system of 100 atoms in equilibrium at 300 K, we obtain a threshold temperature of 
 about 360 K for p = 10<sup>-2</sup>, and about 400 K for p = 10<sup>-4</sup>. 
-If the final simulation temperature exceeds the threshold at the last step of the MD simulation
+If the temperature at the last step of the MD simulation exceeds this threshold
 (or model evaluation yielded <code>NaN</code> or <code>ValueError</code> at any point throughout the propagation),
 the walker will reset its internal state to the starting configuration
 in order to make sure that subsequent propagations again start from a physically
@@ -748,20 +782,18 @@ <h2 id="molecular-simulation">Molecular simulation</h2>
 ; this is an efficient optimization algorithm which typically requires less steps than either conventional L-BFGS
 or first-order methods such as conjugate gradient (CG).
 Note that geometry optimizations in psiflow will generally
-not be able to reduce the total residual force on the system beyond about 0.01 eV/A
+not be able to reduce the residual forces in the system below about 0.01 eV/A
 because of the relatively limited precision (<code>float32</code>) of model evaluation.</p>
 <h2 id="bias-potentials-and-enhanced-sampling">Bias potentials and enhanced sampling</h2>
 <p>In the vast majority of molecular dynamics simulations of realistic systems,
 it is beneficial to modify the equilibrium Boltzmann distribution with bias potentials
 or advanced sampling schemes as to increase the sampling efficiency and reduce
 redundancy within the trajectory.
-The <a href="https://plumed.org">PLUMED</a> library provides the user with various choices of enhanced sampling
-techniques; the user specifies the input parameters in a PLUMED input file
-and passes it into a molecular dynamics engine (e.g. OpenMM, GROMACS, or LAMMPS).
-Similarly, in psiflow, the contents of the PLUMED input file can be directly
-converted into a <code>PlumedBias</code> instance in order to apply PLUMED's enhanced
-sampling magic to dynamic simulations or evaluate collective variables (and
-bias energy) across a dataset of atomic configurations.</p>
+In psiflow, this is achieved by interfacing the dynamic walkers
+with the <a href="https://plumed.org">PLUMED</a> library, which provides the user with various choices of enhanced sampling
+techniques.
+This allows users to apply bias potentials along specific collective variables or evaluate the bias energy
+across a dataset of atomic configurations.</p>
 <p>In the following example, we define the PLUMED input as a multi-line string in
 Python. We consider the particular case of applying a metadynamics bias to
 a collective variable - in this case the unit cell volume.
@@ -783,8 +815,8 @@ <h2 id="bias-potentials-and-enhanced-sampling">Bias potentials and enhanced samp
 <a id="__codelineno-10-8" name="__codelineno-10-8" href="#__codelineno-10-8"></a><span class="s2">&quot;&quot;&quot;</span>
 <a id="__codelineno-10-9" name="__codelineno-10-9" href="#__codelineno-10-9"></a><span class="n">bias</span> <span class="o">=</span> <span class="n">PlumedBias</span><span class="p">(</span><span class="n">plumed_input</span><span class="p">)</span>        <span class="c1"># a new hills file is generated</span>
 <a id="__codelineno-10-10" name="__codelineno-10-10" href="#__codelineno-10-10"></a>
-<a id="__codelineno-10-11" name="__codelineno-10-11" href="#__codelineno-10-11"></a><span class="n">walker</span> <span class="o">=</span> <span class="n">BiasedDynamicWalker</span><span class="p">(</span><span class="n">data_train</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">bias</span><span class="o">=</span><span class="n">bias</span><span class="p">,</span> <span class="n">timestep</span><span class="o">=</span><span class="mf">0.5</span><span class="p">)</span>    <span class="c1"># initialize dynamic walker with bias</span>
-<a id="__codelineno-10-12" name="__codelineno-10-12" href="#__codelineno-10-12"></a><span class="n">state</span>  <span class="o">=</span> <span class="n">walker</span><span class="o">.</span><span class="n">propagate</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>                                        <span class="c1"># performs biased MD</span>
+<a id="__codelineno-10-11" name="__codelineno-10-11" href="#__codelineno-10-11"></a><span class="n">walker</span>   <span class="o">=</span> <span class="n">BiasedDynamicWalker</span><span class="p">(</span><span class="n">data_train</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">bias</span><span class="o">=</span><span class="n">bias</span><span class="p">,</span> <span class="n">timestep</span><span class="o">=</span><span class="mf">0.5</span><span class="p">)</span>  <span class="c1"># initialize dynamic walker with bias</span>
+<a id="__codelineno-10-12" name="__codelineno-10-12" href="#__codelineno-10-12"></a><span class="n">metadata</span> <span class="o">=</span> <span class="n">walker</span><span class="o">.</span><span class="n">propagate</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>                                      <span class="c1"># performs biased MD</span>
 </code></pre></div>
 Note that the bias instance will retain the hills that were generated during walker
 propagation.
@@ -792,7 +824,7 @@ <h2 id="bias-potentials-and-enhanced-sampling">Bias potentials and enhanced samp
 function of the collective variable.
 To facilitate this, psiflow provides the ability to evaluate <code>PlumedBias</code> objects
 on <code>Dataset</code> instances using the <code>bias.evaluate()</code> method.
-The returned object is a Parsl <code>Future</code> that represents an <code>ndarray</code> of shape <code>(nstates, 2)</code>.
+The returned object is a Parsl <code>Future</code> that represents an <code>ndarray</code> of shape <code>(nstates, ncolvars + 1)</code>.
 The first column represents the value of the collective variable for each state,
 and the second column contains the bias energy.</p>
 <p><div class="highlight"><pre><span></span><code><a id="__codelineno-11-1" name="__codelineno-11-1" href="#__codelineno-11-1"></a><span class="n">values</span> <span class="o">=</span> <span class="n">bias</span><span class="o">.</span><span class="n">evaluate</span><span class="p">(</span><span class="n">data_train</span><span class="p">,</span> <span class="n">variable</span><span class="o">=</span><span class="s1">&#39;CV&#39;</span><span class="p">)</span>       <span class="c1"># compute the collective variable &#39;CV&#39; and bias energy</span>
@@ -812,11 +844,11 @@ <h2 id="bias-potentials-and-enhanced-sampling">Bias potentials and enhanced samp
 <a id="__codelineno-12-4" name="__codelineno-12-4" href="#__codelineno-12-4"></a><span class="s2">RESTRAINT ARG=CV AT=150 KAPPA=1 LABEL=restraint</span>
 <a id="__codelineno-12-5" name="__codelineno-12-5" href="#__codelineno-12-5"></a><span class="s2">&quot;&quot;&quot;</span>
 <a id="__codelineno-12-6" name="__codelineno-12-6" href="#__codelineno-12-6"></a><span class="n">walker</span> <span class="o">=</span> <span class="n">BiasedDynamicWalker</span><span class="p">(</span><span class="n">data_train</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">bias</span><span class="o">=</span><span class="n">PlumedBias</span><span class="p">(</span><span class="n">plumed_input</span><span class="p">))</span>  <span class="c1"># walker with harmonic bias</span>
-<a id="__codelineno-12-7" name="__codelineno-12-7" href="#__codelineno-12-7"></a><span class="n">state</span> <span class="o">=</span> <span class="n">walker</span><span class="o">.</span><span class="n">propagate</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">)</span>                                           
+<a id="__codelineno-12-7" name="__codelineno-12-7" href="#__codelineno-12-7"></a><span class="n">state</span> <span class="o">=</span> <span class="n">walker</span><span class="o">.</span><span class="n">propagate</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">)</span><span class="o">.</span><span class="n">state</span>
 <a id="__codelineno-12-8" name="__codelineno-12-8" href="#__codelineno-12-8"></a>
 <a id="__codelineno-12-9" name="__codelineno-12-9" href="#__codelineno-12-9"></a><span class="c1"># change bias center and width</span>
 <a id="__codelineno-12-10" name="__codelineno-12-10" href="#__codelineno-12-10"></a><span class="n">walker</span><span class="o">.</span><span class="n">bias</span><span class="o">.</span><span class="n">adjust_restraint</span><span class="p">(</span><span class="n">variable</span><span class="o">=</span><span class="s1">&#39;CV&#39;</span><span class="p">,</span> <span class="n">kappa</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">center</span><span class="o">=</span><span class="mi">200</span><span class="p">)</span>
-<a id="__codelineno-12-11" name="__codelineno-12-11" href="#__codelineno-12-11"></a><span class="n">state_</span> <span class="o">=</span> <span class="n">walker</span><span class="o">.</span><span class="n">propagate</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>     
+<a id="__codelineno-12-11" name="__codelineno-12-11" href="#__codelineno-12-11"></a><span class="n">state_</span> <span class="o">=</span> <span class="n">walker</span><span class="o">.</span><span class="n">propagate</span><span class="p">(</span><span class="n">model</span><span class="p">)</span><span class="o">.</span><span class="n">state</span>
 <a id="__codelineno-12-12" name="__codelineno-12-12" href="#__codelineno-12-12"></a>
 <a id="__codelineno-12-13" name="__codelineno-12-13" href="#__codelineno-12-13"></a><span class="c1"># if the system had enough time to equilibrate with the bias, then the following should hold</span>
 <a id="__codelineno-12-14" name="__codelineno-12-14" href="#__codelineno-12-14"></a><span class="k">assert</span> <span class="n">state</span><span class="o">.</span><span class="n">result</span><span class="p">()</span><span class="o">.</span><span class="n">get_volume</span><span class="p">()</span> <span class="o">&lt;</span> <span class="n">state_</span><span class="o">.</span><span class="n">result</span><span class="p">()</span><span class="o">.</span><span class="n">get_volume</span><span class="p">()</span>
@@ -875,10 +907,14 @@ <h2 id="level-of-theory">Level of theory</h2>
 behavior.
 Their location in the file system is kept track of using additional attributes
 provided by the <code>FlowAtoms</code> class:</p>
-<div class="highlight"><pre><span></span><code><a id="__codelineno-15-1" name="__codelineno-15-1" href="#__codelineno-15-1"></a><span class="k">assert</span> <span class="n">labeled</span><span class="o">.</span><span class="n">result</span><span class="p">()</span><span class="o">.</span><span class="n">reference_status</span>    <span class="c1"># True, because state is successfully evaluated</span>
+<p><div class="highlight"><pre><span></span><code><a id="__codelineno-15-1" name="__codelineno-15-1" href="#__codelineno-15-1"></a><span class="k">assert</span> <span class="n">labeled</span><span class="o">.</span><span class="n">result</span><span class="p">()</span><span class="o">.</span><span class="n">reference_status</span>    <span class="c1"># True, because state is successfully evaluated</span>
 <a id="__codelineno-15-2" name="__codelineno-15-2" href="#__codelineno-15-2"></a><span class="nb">print</span><span class="p">(</span><span class="n">labeled</span><span class="o">.</span><span class="n">result</span><span class="p">()</span><span class="o">.</span><span class="n">reference_stdout</span><span class="p">)</span>    <span class="c1"># e.g. ./psiflow_internal/000/task_logs/0000/cp2k_evaluate.stdout</span>
 <a id="__codelineno-15-3" name="__codelineno-15-3" href="#__codelineno-15-3"></a><span class="nb">print</span><span class="p">(</span><span class="n">labeled</span><span class="o">.</span><span class="n">result</span><span class="p">()</span><span class="o">.</span><span class="n">reference_stderr</span><span class="p">)</span>    <span class="c1"># e.g. ./psiflow_internal/000/task_logs/0000/cp2k_evaluate.stderr</span>
 </code></pre></div>
+Reference instances provide a convenient interface of computing the absolute energy of an isolated atom:
+<div class="highlight"><pre><span></span><code><a id="__codelineno-16-1" name="__codelineno-16-1" href="#__codelineno-16-1"></a><span class="n">energy_H</span> <span class="o">=</span> <span class="n">reference</span><span class="o">.</span><span class="n">compute_atomic_energy</span><span class="p">(</span><span class="s1">&#39;H&#39;</span><span class="p">,</span> <span class="n">box_size</span><span class="o">=</span><span class="mi">5</span><span class="p">)</span>
+<a id="__codelineno-16-2" name="__codelineno-16-2" href="#__codelineno-16-2"></a><span class="n">energy_H</span><span class="o">.</span><span class="n">result</span><span class="p">()</span>   <span class="c1"># about -13.7 eV</span>
+</code></pre></div></p>
 <h3 id="cp2k">CP2K</h3>
 <p>The <code>CP2KReference</code> expects a traditional CP2K
 <a href="https://github.com/molmod/psiflow/blob/main/examples/data/cp2k_input.txt">input file</a>
@@ -886,155 +922,132 @@ <h3 id="cp2k">CP2K</h3>
 it should only contain the FORCE_EVAL section.
 Additional input files which define the basis sets, pseudopotentials, and
 dispersion correction parameters have to be added to the calculator after initialization.
-<div class="highlight"><pre><span></span><code><a id="__codelineno-16-1" name="__codelineno-16-1" href="#__codelineno-16-1"></a><span class="kn">from</span> <span class="nn">psiflow.reference</span> <span class="kn">import</span> <span class="n">CP2KReference</span>
-<a id="__codelineno-16-2" name="__codelineno-16-2" href="#__codelineno-16-2"></a>
-<a id="__codelineno-16-3" name="__codelineno-16-3" href="#__codelineno-16-3"></a>
-<a id="__codelineno-16-4" name="__codelineno-16-4" href="#__codelineno-16-4"></a><span class="n">cp2k_input</span> <span class="o">=</span> <span class="k">with</span> <span class="n">file</span><span class="p">(</span><span class="s1">&#39;cp2k_input.txt&#39;</span><span class="p">,</span> <span class="s1">&#39;r&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span> <span class="n">f</span><span class="o">.</span><span class="n">read</span><span class="p">()</span>
-<a id="__codelineno-16-5" name="__codelineno-16-5" href="#__codelineno-16-5"></a><span class="n">reference</span>  <span class="o">=</span> <span class="n">CP2KReference</span><span class="p">(</span><span class="n">cp2k_input</span><span class="p">)</span>
-<a id="__codelineno-16-6" name="__codelineno-16-6" href="#__codelineno-16-6"></a>
-<a id="__codelineno-16-7" name="__codelineno-16-7" href="#__codelineno-16-7"></a><span class="c1"># register additional input files with the following mapping</span>
-<a id="__codelineno-16-8" name="__codelineno-16-8" href="#__codelineno-16-8"></a><span class="c1"># if the corresponding keyword in the CP2K input file is X, use Y as key here:</span>
-<a id="__codelineno-16-9" name="__codelineno-16-9" href="#__codelineno-16-9"></a><span class="c1"># X: BASIS_SET_FILE_NAME    -&gt;   Y: basis_set</span>
-<a id="__codelineno-16-10" name="__codelineno-16-10" href="#__codelineno-16-10"></a><span class="c1"># X: POTENTIAL_FILE_NAME    -&gt;   Y: potential</span>
-<a id="__codelineno-16-11" name="__codelineno-16-11" href="#__codelineno-16-11"></a><span class="c1"># X: PARAMETER_FILE_NAME    -&gt;   Y: dftd3</span>
-<a id="__codelineno-16-12" name="__codelineno-16-12" href="#__codelineno-16-12"></a><span class="n">reference</span><span class="o">.</span><span class="n">add_file</span><span class="p">(</span><span class="s1">&#39;basis_set&#39;</span><span class="p">,</span> <span class="s1">&#39;BASIS_MOLOPT_UZH&#39;</span><span class="p">)</span>
-<a id="__codelineno-16-13" name="__codelineno-16-13" href="#__codelineno-16-13"></a><span class="n">reference</span><span class="o">.</span><span class="n">add_file</span><span class="p">(</span><span class="s1">&#39;potential&#39;</span><span class="p">,</span> <span class="s1">&#39;POTENTIAL_UZH&#39;</span><span class="p">)</span>
-<a id="__codelineno-16-14" name="__codelineno-16-14" href="#__codelineno-16-14"></a><span class="n">reference</span><span class="o">.</span><span class="n">add_file</span><span class="p">(</span><span class="s1">&#39;dftd3&#39;</span><span class="p">,</span> <span class="s1">&#39;dftd3.dat&#39;</span><span class="p">)</span>
-</code></pre></div></p>
-<!---
-## Generators
-In online learning, data generation proceeds by taking an intermediate model
-(and optionally, a bias potential)
-and using it in a phase space sampling algorithm in order to generate
-a new structure starting from some existing structure, which is then evaluated
-using a reference level of theory. In psiflow terms, this 
-means that a `BaseWalker` will be propagated using a `PlumedBias` and a `BaseModel`,
-and the final state that is obtained will be passed to the `BaseReference`
-instance after which it may be included in training/validation datasets.
-<div class="highlight"><pre><span></span><code><a id="__codelineno-17-1" name="__codelineno-17-1" href="#__codelineno-17-1"></a><span class="kn">from</span> <span class="nn">ase.io</span> <span class="kn">import</span> <span class="n">read</span>
+<div class="highlight"><pre><span></span><code><a id="__codelineno-17-1" name="__codelineno-17-1" href="#__codelineno-17-1"></a><span class="kn">from</span> <span class="nn">psiflow.reference</span> <span class="kn">import</span> <span class="n">CP2KReference</span>
 <a id="__codelineno-17-2" name="__codelineno-17-2" href="#__codelineno-17-2"></a>
-<a id="__codelineno-17-3" name="__codelineno-17-3" href="#__codelineno-17-3"></a><span class="n">start</span> <span class="o">=</span> <span class="n">read</span><span class="p">(</span><span class="s1">&#39;atoms.xyz&#39;</span><span class="p">)</span>
-<a id="__codelineno-17-4" name="__codelineno-17-4" href="#__codelineno-17-4"></a>
-<a id="__codelineno-17-5" name="__codelineno-17-5" href="#__codelineno-17-5"></a><span class="n">walker</span> <span class="o">=</span> <span class="n">DynamicWalker</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">steps</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">temperature</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
-<a id="__codelineno-17-6" name="__codelineno-17-6" href="#__codelineno-17-6"></a><span class="n">bias</span>   <span class="o">=</span> <span class="kc">None</span>       <span class="c1"># or PlumedBias(plumed_input)</span>
-<a id="__codelineno-17-7" name="__codelineno-17-7" href="#__codelineno-17-7"></a>
-<a id="__codelineno-17-8" name="__codelineno-17-8" href="#__codelineno-17-8"></a><span class="n">state</span> <span class="o">=</span> <span class="n">walker</span><span class="o">.</span><span class="n">propagate</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span> <span class="n">bias</span><span class="o">=</span><span class="n">bias</span><span class="p">,</span> <span class="n">keep_trajectory</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-<a id="__codelineno-17-9" name="__codelineno-17-9" href="#__codelineno-17-9"></a><span class="n">final</span> <span class="o">=</span> <span class="n">reference</span><span class="o">.</span><span class="n">evaluate</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
-</code></pre></div>
-However, there are few additional considerations
-that come into play when generating data with imperfect interaction potentials:
-
-- __imposing physical constraints__: interatomic potentials such as MACE or NequIP
-tend to produce unphysical states when they are not yet sufficiently trained.
-For example, it is sometimes possible that two atoms essentially collide
-onto each other during molecular dynamics; i.e. that the interatomic distance
-becomes far smaller than what is physically reasonable.
-It is not desirable to waste computational
-time on evaluating those states at the DFT level or including them during training,
-and psiflow gives the user the ability to define __checks__ which are applied to
-the sampled data in order to include or exclude samples according to some set of rules.
-If the check passes, the state is evaluated using the 
-reference; if not, the walker is reset and sampling is retried with a different
-configuration of initial velocities.
-An example of such a check is the `InteratomicDistanceCheck`,
-which, as the name suggests, computes all interatomic
-distances and demands that they are all larger than some minimum threshold.
-Another example is the `DiscrepancyCheck`, which evaluates the sampled configuration
-using a set of models, and only accepts the state if the predictions are sufficiently
-different (as to avoid including redundant samples in the training data).
-This approach in literature is known as query-by-committee.
-- __retry handling__: even when imposing additional constraints on the sampled states,
-unexpected behavior is bound to occur.
-The SCF cycles in the reference evaluation may fail to converge for some particular
-configuration,
-a specific worker is running on faulty hardware, or a metadynamics bias potential may have become too aggressive due to 
-which the force threshold is systematically exceeded.
-Generators allow to specify a number of retries both for sampling and for
-the reference evaluation to avoid having to restart the entire workflow when
-unexpected but insignificant failures occur.
-
-To accomodate all of this, psiflow makes use of a `Generator` class which
-groups the walker and bias into a single object, along with the retry policy.
-The above code block would look like this when implemented using a generator:
-
-<div class="highlight"><pre><span></span><code><a id="__codelineno-18-1" name="__codelineno-18-1" href="#__codelineno-18-1"></a><span class="kn">from</span> <span class="nn">psiflow.generator</span> <span class="kn">import</span> <span class="n">Generator</span>
-<a id="__codelineno-18-2" name="__codelineno-18-2" href="#__codelineno-18-2"></a><span class="kn">from</span> <span class="nn">psiflow.checks</span> <span class="kn">import</span> <span class="n">InteratomicDistanceCheck</span>
-<a id="__codelineno-18-3" name="__codelineno-18-3" href="#__codelineno-18-3"></a>
-<a id="__codelineno-18-4" name="__codelineno-18-4" href="#__codelineno-18-4"></a><span class="n">generator</span> <span class="o">=</span> <span class="n">Generator</span><span class="p">(</span>
-<a id="__codelineno-18-5" name="__codelineno-18-5" href="#__codelineno-18-5"></a>        <span class="s1">&#39;simple&#39;</span><span class="p">,</span>               <span class="c1"># name to use when logging status of this generator</span>
-<a id="__codelineno-18-6" name="__codelineno-18-6" href="#__codelineno-18-6"></a>        <span class="n">walker</span><span class="p">,</span>                 <span class="c1"># e.g. DynamicWalker</span>
-<a id="__codelineno-18-7" name="__codelineno-18-7" href="#__codelineno-18-7"></a>        <span class="n">bias</span><span class="p">,</span>                   <span class="c1"># PlumedBias or None</span>
-<a id="__codelineno-18-8" name="__codelineno-18-8" href="#__codelineno-18-8"></a>        <span class="n">nretries_sampling</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>    <span class="c1"># walker.propagate() will be called at most thrice</span>
-<a id="__codelineno-18-9" name="__codelineno-18-9" href="#__codelineno-18-9"></a>        <span class="n">nretries_reference</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>   <span class="c1"># reference.evaluate() will be called precisely once</span>
-<a id="__codelineno-18-10" name="__codelineno-18-10" href="#__codelineno-18-10"></a>        <span class="p">)</span>
-<a id="__codelineno-18-11" name="__codelineno-18-11" href="#__codelineno-18-11"></a><span class="n">checks</span> <span class="o">=</span> <span class="p">[</span><span class="n">InteratomicDistanceCheck</span><span class="p">(</span><span class="n">threshold</span><span class="o">=</span><span class="mf">0.5</span><span class="p">)]</span>  <span class="c1"># reject state if d(atom1, atom2) &lt; 0.5 A for any two atoms</span>
-<a id="__codelineno-18-12" name="__codelineno-18-12" href="#__codelineno-18-12"></a><span class="n">state</span> <span class="o">=</span> <span class="n">generator</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">reference</span><span class="p">,</span> <span class="n">checks</span><span class="o">=</span><span class="n">checks</span><span class="p">)</span>  <span class="c1"># retries are handled internally</span>
-<a id="__codelineno-18-13" name="__codelineno-18-13" href="#__codelineno-18-13"></a>
-<a id="__codelineno-18-14" name="__codelineno-18-14" href="#__codelineno-18-14"></a><span class="k">assert</span> <span class="n">state</span><span class="o">.</span><span class="n">result</span><span class="p">()</span><span class="o">.</span><span class="n">reference_status</span>              <span class="c1"># is already evaluated by the generator</span>
-</code></pre></div>
-
-In online learning, a common scenario is to generate data using
-many different molecular dynamics simulations; all of which with more or less the same parameters but
-simply initialized in a different way (either with a different seed or a different starting configuration).
-Psiflow provides a simple way to _multiply_ a generator in order to obtain a list
-of generators, all of which identical except for the random number seed
-(and possibly the initial configuration).
-<div class="highlight"><pre><span></span><code><a id="__codelineno-19-1" name="__codelineno-19-1" href="#__codelineno-19-1"></a><span class="n">generators</span> <span class="o">=</span> <span class="n">Generator</span><span class="p">(</span><span class="s1">&#39;simple&#39;</span><span class="p">,</span> <span class="n">walker</span><span class="p">,</span> <span class="n">bias</span><span class="p">)</span><span class="o">.</span><span class="n">multiply</span><span class="p">(</span><span class="mi">10</span><span class="p">)</span> <span class="c1"># same initial configuration, different seed</span>
-<a id="__codelineno-19-2" name="__codelineno-19-2" href="#__codelineno-19-2"></a><span class="k">assert</span> <span class="nb">type</span><span class="p">(</span><span class="n">generators</span><span class="p">)</span> <span class="o">==</span> <span class="nb">list</span>
-<a id="__codelineno-19-3" name="__codelineno-19-3" href="#__codelineno-19-3"></a>
-<a id="__codelineno-19-4" name="__codelineno-19-4" href="#__codelineno-19-4"></a><span class="n">initial_states</span> <span class="o">=</span> <span class="n">Dataset</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="s1">&#39;initial_states.xyz&#39;</span><span class="p">)</span>         <span class="c1"># different initial configuration, different seed</span>
-<a id="__codelineno-19-5" name="__codelineno-19-5" href="#__codelineno-19-5"></a><span class="n">generators</span> <span class="o">=</span> <span class="n">Generator</span><span class="p">(</span><span class="s1">&#39;simple&#39;</span><span class="p">,</span> <span class="n">walker</span><span class="p">,</span> <span class="n">bias</span><span class="p">)</span><span class="o">.</span><span class="n">multiply</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">initialize_using</span><span class="o">=</span><span class="n">initial_states</span><span class="p">)</span>
-</code></pre></div>
---->
-
+<a id="__codelineno-17-3" name="__codelineno-17-3" href="#__codelineno-17-3"></a>
+<a id="__codelineno-17-4" name="__codelineno-17-4" href="#__codelineno-17-4"></a><span class="n">cp2k_input</span> <span class="o">=</span> <span class="k">with</span> <span class="n">file</span><span class="p">(</span><span class="s1">&#39;cp2k_input.txt&#39;</span><span class="p">,</span> <span class="s1">&#39;r&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span> <span class="n">f</span><span class="o">.</span><span class="n">read</span><span class="p">()</span>
+<a id="__codelineno-17-5" name="__codelineno-17-5" href="#__codelineno-17-5"></a><span class="n">reference</span>  <span class="o">=</span> <span class="n">CP2KReference</span><span class="p">(</span><span class="n">cp2k_input</span><span class="p">)</span>
+<a id="__codelineno-17-6" name="__codelineno-17-6" href="#__codelineno-17-6"></a>
+<a id="__codelineno-17-7" name="__codelineno-17-7" href="#__codelineno-17-7"></a><span class="c1"># register additional input files with the following mapping</span>
+<a id="__codelineno-17-8" name="__codelineno-17-8" href="#__codelineno-17-8"></a><span class="c1"># if the corresponding keyword in the CP2K input file is X, use Y as key here:</span>
+<a id="__codelineno-17-9" name="__codelineno-17-9" href="#__codelineno-17-9"></a><span class="c1"># X: BASIS_SET_FILE_NAME    -&gt;   Y: basis_set</span>
+<a id="__codelineno-17-10" name="__codelineno-17-10" href="#__codelineno-17-10"></a><span class="c1"># X: POTENTIAL_FILE_NAME    -&gt;   Y: potential</span>
+<a id="__codelineno-17-11" name="__codelineno-17-11" href="#__codelineno-17-11"></a><span class="c1"># X: PARAMETER_FILE_NAME    -&gt;   Y: dftd3</span>
+<a id="__codelineno-17-12" name="__codelineno-17-12" href="#__codelineno-17-12"></a><span class="n">reference</span><span class="o">.</span><span class="n">add_file</span><span class="p">(</span><span class="s1">&#39;basis_set&#39;</span><span class="p">,</span> <span class="s1">&#39;BASIS_MOLOPT_UZH&#39;</span><span class="p">)</span>
+<a id="__codelineno-17-13" name="__codelineno-17-13" href="#__codelineno-17-13"></a><span class="n">reference</span><span class="o">.</span><span class="n">add_file</span><span class="p">(</span><span class="s1">&#39;potential&#39;</span><span class="p">,</span> <span class="s1">&#39;POTENTIAL_UZH&#39;</span><span class="p">)</span>
+<a id="__codelineno-17-14" name="__codelineno-17-14" href="#__codelineno-17-14"></a><span class="n">reference</span><span class="o">.</span><span class="n">add_file</span><span class="p">(</span><span class="s1">&#39;dftd3&#39;</span><span class="p">,</span> <span class="s1">&#39;dftd3.dat&#39;</span><span class="p">)</span>
+</code></pre></div></p>
+<h3 id="nwchem">NWChem</h3>
+<p>For nonperiodic systems, psiflow provides an interface with <a href="https://nwchemgit.github.io/Home.html">NWChem</a>,
+which implements a plethora of DFT and post-HF methods for both periodic and nonperiodic systems.
+The <code>NWChemReference</code> class essentially wraps around the ASE calculator, and is similarly easy to use:
+<div class="highlight"><pre><span></span><code><a id="__codelineno-18-1" name="__codelineno-18-1" href="#__codelineno-18-1"></a><span class="n">calculator_kwargs</span> <span class="o">=</span> <span class="p">{</span>
+<a id="__codelineno-18-2" name="__codelineno-18-2" href="#__codelineno-18-2"></a>        <span class="s1">&#39;basis&#39;</span><span class="p">:</span> <span class="p">{</span><span class="n">e</span><span class="p">:</span> <span class="s1">&#39;3-21g&#39;</span> <span class="k">for</span> <span class="n">e</span> <span class="ow">in</span> <span class="p">[</span><span class="s1">&#39;H&#39;</span><span class="p">,</span> <span class="s1">&#39;C&#39;</span><span class="p">,</span> <span class="s1">&#39;O&#39;</span><span class="p">,</span> <span class="s1">&#39;N&#39;</span><span class="p">]},</span>
+<a id="__codelineno-18-3" name="__codelineno-18-3" href="#__codelineno-18-3"></a>        <span class="s1">&#39;dft&#39;</span><span class="p">:</span> <span class="p">{</span>
+<a id="__codelineno-18-4" name="__codelineno-18-4" href="#__codelineno-18-4"></a>            <span class="s1">&#39;xc&#39;</span><span class="p">:</span> <span class="s1">&#39;pw91lda&#39;</span><span class="p">,</span>
+<a id="__codelineno-18-5" name="__codelineno-18-5" href="#__codelineno-18-5"></a>            <span class="s1">&#39;mult&#39;</span><span class="p">:</span> <span class="mi">1</span><span class="p">,</span>
+<a id="__codelineno-18-6" name="__codelineno-18-6" href="#__codelineno-18-6"></a>            <span class="s1">&#39;convergence&#39;</span><span class="p">:</span> <span class="p">{</span>
+<a id="__codelineno-18-7" name="__codelineno-18-7" href="#__codelineno-18-7"></a>                <span class="s1">&#39;energy&#39;</span><span class="p">:</span> <span class="mf">1e-6</span><span class="p">,</span>
+<a id="__codelineno-18-8" name="__codelineno-18-8" href="#__codelineno-18-8"></a>                <span class="s1">&#39;density&#39;</span><span class="p">:</span> <span class="mf">1e-6</span><span class="p">,</span>
+<a id="__codelineno-18-9" name="__codelineno-18-9" href="#__codelineno-18-9"></a>                <span class="s1">&#39;gradient&#39;</span><span class="p">:</span> <span class="mf">1e-6</span><span class="p">,</span>
+<a id="__codelineno-18-10" name="__codelineno-18-10" href="#__codelineno-18-10"></a>                <span class="p">},</span>
+<a id="__codelineno-18-11" name="__codelineno-18-11" href="#__codelineno-18-11"></a>            <span class="p">},</span>
+<a id="__codelineno-18-12" name="__codelineno-18-12" href="#__codelineno-18-12"></a>        <span class="p">}</span>
+<a id="__codelineno-18-13" name="__codelineno-18-13" href="#__codelineno-18-13"></a><span class="n">reference</span> <span class="o">=</span> <span class="n">NWChemReference</span><span class="p">(</span><span class="o">**</span><span class="n">calculator_kwargs</span><span class="p">)</span>
+</code></pre></div></p>
 <h2 id="learning-algorithms">Learning algorithms</h2>
-<p>The endgame of psiflow is to allow for seamless development and scalable
+<p>The endgame of psiflow is to allow for the seamless development and scalable
 execution of online learning algorithms for interatomic
 potentials.
-The <code>BaseLearning</code> class provides an example interface based on which such
-algorithms may be implemented.
-Within the space of online learning, the most trivial approach is represented
+The <code>BaseLearning</code> class provides an interface based on which such
+algorithms can be implemented, and it has the following characteristics:</p>
+<ul>
+<li><strong>an output folder</strong>: used for storing intermediate models, (labeled) datasets, walkers, and reported metrics.</li>
+<li><strong>dataset identifier</strong>: to facilitate logging and/or debugging of the active learning progress,
+each successfully labeled state is immediately given a unique identifier (an integer). 
+This is necessary in order to keep track of which molecular dynamics log or DFT evaluation log
+belongs to which state, especially when data is shuffled in each iteration. The identifier is stored
+in the <code>info</code> dict of each of the <code>FlowAtoms</code> instances, and is therefore also human-readable in the
+dataset XYZ files.</li>
+<li><strong>metrics</strong>: the <code>Metrics</code> helper class is used to compute and save various error metrics and
+other relevant diagnostics during online learning. Examples are per-element validation RMSEs
+or collective variables of the sampled data:
+<div class="highlight"><span class="filename">dataset.log</span><pre><span></span><code><a id="__codelineno-19-1" name="__codelineno-19-1" href="#__codelineno-19-1"></a>+------------+--------+--------+-------+----------+----------+----------+----------+-----------+
+<a id="__codelineno-19-2" name="__codelineno-19-2" href="#__codelineno-19-2"></a>| identifier | e_rmse | f_rmse |    CV | f_rmse_H | f_rmse_C | f_rmse_N | f_rmse_I | f_rmse_Pb |
+<a id="__codelineno-19-3" name="__codelineno-19-3" href="#__codelineno-19-3"></a>+------------+--------+--------+-------+----------+----------+----------+----------+-----------+
+<a id="__codelineno-19-4" name="__codelineno-19-4" href="#__codelineno-19-4"></a>|          0 |   0.23 |  32.15 | -4.54 |    23.82 |    47.04 |    37.72 |    27.97 |     46.47 |
+<a id="__codelineno-19-5" name="__codelineno-19-5" href="#__codelineno-19-5"></a>|          1 |   0.27 |  31.72 | -4.45 |    23.13 |    43.52 |    34.12 |    28.43 |     52.42 |
+<a id="__codelineno-19-6" name="__codelineno-19-6" href="#__codelineno-19-6"></a>|          2 |   0.45 |  33.60 | -4.49 |    27.02 |    44.40 |    40.34 |    27.77 |     48.51 |
+<a id="__codelineno-19-7" name="__codelineno-19-7" href="#__codelineno-19-7"></a>|          3 |   0.39 |  33.02 | -4.44 |    26.52 |    50.11 |    36.97 |    27.50 |     45.21 |
+<a id="__codelineno-19-8" name="__codelineno-19-8" href="#__codelineno-19-8"></a>|          4 |   0.36 |  31.75 | -4.47 |    25.15 |    41.36 |    37.35 |    27.10 |     47.16 |
+<a id="__codelineno-19-9" name="__codelineno-19-9" href="#__codelineno-19-9"></a>|          5 |   0.35 |  34.00 | -4.41 |    28.04 |    43.99 |    39.52 |    28.56 |     49.31 |
+<a id="__codelineno-19-10" name="__codelineno-19-10" href="#__codelineno-19-10"></a>...
+</code></pre></div>
+or the (a posteriori) error of individual walkers and other relevant information:
+<div class="highlight"><span class="filename">walkers.log</span><pre><span></span><code><a id="__codelineno-20-1" name="__codelineno-20-1" href="#__codelineno-20-1"></a>+--------------+---------+----------+--------+--------------+-------------+------------+-------+--------+-------------------------------------+
+<a id="__codelineno-20-2" name="__codelineno-20-2" href="#__codelineno-20-2"></a>| walker_index | counter | is_reset | f_rmse | disagreement | temperature | identifier |    CV | e_rmse |                              stdout |
+<a id="__codelineno-20-3" name="__codelineno-20-3" href="#__codelineno-20-3"></a>+--------------+---------+----------+--------+--------------+-------------+------------+-------+--------+-------------------------------------+
+<a id="__codelineno-20-4" name="__codelineno-20-4" href="#__codelineno-20-4"></a>|            0 |    1000 |    False |  47.33 |         None |      135.79 |        150 | -4.61 |   4.04 | task_7028_molecular_dynamics_openmm |
+<a id="__codelineno-20-5" name="__codelineno-20-5" href="#__codelineno-20-5"></a>|            1 |    1000 |    False |  50.69 |         None |      142.89 |        151 | -4.39 |   4.11 | task_7046_molecular_dynamics_openmm |
+<a id="__codelineno-20-6" name="__codelineno-20-6" href="#__codelineno-20-6"></a>|            2 |    1000 |    False |  46.34 |         None |      140.72 |        152 | -4.61 |   4.07 | task_7064_molecular_dynamics_openmm |
+<a id="__codelineno-20-7" name="__codelineno-20-7" href="#__codelineno-20-7"></a>|            3 |    1000 |    False |  43.71 |         None |      136.12 |        153 | -4.45 |   4.24 | task_7082_molecular_dynamics_openmm |
+<a id="__codelineno-20-8" name="__codelineno-20-8" href="#__codelineno-20-8"></a>...
+</code></pre></div>
+Although optional, it also provides a convenient
+<a href="https://wandb.ai">Weights &amp; Biases</a> interface for easier navigation and interpretation of all of the metrics.</li>
+<li><strong><code>learning.run()</code></strong>: performs the actual active learning. </li>
+<li><strong>(optional) pretraining</strong>: pretraining is used to bootstrap active learning runs, in order to 
+make the model familiar with bonds in the system and ensure that it doesn't go too crazy during
+sampling in the first few iterations. During pretraining, a minimal set of configurations is generated by applying
+random perturbations to the atomic positions and/or unit cell vectors (typically about 0.05 A in magnitude).
+These configurations are then evaluated using the provided <code>BaseReference</code> instance after which the obtained
+data is split into training and validation in order to pretrain the model.
+When <code>learning.run()</code> is called, it decides whether or not to perform pretraining based on the state of
+the model as well as </li>
+</ul>
+<h3 id="sequential-learning">Sequential Learning</h3>
+<p>Within the space of online learning, the most trivial approach is represented
 using the <code>SequentialLearning</code> class.
 In sequential learning, the data generation (as performed by a set of walkers)
 is interleaved with short model training steps as to update
 the knowledge in the model with the states that were sampled by the walkers
 and evaluated with the chosen reference level of theory.
 Take a look at the following example:
-<div class="highlight"><pre><span></span><code><a id="__codelineno-20-1" name="__codelineno-20-1" href="#__codelineno-20-1"></a><span class="kn">from</span> <span class="nn">psiflow.learning</span> <span class="kn">import</span> <span class="n">SequentialLearning</span>
-<a id="__codelineno-20-2" name="__codelineno-20-2" href="#__codelineno-20-2"></a>
-<a id="__codelineno-20-3" name="__codelineno-20-3" href="#__codelineno-20-3"></a>
-<a id="__codelineno-20-4" name="__codelineno-20-4" href="#__codelineno-20-4"></a><span class="n">data_train</span> <span class="o">=</span> <span class="n">Dataset</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="s1">&#39;initial_train.xyz&#39;</span><span class="p">)</span>
-<a id="__codelineno-20-5" name="__codelineno-20-5" href="#__codelineno-20-5"></a><span class="n">data_valid</span> <span class="o">=</span> <span class="n">Dataset</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="s1">&#39;initial_valid.xyz&#39;</span><span class="p">)</span>
-<a id="__codelineno-20-6" name="__codelineno-20-6" href="#__codelineno-20-6"></a>
-<a id="__codelineno-20-7" name="__codelineno-20-7" href="#__codelineno-20-7"></a><span class="n">walkers</span> <span class="o">=</span> <span class="n">DynamicWalker</span><span class="o">.</span><span class="n">multiply</span><span class="p">(</span>     <span class="c1"># initializes 30 walkers, with different initial configuration and seed</span>
-<a id="__codelineno-20-8" name="__codelineno-20-8" href="#__codelineno-20-8"></a>        <span class="mi">30</span><span class="p">,</span>
-<a id="__codelineno-20-9" name="__codelineno-20-9" href="#__codelineno-20-9"></a>        <span class="n">data_train</span><span class="p">,</span>                   <span class="c1"># Dataset which provides initial configurations</span>
-<a id="__codelineno-20-10" name="__codelineno-20-10" href="#__codelineno-20-10"></a>        <span class="n">timestep</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
-<a id="__codelineno-20-11" name="__codelineno-20-11" href="#__codelineno-20-11"></a>        <span class="n">steps</span><span class="o">=</span><span class="mi">400</span><span class="p">,</span>
-<a id="__codelineno-20-12" name="__codelineno-20-12" href="#__codelineno-20-12"></a>        <span class="n">step</span><span class="o">=</span><span class="mi">50</span><span class="p">,</span>
-<a id="__codelineno-20-13" name="__codelineno-20-13" href="#__codelineno-20-13"></a>        <span class="n">start</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-<a id="__codelineno-20-14" name="__codelineno-20-14" href="#__codelineno-20-14"></a>        <span class="n">temperature</span><span class="o">=</span><span class="mi">600</span><span class="p">,</span>
-<a id="__codelineno-20-15" name="__codelineno-20-15" href="#__codelineno-20-15"></a>        <span class="n">pressure</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="c1"># NPT</span>
-<a id="__codelineno-20-16" name="__codelineno-20-16" href="#__codelineno-20-16"></a>        <span class="n">force_threshold</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span>
-<a id="__codelineno-20-17" name="__codelineno-20-17" href="#__codelineno-20-17"></a>        <span class="n">initial_temperature</span><span class="o">=</span><span class="mi">600</span><span class="p">,</span>
-<a id="__codelineno-20-18" name="__codelineno-20-18" href="#__codelineno-20-18"></a>        <span class="p">)</span>
-<a id="__codelineno-20-19" name="__codelineno-20-19" href="#__codelineno-20-19"></a>
-<a id="__codelineno-20-20" name="__codelineno-20-20" href="#__codelineno-20-20"></a><span class="n">learning</span> <span class="o">=</span> <span class="n">SequentialLearning</span><span class="p">(</span>              <span class="c1"># implements sequential learning</span>
-<a id="__codelineno-20-21" name="__codelineno-20-21" href="#__codelineno-20-21"></a>        <span class="n">path_output</span><span class="o">=</span><span class="n">path_output</span><span class="p">,</span>            <span class="c1"># folder in which consecutive models and data should be saved</span>
-<a id="__codelineno-20-22" name="__codelineno-20-22" href="#__codelineno-20-22"></a>        <span class="n">niterations</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>                     <span class="c1"># number of (generate, train) iterations</span>
-<a id="__codelineno-20-23" name="__codelineno-20-23" href="#__codelineno-20-23"></a>        <span class="n">train_from_scratch</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>            <span class="c1"># whether to train with reinitialized weights in each iteration</span>
-<a id="__codelineno-20-24" name="__codelineno-20-24" href="#__codelineno-20-24"></a>        <span class="n">train_valid_split</span><span class="o">=</span><span class="mf">0.9</span><span class="p">,</span>              <span class="c1"># partitioning of generated states into training and validation</span>
-<a id="__codelineno-20-25" name="__codelineno-20-25" href="#__codelineno-20-25"></a>        <span class="p">)</span>
-<a id="__codelineno-20-26" name="__codelineno-20-26" href="#__codelineno-20-26"></a>
-<a id="__codelineno-20-27" name="__codelineno-20-27" href="#__codelineno-20-27"></a><span class="n">data_train</span><span class="p">,</span> <span class="n">data_valid</span> <span class="o">=</span> <span class="n">learning</span><span class="o">.</span><span class="n">run</span><span class="p">(</span>
-<a id="__codelineno-20-28" name="__codelineno-20-28" href="#__codelineno-20-28"></a>        <span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span>                                <span class="c1"># initial model</span>
-<a id="__codelineno-20-29" name="__codelineno-20-29" href="#__codelineno-20-29"></a>        <span class="n">reference</span><span class="o">=</span><span class="n">reference</span><span class="p">,</span>                        <span class="c1"># reference level of theory</span>
-<a id="__codelineno-20-30" name="__codelineno-20-30" href="#__codelineno-20-30"></a>        <span class="n">walkers</span><span class="o">=</span><span class="n">walkers</span><span class="p">,</span>                            <span class="c1"># list of walkers</span>
-<a id="__codelineno-20-31" name="__codelineno-20-31" href="#__codelineno-20-31"></a>        <span class="p">)</span>
-<a id="__codelineno-20-32" name="__codelineno-20-32" href="#__codelineno-20-32"></a>
-<a id="__codelineno-20-33" name="__codelineno-20-33" href="#__codelineno-20-33"></a><span class="n">model</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">path_output</span><span class="p">)</span>                 <span class="c1"># save new model separately</span>
-<a id="__codelineno-20-34" name="__codelineno-20-34" href="#__codelineno-20-34"></a><span class="n">data_train</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="s1">&#39;final_train.xyz&#39;</span><span class="p">)</span>      <span class="c1"># save final training data</span>
-<a id="__codelineno-20-35" name="__codelineno-20-35" href="#__codelineno-20-35"></a><span class="n">data_valid</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="s1">&#39;final_valid.xyz&#39;</span><span class="p">)</span>      <span class="c1"># save final validation data</span>
+<div class="highlight"><pre><span></span><code><a id="__codelineno-21-1" name="__codelineno-21-1" href="#__codelineno-21-1"></a><span class="kn">from</span> <span class="nn">psiflow.learning</span> <span class="kn">import</span> <span class="n">SequentialLearning</span>
+<a id="__codelineno-21-2" name="__codelineno-21-2" href="#__codelineno-21-2"></a>
+<a id="__codelineno-21-3" name="__codelineno-21-3" href="#__codelineno-21-3"></a>
+<a id="__codelineno-21-4" name="__codelineno-21-4" href="#__codelineno-21-4"></a><span class="n">data_train</span> <span class="o">=</span> <span class="n">Dataset</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="s1">&#39;initial_train.xyz&#39;</span><span class="p">)</span>
+<a id="__codelineno-21-5" name="__codelineno-21-5" href="#__codelineno-21-5"></a><span class="n">data_valid</span> <span class="o">=</span> <span class="n">Dataset</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="s1">&#39;initial_valid.xyz&#39;</span><span class="p">)</span>
+<a id="__codelineno-21-6" name="__codelineno-21-6" href="#__codelineno-21-6"></a>
+<a id="__codelineno-21-7" name="__codelineno-21-7" href="#__codelineno-21-7"></a><span class="n">walkers</span> <span class="o">=</span> <span class="n">DynamicWalker</span><span class="o">.</span><span class="n">multiply</span><span class="p">(</span>     <span class="c1"># initializes 30 walkers, with different initial configuration and seed</span>
+<a id="__codelineno-21-8" name="__codelineno-21-8" href="#__codelineno-21-8"></a>        <span class="mi">30</span><span class="p">,</span>
+<a id="__codelineno-21-9" name="__codelineno-21-9" href="#__codelineno-21-9"></a>        <span class="n">data_train</span><span class="p">,</span>                   <span class="c1"># Dataset which provides initial configurations</span>
+<a id="__codelineno-21-10" name="__codelineno-21-10" href="#__codelineno-21-10"></a>        <span class="n">timestep</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
+<a id="__codelineno-21-11" name="__codelineno-21-11" href="#__codelineno-21-11"></a>        <span class="n">steps</span><span class="o">=</span><span class="mi">400</span><span class="p">,</span>
+<a id="__codelineno-21-12" name="__codelineno-21-12" href="#__codelineno-21-12"></a>        <span class="n">step</span><span class="o">=</span><span class="mi">50</span><span class="p">,</span>
+<a id="__codelineno-21-13" name="__codelineno-21-13" href="#__codelineno-21-13"></a>        <span class="n">start</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+<a id="__codelineno-21-14" name="__codelineno-21-14" href="#__codelineno-21-14"></a>        <span class="n">temperature</span><span class="o">=</span><span class="mi">600</span><span class="p">,</span>
+<a id="__codelineno-21-15" name="__codelineno-21-15" href="#__codelineno-21-15"></a>        <span class="n">pressure</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="c1"># NPT</span>
+<a id="__codelineno-21-16" name="__codelineno-21-16" href="#__codelineno-21-16"></a>        <span class="n">force_threshold</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span>
+<a id="__codelineno-21-17" name="__codelineno-21-17" href="#__codelineno-21-17"></a>        <span class="n">initial_temperature</span><span class="o">=</span><span class="mi">600</span><span class="p">,</span>
+<a id="__codelineno-21-18" name="__codelineno-21-18" href="#__codelineno-21-18"></a>        <span class="p">)</span>
+<a id="__codelineno-21-19" name="__codelineno-21-19" href="#__codelineno-21-19"></a>
+<a id="__codelineno-21-20" name="__codelineno-21-20" href="#__codelineno-21-20"></a><span class="n">learning</span> <span class="o">=</span> <span class="n">SequentialLearning</span><span class="p">(</span>              <span class="c1"># implements sequential learning</span>
+<a id="__codelineno-21-21" name="__codelineno-21-21" href="#__codelineno-21-21"></a>        <span class="n">path_output</span><span class="o">=</span><span class="n">path_output</span><span class="p">,</span>            <span class="c1"># folder in which consecutive models and data should be saved</span>
+<a id="__codelineno-21-22" name="__codelineno-21-22" href="#__codelineno-21-22"></a>        <span class="n">niterations</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>                     <span class="c1"># number of (generate, train) iterations</span>
+<a id="__codelineno-21-23" name="__codelineno-21-23" href="#__codelineno-21-23"></a>        <span class="n">train_from_scratch</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>            <span class="c1"># whether to train with reinitialized weights in each iteration</span>
+<a id="__codelineno-21-24" name="__codelineno-21-24" href="#__codelineno-21-24"></a>        <span class="n">train_valid_split</span><span class="o">=</span><span class="mf">0.9</span><span class="p">,</span>              <span class="c1"># partitioning of generated states into training and validation</span>
+<a id="__codelineno-21-25" name="__codelineno-21-25" href="#__codelineno-21-25"></a>        <span class="p">)</span>
+<a id="__codelineno-21-26" name="__codelineno-21-26" href="#__codelineno-21-26"></a>
+<a id="__codelineno-21-27" name="__codelineno-21-27" href="#__codelineno-21-27"></a><span class="n">data_train</span><span class="p">,</span> <span class="n">data_valid</span> <span class="o">=</span> <span class="n">learning</span><span class="o">.</span><span class="n">run</span><span class="p">(</span>
+<a id="__codelineno-21-28" name="__codelineno-21-28" href="#__codelineno-21-28"></a>        <span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span>                                <span class="c1"># initial model</span>
+<a id="__codelineno-21-29" name="__codelineno-21-29" href="#__codelineno-21-29"></a>        <span class="n">reference</span><span class="o">=</span><span class="n">reference</span><span class="p">,</span>                        <span class="c1"># reference level of theory</span>
+<a id="__codelineno-21-30" name="__codelineno-21-30" href="#__codelineno-21-30"></a>        <span class="n">walkers</span><span class="o">=</span><span class="n">walkers</span><span class="p">,</span>                            <span class="c1"># list of walkers</span>
+<a id="__codelineno-21-31" name="__codelineno-21-31" href="#__codelineno-21-31"></a>        <span class="p">)</span>
+<a id="__codelineno-21-32" name="__codelineno-21-32" href="#__codelineno-21-32"></a>
+<a id="__codelineno-21-33" name="__codelineno-21-33" href="#__codelineno-21-33"></a><span class="n">model</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">path_output</span><span class="p">)</span>                 <span class="c1"># save new model separately</span>
+<a id="__codelineno-21-34" name="__codelineno-21-34" href="#__codelineno-21-34"></a><span class="n">data_train</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="s1">&#39;final_train.xyz&#39;</span><span class="p">)</span>      <span class="c1"># save final training data</span>
+<a id="__codelineno-21-35" name="__codelineno-21-35" href="#__codelineno-21-35"></a><span class="n">data_valid</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="s1">&#39;final_valid.xyz&#39;</span><span class="p">)</span>      <span class="c1"># save final validation data</span>
 </code></pre></div>
 The <code>learning.run()</code> method implements the actual online learning algorithm.
 In this case, it will repeat the following
@@ -1054,6 +1067,8 @@ <h2 id="learning-algorithms">Learning algorithms</h2>
 as the entire state of the walkers (i.e. start and stop configuration,
 and state of the bias potentials if present).
 Additional features are demonstrated in the <a href="../examples/">Examples</a>.</p>
+<h3 id="incremental-learning">Incremental Learning</h3>
+<h3 id="committee-learning">Committee Learning</h3>
 
 
 
diff --git a/sitemap.xml.gz b/sitemap.xml.gz
index 1f5216c..afef8cf 100644
Binary files a/sitemap.xml.gz and b/sitemap.xml.gz differ