From 996aaf5374274a619b25fd26fe86cd0503faac9e Mon Sep 17 00:00:00 2001
From: Pieter Pas <pieter.pas@outlook.com>
Date: Wed, 23 Aug 2023 21:03:32 +0200
Subject: [PATCH] Optional inout parameter penalties ALM

---
 .../alpaqa/implementation/outer/alm.tpp       | 41 ++++++++++++-------
 src/alpaqa/include/alpaqa/outer/alm.hpp       |  8 ++--
 src/alpaqa/src/driver/alm-driver.hpp          |  5 ++-
 src/alpaqa/src/driver/ipopt-driver.cpp        |  1 +
 src/alpaqa/src/driver/results.hpp             |  1 +
 5 files changed, 37 insertions(+), 19 deletions(-)
diff --git a/src/alpaqa/include/alpaqa/implementation/outer/alm.tpp b/src/alpaqa/include/alpaqa/implementation/outer/alm.tpp
index 6d82e3cbf6..6a9a10591d 100644
--- a/src/alpaqa/include/alpaqa/implementation/outer/alm.tpp
+++ b/src/alpaqa/include/alpaqa/implementation/outer/alm.tpp
@@ -17,7 +17,8 @@ namespace alpaqa {
 
 template <class InnerSolverT>
 typename ALMSolver<InnerSolverT>::Stats
-ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
+ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y,
+                                    std::optional<rvec> Σ) {
     using std::chrono::duration_cast;
     using std::chrono::nanoseconds;
     auto start_time = std::chrono::steady_clock::now();
@@ -25,10 +26,13 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
     // Check the problem dimensions etc.
     p.check();
 
+    if (params.max_iter == 0)
+        return {.status=SolverStatus::MaxIter};
+
     auto m = p.get_m();
     if (m == 0) { // No general constraints, only box constraints
         Stats s;
-        vec Σ(0), error(0);
+        vec Σ_curr(0), error(0);
         InnerSolveOptions<config_t> opts{
             .always_overwrite_results = true,
             .max_time                 = params.max_time,
@@ -36,7 +40,7 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
             .os                       = os,
             .check                    = false,
         };
-        auto ps              = inner_solver(p, opts, x, y, Σ, error);
+        auto ps              = inner_solver(p, opts, x, y, Σ_curr, error);
         bool inner_converged = ps.status == SolverStatus::Converged;
         auto time_elapsed    = std::chrono::steady_clock::now() - start_time;
         s.inner_convergence_failures = not inner_converged;
@@ -51,7 +55,7 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
     }
 
     constexpr auto NaN               = alpaqa::NaN<config_t>;
-    vec Σ                            = vec::Constant(m, NaN);
+    vec Σ_curr                       = vec::Constant(m, NaN);
     vec Σ_old                        = vec::Constant(m, NaN);
     vec error_1                      = vec::Constant(m, NaN);
     vec error_2                      = vec::Constant(m, NaN);
@@ -65,13 +69,16 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
 
     Stats s;
 
+    if (Σ && Σ->allFinite() && Σ->norm() > 0) {
+        Σ_curr = *Σ;
+    }
     // Initialize the penalty weights
-    if (params.initial_penalty > 0) {
-        Σ.fill(params.initial_penalty);
+    else if (params.initial_penalty > 0) {
+        Σ_curr.fill(params.initial_penalty);
     }
     // Initial penalty weights from problem
     else {
-        Helpers::initialize_penalty(p, params, x, Σ);
+        Helpers::initialize_penalty(p, params, x, Σ_curr);
     }
 
     real_t ε                      = params.initial_tolerance;
@@ -112,7 +119,7 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
         };
         // Call the inner solver to minimize the augmented lagrangian for fixed
         // Lagrange multipliers y.
-        auto ps = inner_solver(p, opts, x, y, Σ, error_2);
+        auto ps = inner_solver(p, opts, x, y, Σ_curr, error_2);
         // Check if the inner solver converged
         bool inner_converged = ps.status == SolverStatus::Converged;
         // Accumulate the inner solver statistics
@@ -130,7 +137,7 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
             const char *color = inner_converged ? "\x1b[0;32m" : "\x1b[0;31m";
             const char *color_end = "\x1b[0m";
             *os << "[\x1b[0;34mALM\x1b[0m]   " << std::setw(5) << i
-                << ": ‖Σ‖ = " << print_real(Σ.norm())
+                << ": ‖Σ‖ = " << print_real(Σ_curr.norm())
                 << ", ‖y‖ = " << print_real(y.norm())
                 << ", δ = " << print_real(δ) << ", ε = " << print_real(ps.ε)
                 << ", Δ = " << print_real(Δ) << ", status = " << color
@@ -143,10 +150,12 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
         if (ps.status == SolverStatus::Interrupted) {
             s.ε                = ps.ε;
             s.δ                = vec_util::norm_inf(error_2);
-            s.norm_penalty     = Σ.norm();
+            s.norm_penalty     = Σ_curr.norm() / std::sqrt(real_t(m));
             s.outer_iterations = i + 1;
             s.elapsed_time     = duration_cast<nanoseconds>(time_elapsed);
             s.status           = ps.status;
+            if (Σ)
+                *Σ = Σ_curr;
             return s;
         }
 
@@ -171,7 +180,7 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
                               Δ * params.penalty_update_factor_lower);
                 Helpers::update_penalty_weights(params, Δ, false, error_1,
                                                 error_2, norm_e_1, norm_e_2,
-                                                Σ_old, Σ, true);
+                                                Σ_old, Σ_curr, true);
                 // Recompute the primal tolerance with larger ρ
                 ρ = std::fmin(params.ρ_max, ρ * params.ρ_increase);
                 ε = std::fmax(ρ * ε_old, params.tolerance);
@@ -179,7 +188,7 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
             } else {
                 // We don't have a previous Σ, simply lower the current Σ and
                 // increase ε
-                Σ *= params.initial_penalty_lower;
+                Σ_curr *= params.initial_penalty_lower;
                 ε *= params.initial_tolerance_increase;
                 ++s.initial_penalty_reduced;
             }
@@ -200,22 +209,24 @@ ALMSolver<InnerSolverT>::operator()(const Problem &p, rvec x, rvec y) {
             if (exit) {
                 s.ε                = ps.ε;
                 s.δ                = norm_e_1;
-                s.norm_penalty     = Σ.norm();
+                s.norm_penalty     = Σ_curr.norm() / std::sqrt(real_t(m));
                 s.outer_iterations = i + 1;
                 s.elapsed_time     = duration_cast<nanoseconds>(time_elapsed);
                 s.status           = alm_converged ? SolverStatus::Converged
                                      : out_of_time ? SolverStatus::MaxTime
                                      : out_of_iter ? SolverStatus::MaxIter
                                                    : SolverStatus::Busy;
+                if (Σ)
+                    *Σ = Σ_curr;
                 return s;
             }
             // After this line, Σ_old contains the penalty used in the current
             // (successful) iteration.
-            Σ_old.swap(Σ);
+            Σ_old.swap(Σ_curr);
             // Update Σ to contain the penalty to use on the next iteration.
             Helpers::update_penalty_weights(
                 params, Δ, num_successful_iters == 0, error_1, error_2,
-                norm_e_1, norm_e_2, Σ_old, Σ, true);
+                norm_e_1, norm_e_2, Σ_old, Σ_curr, true);
             // Lower the primal tolerance for the inner solver.
             ε_old = std::exchange(ε, std::fmax(ρ * ε, params.tolerance));
             ++num_successful_iters;
diff --git a/src/alpaqa/include/alpaqa/outer/alm.hpp b/src/alpaqa/include/alpaqa/outer/alm.hpp
index 54d13131e1..e49009a2ad 100644
--- a/src/alpaqa/include/alpaqa/outer/alm.hpp
+++ b/src/alpaqa/include/alpaqa/outer/alm.hpp
@@ -154,10 +154,12 @@ class ALMSolver {
     ALMSolver(Params params, const InnerSolver &inner_solver)
         : params(params), inner_solver(inner_solver) {}
 
-    Stats operator()(const Problem &problem, rvec x, rvec y);
+    Stats operator()(const Problem &problem, rvec x, rvec y,
+                     std::optional<rvec> Σ = std::nullopt);
     template <class P>
-    Stats operator()(const P &problem, rvec x, rvec y) {
-        return operator()(Problem::template make<P>(problem), x, y);
+    Stats operator()(const P &problem, rvec x, rvec y,
+                     std::optional<rvec> Σ = std::nullopt) {
+        return operator()(Problem::template make<P>(problem), x, y, Σ);
     }
 
     std::string get_name() const {
diff --git a/src/alpaqa/src/driver/alm-driver.hpp b/src/alpaqa/src/driver/alm-driver.hpp
index e27cc93384..6439edd14d 100644
--- a/src/alpaqa/src/driver/alm-driver.hpp
+++ b/src/alpaqa/src/driver/alm-driver.hpp
@@ -59,9 +59,11 @@ SolverResults run_alm_solver(LoadedProblem &problem, Solver &solver,
 
     // Initial guess
     vec x = problem.initial_guess_x, y = problem.initial_guess_y;
+    // Final penalties
+    vec Σ = vec::Constant(problem.problem.get_m(), alpaqa::NaN<config_t>);
 
     // Solve the problem
-    auto stats = solver(problem.problem, x, y);
+    auto stats = solver(problem.problem, x, y, Σ);
 
     // Store the evaluation counters
     auto evals = *problem.evaluations;
@@ -125,6 +127,7 @@ SolverResults run_alm_solver(LoadedProblem &problem, Solver &solver,
         .solution           = x,
         .multipliers        = y,
         .multipliers_bounds = vec(0),
+        .penalties          = Σ,
         .outer_iter         = static_cast<index_t>(stats.outer_iterations),
         .inner_iter         = static_cast<index_t>(stats.inner.iterations),
         .extra              = std::move(extra),
diff --git a/src/alpaqa/src/driver/ipopt-driver.cpp b/src/alpaqa/src/driver/ipopt-driver.cpp
index e5b64892bd..1490277a01 100644
--- a/src/alpaqa/src/driver/ipopt-driver.cpp
+++ b/src/alpaqa/src/driver/ipopt-driver.cpp
@@ -86,6 +86,7 @@ SolverResults run_ipopt_solver(auto &problem,
         .solution           = nlp_res.solution_x,
         .multipliers        = nlp_res.solution_y,
         .multipliers_bounds = vec(problem.problem.get_n() * 2), // see below
+        .penalties          = vec::Zero(problem.problem.get_n()),
         .outer_iter         = nlp_res.iter_count,
         .inner_iter         = nlp_res.iter_count,
         .extra              = {},
diff --git a/src/alpaqa/src/driver/results.hpp b/src/alpaqa/src/driver/results.hpp
index 64ff03eece..875397236c 100644
--- a/src/alpaqa/src/driver/results.hpp
+++ b/src/alpaqa/src/driver/results.hpp
@@ -30,6 +30,7 @@ struct SolverResults {
     vec solution{};
     vec multipliers{};
     vec multipliers_bounds{};
+    vec penalties{};
     index_t outer_iter = -1, inner_iter = -1;
     using any_stat_t = std::variant<index_t, real_t, std::string, bool, vec,
                                     std::vector<real_t>>;