diff --git a/src/QMCWaveFunctions/BsplineFactory/SplineC2RT.cpp b/src/QMCWaveFunctions/BsplineFactory/SplineC2RT.cpp
new file mode 100644
index 00000000000..a1e1649b638
--- /dev/null
+++ b/src/QMCWaveFunctions/BsplineFactory/SplineC2RT.cpp
@@ -0,0 +1,1188 @@
+//////////////////////////////////////////////////////////////////////////////////////
+// This file is distributed under the University of Illinois/NCSA Open Source License.
+// See LICENSE file in top directory for details.
+//
+// Copyright (c) 2019 QMCPACK developers.
+//
+// File developed by: Jeremy McMinnis, jmcminis@gmail.com, University of Illinois at Urbana-Champaign
+//                    Jeongnim Kim, jeongnim.kim@intel.com, University of Illinois at Urbana-Champaign
+//                    Ye Luo, yeluo@anl.gov, Argonne National Laboratory
+//                    Anouar Benali, benali@anl.gov, Argonne National Laboratory
+//                    Mark A. Berrill, berrillma@ornl.gov, Oak Ridge National Laboratory
+//
+// File created by: Jeongnim Kim, jeongnim.kim@gmail.com, University of Illinois at Urbana-Champaign
+//////////////////////////////////////////////////////////////////////////////////////
+
+
+#include "Concurrency/OpenMP.h"
+#include "SplineC2R.h"
+#include "spline2/MultiBsplineEval.hpp"
+#include "QMCWaveFunctions/BsplineFactory/contraction_helper.hpp"
+#include "CPU/math.hpp"
+
+namespace qmcplusplus
+{
+template<typename ST>
+SplineC2R<ST>::SplineC2R(const SplineC2R& in) = default;
+
+template<typename ST>
+inline void SplineC2R<ST>::set_spline(SingleSplineType* spline_r,
+                                      SingleSplineType* spline_i,
+                                      int twist,
+                                      int ispline,
+                                      int level)
+{
+  SplineInst->copy_spline(spline_r, 2 * ispline);
+  SplineInst->copy_spline(spline_i, 2 * ispline + 1);
+}
+
+template<typename ST>
+bool SplineC2R<ST>::read_splines(hdf_archive& h5f)
+{
+  std::ostringstream o;
+  o << "spline_" << MyIndex;
+  einspline_engine<SplineType> bigtable(SplineInst->getSplinePtr());
+  return h5f.readEntry(bigtable, o.str().c_str()); //"spline_0");
+}
+
+template<typename ST>
+bool SplineC2R<ST>::write_splines(hdf_archive& h5f)
+{
+  std::ostringstream o;
+  o << "spline_" << MyIndex;
+  einspline_engine<SplineType> bigtable(SplineInst->getSplinePtr());
+  return h5f.writeEntry(bigtable, o.str().c_str()); //"spline_0");
+}
+
+template<typename ST>
+inline void SplineC2R<ST>::assign_v(const PointType& r,
+                                    const vContainer_type& myV,
+                                    ValueVector& psi,
+                                    int first,
+                                    int last) const
+{
+  // protect last
+  last = last > kPoints.size() ? kPoints.size() : last;
+
+  const ST x = r[0], y = r[1], z = r[2];
+  const ST* restrict kx = myKcart.data(0);
+  const ST* restrict ky = myKcart.data(1);
+  const ST* restrict kz = myKcart.data(2);
+
+  TT* restrict psi_s              = psi.data() + first_spo;
+  const size_t requested_orb_size = psi.size();
+#pragma omp simd
+  for (size_t j = first; j < std::min(nComplexBands, last); j++)
+  {
+    ST s, c;
+    const size_t jr = j << 1;
+    const size_t ji = jr + 1;
+    const ST val_r  = myV[jr];
+    const ST val_i  = myV[ji];
+    qmcplusplus::sincos(-(x * kx[j] + y * ky[j] + z * kz[j]), &s, &c);
+    if (jr < requested_orb_size)
+      psi_s[jr] = val_r * c - val_i * s;
+    if (ji < requested_orb_size)
+      psi_s[ji] = val_i * c + val_r * s;
+  }
+
+  psi_s += nComplexBands;
+#pragma omp simd
+  for (size_t j = std::max(nComplexBands, first); j < last; j++)
+  {
+    ST s, c;
+    const ST val_r = myV[2 * j];
+    const ST val_i = myV[2 * j + 1];
+    qmcplusplus::sincos(-(x * kx[j] + y * ky[j] + z * kz[j]), &s, &c);
+    if (j < requested_orb_size)
+      psi_s[j] = val_r * c - val_i * s;
+  }
+}
+
+template<typename ST>
+void SplineC2R<ST>::evaluateValue(const ParticleSet& P, const int iat, ValueVector& psi)
+{
+  const PointType& r = P.activeR(iat);
+  PointType ru(PrimLattice.toUnit_floor(r));
+
+#pragma omp parallel
+  {
+    int first, last;
+    FairDivideAligned(myV.size(), getAlignment<ST>(), omp_get_num_threads(), omp_get_thread_num(), first, last);
+
+    spline2::evaluate3d(SplineInst->getSplinePtr(), ru, myV, first, last);
+    assign_v(r, myV, psi, first / 2, last / 2);
+  }
+}
+
+template<typename ST>
+void SplineC2R<ST>::evaluateDetRatios(const VirtualParticleSet& VP,
+                                      ValueVector& psi,
+                                      const ValueVector& psiinv,
+                                      std::vector<TT>& ratios)
+{
+  const bool need_resize = ratios_private.rows() < VP.getTotalNum();
+
+#pragma omp parallel
+  {
+    int tid = omp_get_thread_num();
+    // initialize thread private ratios
+    if (need_resize)
+    {
+      if (tid == 0) // just like #pragma omp master, but one fewer call to the runtime
+        ratios_private.resize(VP.getTotalNum(), omp_get_num_threads());
+#pragma omp barrier
+    }
+    int first, last;
+    FairDivideAligned(myV.size(), getAlignment<ST>(), omp_get_num_threads(), tid, first, last);
+    const int first_cplx = first / 2;
+    const int last_cplx  = kPoints.size() < last / 2 ? kPoints.size() : last / 2;
+
+    for (int iat = 0; iat < VP.getTotalNum(); ++iat)
+    {
+      const PointType& r = VP.activeR(iat);
+      PointType ru(PrimLattice.toUnit_floor(r));
+
+      spline2::evaluate3d(SplineInst->getSplinePtr(), ru, myV, first, last);
+      assign_v(r, myV, psi, first_cplx, last_cplx);
+
+      const int first_real     = first_cplx + std::min(nComplexBands, first_cplx);
+      const int last_real      = last_cplx + std::min(nComplexBands, last_cplx);
+      ratios_private[iat][tid] = simd::dot(psi.data() + first_real, psiinv.data() + first_real, last_real - first_real);
+    }
+  }
+
+  // do the reduction manually
+  for (int iat = 0; iat < VP.getTotalNum(); ++iat)
+  {
+    ratios[iat] = TT(0);
+    for (int tid = 0; tid < ratios_private.cols(); tid++)
+      ratios[iat] += ratios_private[iat][tid];
+  }
+}
+
+/** assign_vgl
+   */
+template<typename ST>
+inline void SplineC2R<ST>::assign_vgl(const PointType& r,
+                                      ValueVector& psi,
+                                      GradVector& dpsi,
+                                      ValueVector& d2psi,
+                                      int first,
+                                      int last) const
+{
+  // protect last
+  last = last > kPoints.size() ? kPoints.size() : last;
+
+  constexpr ST two(2);
+  const ST g00 = PrimLattice.G(0), g01 = PrimLattice.G(1), g02 = PrimLattice.G(2), g10 = PrimLattice.G(3),
+           g11 = PrimLattice.G(4), g12 = PrimLattice.G(5), g20 = PrimLattice.G(6), g21 = PrimLattice.G(7),
+           g22 = PrimLattice.G(8);
+  const ST x = r[0], y = r[1], z = r[2];
+  const ST symGG[6] = {GGt[0], GGt[1] + GGt[3], GGt[2] + GGt[6], GGt[4], GGt[5] + GGt[7], GGt[8]};
+
+  const ST* restrict k0 = myKcart.data(0);
+  ASSUME_ALIGNED(k0);
+  const ST* restrict k1 = myKcart.data(1);
+  ASSUME_ALIGNED(k1);
+  const ST* restrict k2 = myKcart.data(2);
+  ASSUME_ALIGNED(k2);
+
+  const ST* restrict g0 = myG.data(0);
+  ASSUME_ALIGNED(g0);
+  const ST* restrict g1 = myG.data(1);
+  ASSUME_ALIGNED(g1);
+  const ST* restrict g2 = myG.data(2);
+  ASSUME_ALIGNED(g2);
+  const ST* restrict h00 = myH.data(0);
+  ASSUME_ALIGNED(h00);
+  const ST* restrict h01 = myH.data(1);
+  ASSUME_ALIGNED(h01);
+  const ST* restrict h02 = myH.data(2);
+  ASSUME_ALIGNED(h02);
+  const ST* restrict h11 = myH.data(3);
+  ASSUME_ALIGNED(h11);
+  const ST* restrict h12 = myH.data(4);
+  ASSUME_ALIGNED(h12);
+  const ST* restrict h22 = myH.data(5);
+  ASSUME_ALIGNED(h22);
+
+  const size_t requested_orb_size = psi.size();
+#pragma omp simd
+  for (size_t j = first; j < std::min(nComplexBands, last); j++)
+  {
+    const size_t jr = j << 1;
+    const size_t ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g00 * g0[jr] + g01 * g1[jr] + g02 * g2[jr];
+    const ST dY_r = g10 * g0[jr] + g11 * g1[jr] + g12 * g2[jr];
+    const ST dZ_r = g20 * g0[jr] + g21 * g1[jr] + g22 * g2[jr];
+
+    const ST dX_i = g00 * g0[ji] + g01 * g1[ji] + g02 * g2[ji];
+    const ST dY_i = g10 * g0[ji] + g11 * g1[ji] + g12 * g2[ji];
+    const ST dZ_i = g20 * g0[ji] + g21 * g1[ji] + g22 * g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r = dX_r + val_i * kX;
+    const ST gY_r = dY_r + val_i * kY;
+    const ST gZ_r = dZ_r + val_i * kZ;
+    const ST gX_i = dX_i - val_r * kX;
+    const ST gY_i = dY_i - val_r * kY;
+    const ST gZ_i = dZ_i - val_r * kZ;
+
+    const ST lcart_r = SymTrace(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], symGG);
+    const ST lcart_i = SymTrace(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], symGG);
+    const ST lap_r   = lcart_r + mKK[j] * val_r + two * (kX * dX_i + kY * dY_i + kZ * dZ_i);
+    const ST lap_i   = lcart_i + mKK[j] * val_i - two * (kX * dX_r + kY * dY_r + kZ * dZ_r);
+
+    const size_t psiIndex = first_spo + jr;
+    if (psiIndex < requested_orb_size)
+    {
+      psi[psiIndex]     = c * val_r - s * val_i;
+      dpsi[psiIndex][0] = c * gX_r - s * gX_i;
+      dpsi[psiIndex][1] = c * gY_r - s * gY_i;
+      dpsi[psiIndex][2] = c * gZ_r - s * gZ_i;
+      d2psi[psiIndex]   = c * lap_r - s * lap_i;
+    }
+    if (psiIndex + 1 < requested_orb_size)
+    {
+      psi[psiIndex + 1]     = c * val_i + s * val_r;
+      dpsi[psiIndex + 1][0] = c * gX_i + s * gX_r;
+      dpsi[psiIndex + 1][1] = c * gY_i + s * gY_r;
+      dpsi[psiIndex + 1][2] = c * gZ_i + s * gZ_r;
+      d2psi[psiIndex + 1]   = c * lap_i + s * lap_r;
+    }
+  }
+
+#pragma omp simd
+  for (size_t j = std::max(nComplexBands, first); j < last; j++)
+  {
+    const size_t jr = j << 1;
+    const size_t ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g00 * g0[jr] + g01 * g1[jr] + g02 * g2[jr];
+    const ST dY_r = g10 * g0[jr] + g11 * g1[jr] + g12 * g2[jr];
+    const ST dZ_r = g20 * g0[jr] + g21 * g1[jr] + g22 * g2[jr];
+
+    const ST dX_i = g00 * g0[ji] + g01 * g1[ji] + g02 * g2[ji];
+    const ST dY_i = g10 * g0[ji] + g11 * g1[ji] + g12 * g2[ji];
+    const ST dZ_i = g20 * g0[ji] + g21 * g1[ji] + g22 * g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r = dX_r + val_i * kX;
+    const ST gY_r = dY_r + val_i * kY;
+    const ST gZ_r = dZ_r + val_i * kZ;
+    const ST gX_i = dX_i - val_r * kX;
+    const ST gY_i = dY_i - val_r * kY;
+    const ST gZ_i = dZ_i - val_r * kZ;
+
+    if (const size_t psiIndex = first_spo + nComplexBands + j; psiIndex < requested_orb_size)
+    {
+      psi[psiIndex]     = c * val_r - s * val_i;
+      dpsi[psiIndex][0] = c * gX_r - s * gX_i;
+      dpsi[psiIndex][1] = c * gY_r - s * gY_i;
+      dpsi[psiIndex][2] = c * gZ_r - s * gZ_i;
+
+      const ST lcart_r = SymTrace(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], symGG);
+      const ST lcart_i = SymTrace(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], symGG);
+      const ST lap_r   = lcart_r + mKK[j] * val_r + two * (kX * dX_i + kY * dY_i + kZ * dZ_i);
+      const ST lap_i   = lcart_i + mKK[j] * val_i - two * (kX * dX_r + kY * dY_r + kZ * dZ_r);
+      d2psi[psiIndex]  = c * lap_r - s * lap_i;
+    }
+  }
+}
+
+/** assign_vgl_from_l can be used when myL is precomputed and myV,myG,myL in cartesian
+   */
+template<typename ST>
+inline void SplineC2R<ST>::assign_vgl_from_l(const PointType& r, ValueVector& psi, GradVector& dpsi, ValueVector& d2psi)
+{
+  constexpr ST two(2);
+  const ST x = r[0], y = r[1], z = r[2];
+
+  const ST* restrict k0 = myKcart.data(0);
+  ASSUME_ALIGNED(k0);
+  const ST* restrict k1 = myKcart.data(1);
+  ASSUME_ALIGNED(k1);
+  const ST* restrict k2 = myKcart.data(2);
+  ASSUME_ALIGNED(k2);
+
+  const ST* restrict g0 = myG.data(0);
+  ASSUME_ALIGNED(g0);
+  const ST* restrict g1 = myG.data(1);
+  ASSUME_ALIGNED(g1);
+  const ST* restrict g2 = myG.data(2);
+  ASSUME_ALIGNED(g2);
+
+  const size_t N = kPoints.size();
+
+#pragma omp simd
+  for (size_t j = 0; j < nComplexBands; j++)
+  {
+    const size_t jr = j << 1;
+    const size_t ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g0[jr];
+    const ST dY_r = g1[jr];
+    const ST dZ_r = g2[jr];
+
+    const ST dX_i = g0[ji];
+    const ST dY_i = g1[ji];
+    const ST dZ_i = g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r = dX_r + val_i * kX;
+    const ST gY_r = dY_r + val_i * kY;
+    const ST gZ_r = dZ_r + val_i * kZ;
+    const ST gX_i = dX_i - val_r * kX;
+    const ST gY_i = dY_i - val_r * kY;
+    const ST gZ_i = dZ_i - val_r * kZ;
+
+    const ST lap_r = myL[jr] + mKK[j] * val_r + two * (kX * dX_i + kY * dY_i + kZ * dZ_i);
+    const ST lap_i = myL[ji] + mKK[j] * val_i - two * (kX * dX_r + kY * dY_r + kZ * dZ_r);
+
+    const size_t psiIndex = first_spo + jr;
+    psi[psiIndex]         = c * val_r - s * val_i;
+    psi[psiIndex + 1]     = c * val_i + s * val_r;
+    d2psi[psiIndex]       = c * lap_r - s * lap_i;
+    d2psi[psiIndex + 1]   = c * lap_i + s * lap_r;
+    dpsi[psiIndex][0]     = c * gX_r - s * gX_i;
+    dpsi[psiIndex][1]     = c * gY_r - s * gY_i;
+    dpsi[psiIndex][2]     = c * gZ_r - s * gZ_i;
+    dpsi[psiIndex + 1][0] = c * gX_i + s * gX_r;
+    dpsi[psiIndex + 1][1] = c * gY_i + s * gY_r;
+    dpsi[psiIndex + 1][2] = c * gZ_i + s * gZ_r;
+  }
+
+#pragma omp simd
+  for (size_t j = nComplexBands; j < N; j++)
+  {
+    const size_t jr = j << 1;
+    const size_t ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g0[jr];
+    const ST dY_r = g1[jr];
+    const ST dZ_r = g2[jr];
+
+    const ST dX_i = g0[ji];
+    const ST dY_i = g1[ji];
+    const ST dZ_i = g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r         = dX_r + val_i * kX;
+    const ST gY_r         = dY_r + val_i * kY;
+    const ST gZ_r         = dZ_r + val_i * kZ;
+    const ST gX_i         = dX_i - val_r * kX;
+    const ST gY_i         = dY_i - val_r * kY;
+    const ST gZ_i         = dZ_i - val_r * kZ;
+    const size_t psiIndex = first_spo + nComplexBands + j;
+    psi[psiIndex]         = c * val_r - s * val_i;
+    dpsi[psiIndex][0]     = c * gX_r - s * gX_i;
+    dpsi[psiIndex][1]     = c * gY_r - s * gY_i;
+    dpsi[psiIndex][2]     = c * gZ_r - s * gZ_i;
+
+    const ST lap_r  = myL[jr] + mKK[j] * val_r + two * (kX * dX_i + kY * dY_i + kZ * dZ_i);
+    const ST lap_i  = myL[ji] + mKK[j] * val_i - two * (kX * dX_r + kY * dY_r + kZ * dZ_r);
+    d2psi[psiIndex] = c * lap_r - s * lap_i;
+  }
+}
+
+template<typename ST>
+void SplineC2R<ST>::evaluateVGL(const ParticleSet& P,
+                                const int iat,
+                                ValueVector& psi,
+                                GradVector& dpsi,
+                                ValueVector& d2psi)
+{
+  const PointType& r = P.activeR(iat);
+  PointType ru(PrimLattice.toUnit_floor(r));
+
+#pragma omp parallel
+  {
+    int first, last;
+    FairDivideAligned(myV.size(), getAlignment<ST>(), omp_get_num_threads(), omp_get_thread_num(), first, last);
+
+    spline2::evaluate3d_vgh(SplineInst->getSplinePtr(), ru, myV, myG, myH, first, last);
+    assign_vgl(r, psi, dpsi, d2psi, first / 2, last / 2);
+  }
+}
+
+template<typename ST>
+void SplineC2R<ST>::assign_vgh(const PointType& r,
+                               ValueVector& psi,
+                               GradVector& dpsi,
+                               HessVector& grad_grad_psi,
+                               int first,
+                               int last) const
+{
+  // protect last
+  last = last > kPoints.size() ? kPoints.size() : last;
+
+  const ST g00 = PrimLattice.G(0), g01 = PrimLattice.G(1), g02 = PrimLattice.G(2), g10 = PrimLattice.G(3),
+           g11 = PrimLattice.G(4), g12 = PrimLattice.G(5), g20 = PrimLattice.G(6), g21 = PrimLattice.G(7),
+           g22 = PrimLattice.G(8);
+  const ST x = r[0], y = r[1], z = r[2];
+
+  const ST* restrict k0 = myKcart.data(0);
+  const ST* restrict k1 = myKcart.data(1);
+  const ST* restrict k2 = myKcart.data(2);
+
+  const ST* restrict g0  = myG.data(0);
+  const ST* restrict g1  = myG.data(1);
+  const ST* restrict g2  = myG.data(2);
+  const ST* restrict h00 = myH.data(0);
+  const ST* restrict h01 = myH.data(1);
+  const ST* restrict h02 = myH.data(2);
+  const ST* restrict h11 = myH.data(3);
+  const ST* restrict h12 = myH.data(4);
+  const ST* restrict h22 = myH.data(5);
+
+#pragma omp simd
+  for (size_t j = first; j < std::min(nComplexBands, last); j++)
+  {
+    int jr = j << 1;
+    int ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g00 * g0[jr] + g01 * g1[jr] + g02 * g2[jr];
+    const ST dY_r = g10 * g0[jr] + g11 * g1[jr] + g12 * g2[jr];
+    const ST dZ_r = g20 * g0[jr] + g21 * g1[jr] + g22 * g2[jr];
+
+    const ST dX_i = g00 * g0[ji] + g01 * g1[ji] + g02 * g2[ji];
+    const ST dY_i = g10 * g0[ji] + g11 * g1[ji] + g12 * g2[ji];
+    const ST dZ_i = g20 * g0[ji] + g21 * g1[ji] + g22 * g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r = dX_r + val_i * kX;
+    const ST gY_r = dY_r + val_i * kY;
+    const ST gZ_r = dZ_r + val_i * kZ;
+    const ST gX_i = dX_i - val_r * kX;
+    const ST gY_i = dY_i - val_r * kY;
+    const ST gZ_i = dZ_i - val_r * kZ;
+
+    const size_t psiIndex = first_spo + jr;
+
+    psi[psiIndex]     = c * val_r - s * val_i;
+    dpsi[psiIndex][0] = c * gX_r - s * gX_i;
+    dpsi[psiIndex][1] = c * gY_r - s * gY_i;
+    dpsi[psiIndex][2] = c * gZ_r - s * gZ_i;
+
+    psi[psiIndex + 1]     = c * val_i + s * val_r;
+    dpsi[psiIndex + 1][0] = c * gX_i + s * gX_r;
+    dpsi[psiIndex + 1][1] = c * gY_i + s * gY_r;
+    dpsi[psiIndex + 1][2] = c * gZ_i + s * gZ_r;
+
+    const ST h_xx_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g00, g01, g02) + kX * (gX_i + dX_i);
+    const ST h_xy_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g10, g11, g12) + kX * (gY_i + dY_i);
+    const ST h_xz_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g20, g21, g22) + kX * (gZ_i + dZ_i);
+    const ST h_yx_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g00, g01, g02) + kY * (gX_i + dX_i);
+    const ST h_yy_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g10, g11, g12) + kY * (gY_i + dY_i);
+    const ST h_yz_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g20, g21, g22) + kY * (gZ_i + dZ_i);
+    const ST h_zx_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g00, g01, g02) + kZ * (gX_i + dX_i);
+    const ST h_zy_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g10, g11, g12) + kZ * (gY_i + dY_i);
+    const ST h_zz_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g20, g21, g22) + kZ * (gZ_i + dZ_i);
+
+    const ST h_xx_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g00, g01, g02) - kX * (gX_r + dX_r);
+    const ST h_xy_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g10, g11, g12) - kX * (gY_r + dY_r);
+    const ST h_xz_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g20, g21, g22) - kX * (gZ_r + dZ_r);
+    const ST h_yx_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g00, g01, g02) - kY * (gX_r + dX_r);
+    const ST h_yy_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g10, g11, g12) - kY * (gY_r + dY_r);
+    const ST h_yz_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g20, g21, g22) - kY * (gZ_r + dZ_r);
+    const ST h_zx_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g00, g01, g02) - kZ * (gX_r + dX_r);
+    const ST h_zy_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g10, g11, g12) - kZ * (gY_r + dY_r);
+    const ST h_zz_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g20, g21, g22) - kZ * (gZ_r + dZ_r);
+
+    grad_grad_psi[psiIndex][0] = c * h_xx_r - s * h_xx_i;
+    grad_grad_psi[psiIndex][1] = c * h_xy_r - s * h_xy_i;
+    grad_grad_psi[psiIndex][2] = c * h_xz_r - s * h_xz_i;
+    grad_grad_psi[psiIndex][3] = c * h_yx_r - s * h_yx_i;
+    grad_grad_psi[psiIndex][4] = c * h_yy_r - s * h_yy_i;
+    grad_grad_psi[psiIndex][5] = c * h_yz_r - s * h_yz_i;
+    grad_grad_psi[psiIndex][6] = c * h_zx_r - s * h_zx_i;
+    grad_grad_psi[psiIndex][7] = c * h_zy_r - s * h_zy_i;
+    grad_grad_psi[psiIndex][8] = c * h_zz_r - s * h_zz_i;
+
+    grad_grad_psi[psiIndex + 1][0] = c * h_xx_i + s * h_xx_r;
+    grad_grad_psi[psiIndex + 1][1] = c * h_xy_i + s * h_xy_r;
+    grad_grad_psi[psiIndex + 1][2] = c * h_xz_i + s * h_xz_r;
+    grad_grad_psi[psiIndex + 1][3] = c * h_yx_i + s * h_yx_r;
+    grad_grad_psi[psiIndex + 1][4] = c * h_yy_i + s * h_yy_r;
+    grad_grad_psi[psiIndex + 1][5] = c * h_yz_i + s * h_yz_r;
+    grad_grad_psi[psiIndex + 1][6] = c * h_zx_i + s * h_zx_r;
+    grad_grad_psi[psiIndex + 1][7] = c * h_zy_i + s * h_zy_r;
+    grad_grad_psi[psiIndex + 1][8] = c * h_zz_i + s * h_zz_r;
+  }
+
+#pragma omp simd
+  for (size_t j = std::max(nComplexBands, first); j < last; j++)
+  {
+    int jr = j << 1;
+    int ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g00 * g0[jr] + g01 * g1[jr] + g02 * g2[jr];
+    const ST dY_r = g10 * g0[jr] + g11 * g1[jr] + g12 * g2[jr];
+    const ST dZ_r = g20 * g0[jr] + g21 * g1[jr] + g22 * g2[jr];
+
+    const ST dX_i = g00 * g0[ji] + g01 * g1[ji] + g02 * g2[ji];
+    const ST dY_i = g10 * g0[ji] + g11 * g1[ji] + g12 * g2[ji];
+    const ST dZ_i = g20 * g0[ji] + g21 * g1[ji] + g22 * g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r = dX_r + val_i * kX;
+    const ST gY_r = dY_r + val_i * kY;
+    const ST gZ_r = dZ_r + val_i * kZ;
+    const ST gX_i = dX_i - val_r * kX;
+    const ST gY_i = dY_i - val_r * kY;
+    const ST gZ_i = dZ_i - val_r * kZ;
+
+    const size_t psiIndex = first_spo + nComplexBands + j;
+
+    psi[psiIndex]     = c * val_r - s * val_i;
+    dpsi[psiIndex][0] = c * gX_r - s * gX_i;
+    dpsi[psiIndex][1] = c * gY_r - s * gY_i;
+    dpsi[psiIndex][2] = c * gZ_r - s * gZ_i;
+
+    const ST h_xx_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g00, g01, g02) + kX * (gX_i + dX_i);
+    const ST h_xy_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g10, g11, g12) + kX * (gY_i + dY_i);
+    const ST h_xz_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g20, g21, g22) + kX * (gZ_i + dZ_i);
+    const ST h_yx_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g00, g01, g02) + kY * (gX_i + dX_i);
+    const ST h_yy_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g10, g11, g12) + kY * (gY_i + dY_i);
+    const ST h_yz_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g20, g21, g22) + kY * (gZ_i + dZ_i);
+    const ST h_zx_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g00, g01, g02) + kZ * (gX_i + dX_i);
+    const ST h_zy_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g10, g11, g12) + kZ * (gY_i + dY_i);
+    const ST h_zz_r =
+        v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g20, g21, g22) + kZ * (gZ_i + dZ_i);
+
+    const ST h_xx_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g00, g01, g02) - kX * (gX_r + dX_r);
+    const ST h_xy_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g10, g11, g12) - kX * (gY_r + dY_r);
+    const ST h_xz_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g20, g21, g22) - kX * (gZ_r + dZ_r);
+    const ST h_yx_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g00, g01, g02) - kY * (gX_r + dX_r);
+    const ST h_yy_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g10, g11, g12) - kY * (gY_r + dY_r);
+    const ST h_yz_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g20, g21, g22) - kY * (gZ_r + dZ_r);
+    const ST h_zx_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g00, g01, g02) - kZ * (gX_r + dX_r);
+    const ST h_zy_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g10, g11, g12) - kZ * (gY_r + dY_r);
+    const ST h_zz_i =
+        v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g20, g21, g22) - kZ * (gZ_r + dZ_r);
+
+    grad_grad_psi[psiIndex][0] = c * h_xx_r - s * h_xx_i;
+    grad_grad_psi[psiIndex][1] = c * h_xy_r - s * h_xy_i;
+    grad_grad_psi[psiIndex][2] = c * h_xz_r - s * h_xz_i;
+    grad_grad_psi[psiIndex][3] = c * h_yx_r - s * h_yx_i;
+    grad_grad_psi[psiIndex][4] = c * h_yy_r - s * h_yy_i;
+    grad_grad_psi[psiIndex][5] = c * h_yz_r - s * h_yz_i;
+    grad_grad_psi[psiIndex][6] = c * h_zx_r - s * h_zx_i;
+    grad_grad_psi[psiIndex][7] = c * h_zy_r - s * h_zy_i;
+    grad_grad_psi[psiIndex][8] = c * h_zz_r - s * h_zz_i;
+  }
+}
+
+template<typename ST>
+void SplineC2R<ST>::evaluateVGH(const ParticleSet& P,
+                                const int iat,
+                                ValueVector& psi,
+                                GradVector& dpsi,
+                                HessVector& grad_grad_psi)
+{
+  const PointType& r = P.activeR(iat);
+  PointType ru(PrimLattice.toUnit_floor(r));
+#pragma omp parallel
+  {
+    int first, last;
+    FairDivideAligned(myV.size(), getAlignment<ST>(), omp_get_num_threads(), omp_get_thread_num(), first, last);
+
+    spline2::evaluate3d_vgh(SplineInst->getSplinePtr(), ru, myV, myG, myH, first, last);
+    assign_vgh(r, psi, dpsi, grad_grad_psi, first / 2, last / 2);
+  }
+}
+
+template<typename ST>
+void SplineC2R<ST>::assign_vghgh(const PointType& r,
+                                 ValueVector& psi,
+                                 GradVector& dpsi,
+                                 HessVector& grad_grad_psi,
+                                 GGGVector& grad_grad_grad_psi,
+                                 int first,
+                                 int last) const
+{
+  // protect last
+  last = last < 0 ? kPoints.size() : (last > kPoints.size() ? kPoints.size() : last);
+
+  const ST g00 = PrimLattice.G(0), g01 = PrimLattice.G(1), g02 = PrimLattice.G(2), g10 = PrimLattice.G(3),
+           g11 = PrimLattice.G(4), g12 = PrimLattice.G(5), g20 = PrimLattice.G(6), g21 = PrimLattice.G(7),
+           g22 = PrimLattice.G(8);
+  const ST x = r[0], y = r[1], z = r[2];
+
+  const ST* restrict k0 = myKcart.data(0);
+  const ST* restrict k1 = myKcart.data(1);
+  const ST* restrict k2 = myKcart.data(2);
+
+  const ST* restrict g0  = myG.data(0);
+  const ST* restrict g1  = myG.data(1);
+  const ST* restrict g2  = myG.data(2);
+  const ST* restrict h00 = myH.data(0);
+  const ST* restrict h01 = myH.data(1);
+  const ST* restrict h02 = myH.data(2);
+  const ST* restrict h11 = myH.data(3);
+  const ST* restrict h12 = myH.data(4);
+  const ST* restrict h22 = myH.data(5);
+
+  const ST* restrict gh000 = mygH.data(0);
+  const ST* restrict gh001 = mygH.data(1);
+  const ST* restrict gh002 = mygH.data(2);
+  const ST* restrict gh011 = mygH.data(3);
+  const ST* restrict gh012 = mygH.data(4);
+  const ST* restrict gh022 = mygH.data(5);
+  const ST* restrict gh111 = mygH.data(6);
+  const ST* restrict gh112 = mygH.data(7);
+  const ST* restrict gh122 = mygH.data(8);
+  const ST* restrict gh222 = mygH.data(9);
+
+//SIMD doesn't work quite right yet.  Comment out until further debugging.
+#pragma omp simd
+  for (size_t j = first; j < std::min(nComplexBands, last); j++)
+  {
+    int jr = j << 1;
+    int ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g00 * g0[jr] + g01 * g1[jr] + g02 * g2[jr];
+    const ST dY_r = g10 * g0[jr] + g11 * g1[jr] + g12 * g2[jr];
+    const ST dZ_r = g20 * g0[jr] + g21 * g1[jr] + g22 * g2[jr];
+
+    const ST dX_i = g00 * g0[ji] + g01 * g1[ji] + g02 * g2[ji];
+    const ST dY_i = g10 * g0[ji] + g11 * g1[ji] + g12 * g2[ji];
+    const ST dZ_i = g20 * g0[ji] + g21 * g1[ji] + g22 * g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r = dX_r + val_i * kX;
+    const ST gY_r = dY_r + val_i * kY;
+    const ST gZ_r = dZ_r + val_i * kZ;
+    const ST gX_i = dX_i - val_r * kX;
+    const ST gY_i = dY_i - val_r * kY;
+    const ST gZ_i = dZ_i - val_r * kZ;
+
+    const size_t psiIndex = first_spo + jr;
+    psi[psiIndex]         = c * val_r - s * val_i;
+    dpsi[psiIndex][0]     = c * gX_r - s * gX_i;
+    dpsi[psiIndex][1]     = c * gY_r - s * gY_i;
+    dpsi[psiIndex][2]     = c * gZ_r - s * gZ_i;
+
+    psi[psiIndex + 1]     = c * val_i + s * val_r;
+    dpsi[psiIndex + 1][0] = c * gX_i + s * gX_r;
+    dpsi[psiIndex + 1][1] = c * gY_i + s * gY_r;
+    dpsi[psiIndex + 1][2] = c * gZ_i + s * gZ_r;
+
+    //intermediates for computation of hessian. \partial_i \partial_j phi in cartesian coordinates.
+    const ST f_xx_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g00, g01, g02);
+    const ST f_xy_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g10, g11, g12);
+    const ST f_xz_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g20, g21, g22);
+    const ST f_yy_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g10, g11, g12);
+    const ST f_yz_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g20, g21, g22);
+    const ST f_zz_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g20, g21, g22);
+
+    const ST f_xx_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g00, g01, g02);
+    const ST f_xy_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g10, g11, g12);
+    const ST f_xz_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g20, g21, g22);
+    const ST f_yy_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g10, g11, g12);
+    const ST f_yz_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g20, g21, g22);
+    const ST f_zz_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g20, g21, g22);
+
+    const ST h_xx_r = f_xx_r + 2 * kX * dX_i - kX * kX * val_r;
+    const ST h_xy_r = f_xy_r + (kX * dY_i + kY * dX_i) - kX * kY * val_r;
+    const ST h_xz_r = f_xz_r + (kX * dZ_i + kZ * dX_i) - kX * kZ * val_r;
+    const ST h_yy_r = f_yy_r + 2 * kY * dY_i - kY * kY * val_r;
+    const ST h_yz_r = f_yz_r + (kY * dZ_i + kZ * dY_i) - kY * kZ * val_r;
+    const ST h_zz_r = f_zz_r + 2 * kZ * dZ_i - kZ * kZ * val_r;
+
+    const ST h_xx_i = f_xx_i - 2 * kX * dX_r - kX * kX * val_i;
+    const ST h_xy_i = f_xy_i - (kX * dY_r + kY * dX_r) - kX * kY * val_i;
+    const ST h_xz_i = f_xz_i - (kX * dZ_r + kZ * dX_r) - kX * kZ * val_i;
+    const ST h_yy_i = f_yy_i - 2 * kY * dY_r - kY * kY * val_i;
+    const ST h_yz_i = f_yz_i - (kZ * dY_r + kY * dZ_r) - kZ * kY * val_i;
+    const ST h_zz_i = f_zz_i - 2 * kZ * dZ_r - kZ * kZ * val_i;
+
+    grad_grad_psi[psiIndex][0] = c * h_xx_r - s * h_xx_i;
+    grad_grad_psi[psiIndex][1] = c * h_xy_r - s * h_xy_i;
+    grad_grad_psi[psiIndex][2] = c * h_xz_r - s * h_xz_i;
+    grad_grad_psi[psiIndex][3] = c * h_xy_r - s * h_xy_i;
+    grad_grad_psi[psiIndex][4] = c * h_yy_r - s * h_yy_i;
+    grad_grad_psi[psiIndex][5] = c * h_yz_r - s * h_yz_i;
+    grad_grad_psi[psiIndex][6] = c * h_xz_r - s * h_xz_i;
+    grad_grad_psi[psiIndex][7] = c * h_yz_r - s * h_yz_i;
+    grad_grad_psi[psiIndex][8] = c * h_zz_r - s * h_zz_i;
+
+    grad_grad_psi[psiIndex + 1][0] = c * h_xx_i + s * h_xx_r;
+    grad_grad_psi[psiIndex + 1][1] = c * h_xy_i + s * h_xy_r;
+    grad_grad_psi[psiIndex + 1][2] = c * h_xz_i + s * h_xz_r;
+    grad_grad_psi[psiIndex + 1][3] = c * h_xy_i + s * h_xy_r;
+    grad_grad_psi[psiIndex + 1][4] = c * h_yy_i + s * h_yy_r;
+    grad_grad_psi[psiIndex + 1][5] = c * h_yz_i + s * h_yz_r;
+    grad_grad_psi[psiIndex + 1][6] = c * h_xz_i + s * h_xz_r;
+    grad_grad_psi[psiIndex + 1][7] = c * h_yz_i + s * h_yz_r;
+    grad_grad_psi[psiIndex + 1][8] = c * h_zz_i + s * h_zz_r;
+
+    //These are the real and imaginary components of the third SPO derivative.  _xxx denotes
+    // third derivative w.r.t. x, _xyz, a derivative with resepect to x,y, and z, and so on.
+
+    const ST f3_xxx_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g00, g01, g02, g00, g01, g02);
+    const ST f3_xxy_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g00, g01, g02, g10, g11, g12);
+    const ST f3_xxz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g00, g01, g02, g20, g21, g22);
+    const ST f3_xyy_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g10, g11, g12, g10, g11, g12);
+    const ST f3_xyz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g10, g11, g12, g20, g21, g22);
+    const ST f3_xzz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g20, g21, g22, g20, g21, g22);
+    const ST f3_yyy_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g10, g11, g12, g10, g11, g12, g10, g11, g12);
+    const ST f3_yyz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g10, g11, g12, g10, g11, g12, g20, g21, g22);
+    const ST f3_yzz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g10, g11, g12, g20, g21, g22, g20, g21, g22);
+    const ST f3_zzz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g20, g21, g22, g20, g21, g22, g20, g21, g22);
+
+    const ST f3_xxx_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g00, g01, g02, g00, g01, g02);
+    const ST f3_xxy_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g00, g01, g02, g10, g11, g12);
+    const ST f3_xxz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g00, g01, g02, g20, g21, g22);
+    const ST f3_xyy_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g10, g11, g12, g10, g11, g12);
+    const ST f3_xyz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g10, g11, g12, g20, g21, g22);
+    const ST f3_xzz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g20, g21, g22, g20, g21, g22);
+    const ST f3_yyy_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g10, g11, g12, g10, g11, g12, g10, g11, g12);
+    const ST f3_yyz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g10, g11, g12, g10, g11, g12, g20, g21, g22);
+    const ST f3_yzz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g10, g11, g12, g20, g21, g22, g20, g21, g22);
+    const ST f3_zzz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g20, g21, g22, g20, g21, g22, g20, g21, g22);
+
+    //Here is where we build up the components of the physical hessian gradient, namely, d^3/dx^3(e^{-ik*r}\phi(r)
+    const ST gh_xxx_r = f3_xxx_r + 3 * kX * f_xx_i - 3 * kX * kX * dX_r - kX * kX * kX * val_i;
+    const ST gh_xxx_i = f3_xxx_i - 3 * kX * f_xx_r - 3 * kX * kX * dX_i + kX * kX * kX * val_r;
+    const ST gh_xxy_r =
+        f3_xxy_r + (kY * f_xx_i + 2 * kX * f_xy_i) - (kX * kX * dY_r + 2 * kX * kY * dX_r) - kX * kX * kY * val_i;
+    const ST gh_xxy_i =
+        f3_xxy_i - (kY * f_xx_r + 2 * kX * f_xy_r) - (kX * kX * dY_i + 2 * kX * kY * dX_i) + kX * kX * kY * val_r;
+    const ST gh_xxz_r =
+        f3_xxz_r + (kZ * f_xx_i + 2 * kX * f_xz_i) - (kX * kX * dZ_r + 2 * kX * kZ * dX_r) - kX * kX * kZ * val_i;
+    const ST gh_xxz_i =
+        f3_xxz_i - (kZ * f_xx_r + 2 * kX * f_xz_r) - (kX * kX * dZ_i + 2 * kX * kZ * dX_i) + kX * kX * kZ * val_r;
+    const ST gh_xyy_r =
+        f3_xyy_r + (2 * kY * f_xy_i + kX * f_yy_i) - (2 * kX * kY * dY_r + kY * kY * dX_r) - kX * kY * kY * val_i;
+    const ST gh_xyy_i =
+        f3_xyy_i - (2 * kY * f_xy_r + kX * f_yy_r) - (2 * kX * kY * dY_i + kY * kY * dX_i) + kX * kY * kY * val_r;
+    const ST gh_xyz_r = f3_xyz_r + (kX * f_yz_i + kY * f_xz_i + kZ * f_xy_i) -
+        (kX * kY * dZ_r + kY * kZ * dX_r + kZ * kX * dY_r) - kX * kY * kZ * val_i;
+    const ST gh_xyz_i = f3_xyz_i - (kX * f_yz_r + kY * f_xz_r + kZ * f_xy_r) -
+        (kX * kY * dZ_i + kY * kZ * dX_i + kZ * kX * dY_i) + kX * kY * kZ * val_r;
+    const ST gh_xzz_r =
+        f3_xzz_r + (2 * kZ * f_xz_i + kX * f_zz_i) - (2 * kX * kZ * dZ_r + kZ * kZ * dX_r) - kX * kZ * kZ * val_i;
+    const ST gh_xzz_i =
+        f3_xzz_i - (2 * kZ * f_xz_r + kX * f_zz_r) - (2 * kX * kZ * dZ_i + kZ * kZ * dX_i) + kX * kZ * kZ * val_r;
+    const ST gh_yyy_r = f3_yyy_r + 3 * kY * f_yy_i - 3 * kY * kY * dY_r - kY * kY * kY * val_i;
+    const ST gh_yyy_i = f3_yyy_i - 3 * kY * f_yy_r - 3 * kY * kY * dY_i + kY * kY * kY * val_r;
+    const ST gh_yyz_r =
+        f3_yyz_r + (kZ * f_yy_i + 2 * kY * f_yz_i) - (kY * kY * dZ_r + 2 * kY * kZ * dY_r) - kY * kY * kZ * val_i;
+    const ST gh_yyz_i =
+        f3_yyz_i - (kZ * f_yy_r + 2 * kY * f_yz_r) - (kY * kY * dZ_i + 2 * kY * kZ * dY_i) + kY * kY * kZ * val_r;
+    const ST gh_yzz_r =
+        f3_yzz_r + (2 * kZ * f_yz_i + kY * f_zz_i) - (2 * kY * kZ * dZ_r + kZ * kZ * dY_r) - kY * kZ * kZ * val_i;
+    const ST gh_yzz_i =
+        f3_yzz_i - (2 * kZ * f_yz_r + kY * f_zz_r) - (2 * kY * kZ * dZ_i + kZ * kZ * dY_i) + kY * kZ * kZ * val_r;
+    const ST gh_zzz_r = f3_zzz_r + 3 * kZ * f_zz_i - 3 * kZ * kZ * dZ_r - kZ * kZ * kZ * val_i;
+    const ST gh_zzz_i = f3_zzz_i - 3 * kZ * f_zz_r - 3 * kZ * kZ * dZ_i + kZ * kZ * kZ * val_r;
+
+    grad_grad_grad_psi[psiIndex][0][0] = c * gh_xxx_r - s * gh_xxx_i;
+    grad_grad_grad_psi[psiIndex][0][1] = c * gh_xxy_r - s * gh_xxy_i;
+    grad_grad_grad_psi[psiIndex][0][2] = c * gh_xxz_r - s * gh_xxz_i;
+    grad_grad_grad_psi[psiIndex][0][3] = c * gh_xxy_r - s * gh_xxy_i;
+    grad_grad_grad_psi[psiIndex][0][4] = c * gh_xyy_r - s * gh_xyy_i;
+    grad_grad_grad_psi[psiIndex][0][5] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][0][6] = c * gh_xxz_r - s * gh_xxz_i;
+    grad_grad_grad_psi[psiIndex][0][7] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][0][8] = c * gh_xzz_r - s * gh_xzz_i;
+
+    grad_grad_grad_psi[psiIndex][1][0] = c * gh_xxy_r - s * gh_xxy_i;
+    grad_grad_grad_psi[psiIndex][1][1] = c * gh_xyy_r - s * gh_xyy_i;
+    grad_grad_grad_psi[psiIndex][1][2] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][1][3] = c * gh_xyy_r - s * gh_xyy_i;
+    grad_grad_grad_psi[psiIndex][1][4] = c * gh_yyy_r - s * gh_yyy_i;
+    grad_grad_grad_psi[psiIndex][1][5] = c * gh_yyz_r - s * gh_yyz_i;
+    grad_grad_grad_psi[psiIndex][1][6] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][1][7] = c * gh_yyz_r - s * gh_yyz_i;
+    grad_grad_grad_psi[psiIndex][1][8] = c * gh_yzz_r - s * gh_yzz_i;
+
+    grad_grad_grad_psi[psiIndex][2][0] = c * gh_xxz_r - s * gh_xxz_i;
+    grad_grad_grad_psi[psiIndex][2][1] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][2][2] = c * gh_xzz_r - s * gh_xzz_i;
+    grad_grad_grad_psi[psiIndex][2][3] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][2][4] = c * gh_yyz_r - s * gh_yyz_i;
+    grad_grad_grad_psi[psiIndex][2][5] = c * gh_yzz_r - s * gh_yzz_i;
+    grad_grad_grad_psi[psiIndex][2][6] = c * gh_xzz_r - s * gh_xzz_i;
+    grad_grad_grad_psi[psiIndex][2][7] = c * gh_yzz_r - s * gh_yzz_i;
+    grad_grad_grad_psi[psiIndex][2][8] = c * gh_zzz_r - s * gh_zzz_i;
+
+    grad_grad_grad_psi[psiIndex + 1][0][0] = c * gh_xxx_i + s * gh_xxx_r;
+    grad_grad_grad_psi[psiIndex + 1][0][1] = c * gh_xxy_i + s * gh_xxy_r;
+    grad_grad_grad_psi[psiIndex + 1][0][2] = c * gh_xxz_i + s * gh_xxz_r;
+    grad_grad_grad_psi[psiIndex + 1][0][3] = c * gh_xxy_i + s * gh_xxy_r;
+    grad_grad_grad_psi[psiIndex + 1][0][4] = c * gh_xyy_i + s * gh_xyy_r;
+    grad_grad_grad_psi[psiIndex + 1][0][5] = c * gh_xyz_i + s * gh_xyz_r;
+    grad_grad_grad_psi[psiIndex + 1][0][6] = c * gh_xxz_i + s * gh_xxz_r;
+    grad_grad_grad_psi[psiIndex + 1][0][7] = c * gh_xyz_i + s * gh_xyz_r;
+    grad_grad_grad_psi[psiIndex + 1][0][8] = c * gh_xzz_i + s * gh_xzz_r;
+
+    grad_grad_grad_psi[psiIndex + 1][1][0] = c * gh_xxy_i + s * gh_xxy_r;
+    grad_grad_grad_psi[psiIndex + 1][1][1] = c * gh_xyy_i + s * gh_xyy_r;
+    grad_grad_grad_psi[psiIndex + 1][1][2] = c * gh_xyz_i + s * gh_xyz_r;
+    grad_grad_grad_psi[psiIndex + 1][1][3] = c * gh_xyy_i + s * gh_xyy_r;
+    grad_grad_grad_psi[psiIndex + 1][1][4] = c * gh_yyy_i + s * gh_yyy_r;
+    grad_grad_grad_psi[psiIndex + 1][1][5] = c * gh_yyz_i + s * gh_yyz_r;
+    grad_grad_grad_psi[psiIndex + 1][1][6] = c * gh_xyz_i + s * gh_xyz_r;
+    grad_grad_grad_psi[psiIndex + 1][1][7] = c * gh_yyz_i + s * gh_yyz_r;
+    grad_grad_grad_psi[psiIndex + 1][1][8] = c * gh_yzz_i + s * gh_yzz_r;
+
+    grad_grad_grad_psi[psiIndex + 1][2][0] = c * gh_xxz_i + s * gh_xxz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][1] = c * gh_xyz_i + s * gh_xyz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][2] = c * gh_xzz_i + s * gh_xzz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][3] = c * gh_xyz_i + s * gh_xyz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][4] = c * gh_yyz_i + s * gh_yyz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][5] = c * gh_yzz_i + s * gh_yzz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][6] = c * gh_xzz_i + s * gh_xzz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][7] = c * gh_yzz_i + s * gh_yzz_r;
+    grad_grad_grad_psi[psiIndex + 1][2][8] = c * gh_zzz_i + s * gh_zzz_r;
+  }
+#pragma omp simd
+  for (size_t j = std::max(nComplexBands, first); j < last; j++)
+  {
+    int jr = j << 1;
+    int ji = jr + 1;
+
+    const ST kX    = k0[j];
+    const ST kY    = k1[j];
+    const ST kZ    = k2[j];
+    const ST val_r = myV[jr];
+    const ST val_i = myV[ji];
+
+    //phase
+    ST s, c;
+    qmcplusplus::sincos(-(x * kX + y * kY + z * kZ), &s, &c);
+
+    //dot(PrimLattice.G,myG[j])
+    const ST dX_r = g00 * g0[jr] + g01 * g1[jr] + g02 * g2[jr];
+    const ST dY_r = g10 * g0[jr] + g11 * g1[jr] + g12 * g2[jr];
+    const ST dZ_r = g20 * g0[jr] + g21 * g1[jr] + g22 * g2[jr];
+
+    const ST dX_i = g00 * g0[ji] + g01 * g1[ji] + g02 * g2[ji];
+    const ST dY_i = g10 * g0[ji] + g11 * g1[ji] + g12 * g2[ji];
+    const ST dZ_i = g20 * g0[ji] + g21 * g1[ji] + g22 * g2[ji];
+
+    // \f$\nabla \psi_r + {\bf k}\psi_i\f$
+    const ST gX_r = dX_r + val_i * kX;
+    const ST gY_r = dY_r + val_i * kY;
+    const ST gZ_r = dZ_r + val_i * kZ;
+    const ST gX_i = dX_i - val_r * kX;
+    const ST gY_i = dY_i - val_r * kY;
+    const ST gZ_i = dZ_i - val_r * kZ;
+
+    const size_t psiIndex = first_spo + nComplexBands + j;
+    psi[psiIndex]         = c * val_r - s * val_i;
+    dpsi[psiIndex][0]     = c * gX_r - s * gX_i;
+    dpsi[psiIndex][1]     = c * gY_r - s * gY_i;
+    dpsi[psiIndex][2]     = c * gZ_r - s * gZ_i;
+
+    //intermediates for computation of hessian. \partial_i \partial_j phi in cartesian coordinates.
+    const ST f_xx_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g00, g01, g02);
+    const ST f_xy_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g10, g11, g12);
+    const ST f_xz_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g00, g01, g02, g20, g21, g22);
+    const ST f_yy_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g10, g11, g12);
+    const ST f_yz_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g10, g11, g12, g20, g21, g22);
+    const ST f_zz_r = v_m_v(h00[jr], h01[jr], h02[jr], h11[jr], h12[jr], h22[jr], g20, g21, g22, g20, g21, g22);
+
+    const ST f_xx_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g00, g01, g02);
+    const ST f_xy_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g10, g11, g12);
+    const ST f_xz_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g00, g01, g02, g20, g21, g22);
+    const ST f_yy_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g10, g11, g12);
+    const ST f_yz_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g10, g11, g12, g20, g21, g22);
+    const ST f_zz_i = v_m_v(h00[ji], h01[ji], h02[ji], h11[ji], h12[ji], h22[ji], g20, g21, g22, g20, g21, g22);
+
+    const ST h_xx_r = f_xx_r + 2 * kX * dX_i - kX * kX * val_r;
+    const ST h_xy_r = f_xy_r + (kX * dY_i + kY * dX_i) - kX * kY * val_r;
+    const ST h_xz_r = f_xz_r + (kX * dZ_i + kZ * dX_i) - kX * kZ * val_r;
+    const ST h_yy_r = f_yy_r + 2 * kY * dY_i - kY * kY * val_r;
+    const ST h_yz_r = f_yz_r + (kY * dZ_i + kZ * dY_i) - kY * kZ * val_r;
+    const ST h_zz_r = f_zz_r + 2 * kZ * dZ_i - kZ * kZ * val_r;
+
+    const ST h_xx_i = f_xx_i - 2 * kX * dX_r - kX * kX * val_i;
+    const ST h_xy_i = f_xy_i - (kX * dY_r + kY * dX_r) - kX * kY * val_i;
+    const ST h_xz_i = f_xz_i - (kX * dZ_r + kZ * dX_r) - kX * kZ * val_i;
+    const ST h_yy_i = f_yy_i - 2 * kY * dY_r - kY * kY * val_i;
+    const ST h_yz_i = f_yz_i - (kZ * dY_r + kY * dZ_r) - kZ * kY * val_i;
+    const ST h_zz_i = f_zz_i - 2 * kZ * dZ_r - kZ * kZ * val_i;
+
+    grad_grad_psi[psiIndex][0] = c * h_xx_r - s * h_xx_i;
+    grad_grad_psi[psiIndex][1] = c * h_xy_r - s * h_xy_i;
+    grad_grad_psi[psiIndex][2] = c * h_xz_r - s * h_xz_i;
+    grad_grad_psi[psiIndex][3] = c * h_xy_r - s * h_xy_i;
+    grad_grad_psi[psiIndex][4] = c * h_yy_r - s * h_yy_i;
+    grad_grad_psi[psiIndex][5] = c * h_yz_r - s * h_yz_i;
+    grad_grad_psi[psiIndex][6] = c * h_xz_r - s * h_xz_i;
+    grad_grad_psi[psiIndex][7] = c * h_yz_r - s * h_yz_i;
+    grad_grad_psi[psiIndex][8] = c * h_zz_r - s * h_zz_i;
+
+    //These are the real and imaginary components of the third SPO derivative.  _xxx denotes
+    // third derivative w.r.t. x, _xyz, a derivative with resepect to x,y, and z, and so on.
+
+    const ST f3_xxx_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g00, g01, g02, g00, g01, g02);
+    const ST f3_xxy_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g00, g01, g02, g10, g11, g12);
+    const ST f3_xxz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g00, g01, g02, g20, g21, g22);
+    const ST f3_xyy_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g10, g11, g12, g10, g11, g12);
+    const ST f3_xyz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g10, g11, g12, g20, g21, g22);
+    const ST f3_xzz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g00, g01, g02, g20, g21, g22, g20, g21, g22);
+    const ST f3_yyy_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g10, g11, g12, g10, g11, g12, g10, g11, g12);
+    const ST f3_yyz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g10, g11, g12, g10, g11, g12, g20, g21, g22);
+    const ST f3_yzz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g10, g11, g12, g20, g21, g22, g20, g21, g22);
+    const ST f3_zzz_r = t3_contract(gh000[jr], gh001[jr], gh002[jr], gh011[jr], gh012[jr], gh022[jr], gh111[jr],
+                                    gh112[jr], gh122[jr], gh222[jr], g20, g21, g22, g20, g21, g22, g20, g21, g22);
+
+    const ST f3_xxx_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g00, g01, g02, g00, g01, g02);
+    const ST f3_xxy_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g00, g01, g02, g10, g11, g12);
+    const ST f3_xxz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g00, g01, g02, g20, g21, g22);
+    const ST f3_xyy_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g10, g11, g12, g10, g11, g12);
+    const ST f3_xyz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g10, g11, g12, g20, g21, g22);
+    const ST f3_xzz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g00, g01, g02, g20, g21, g22, g20, g21, g22);
+    const ST f3_yyy_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g10, g11, g12, g10, g11, g12, g10, g11, g12);
+    const ST f3_yyz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g10, g11, g12, g10, g11, g12, g20, g21, g22);
+    const ST f3_yzz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g10, g11, g12, g20, g21, g22, g20, g21, g22);
+    const ST f3_zzz_i = t3_contract(gh000[ji], gh001[ji], gh002[ji], gh011[ji], gh012[ji], gh022[ji], gh111[ji],
+                                    gh112[ji], gh122[ji], gh222[ji], g20, g21, g22, g20, g21, g22, g20, g21, g22);
+
+    //Here is where we build up the components of the physical hessian gradient, namely, d^3/dx^3(e^{-ik*r}\phi(r)
+    const ST gh_xxx_r = f3_xxx_r + 3 * kX * f_xx_i - 3 * kX * kX * dX_r - kX * kX * kX * val_i;
+    const ST gh_xxx_i = f3_xxx_i - 3 * kX * f_xx_r - 3 * kX * kX * dX_i + kX * kX * kX * val_r;
+    const ST gh_xxy_r =
+        f3_xxy_r + (kY * f_xx_i + 2 * kX * f_xy_i) - (kX * kX * dY_r + 2 * kX * kY * dX_r) - kX * kX * kY * val_i;
+    const ST gh_xxy_i =
+        f3_xxy_i - (kY * f_xx_r + 2 * kX * f_xy_r) - (kX * kX * dY_i + 2 * kX * kY * dX_i) + kX * kX * kY * val_r;
+    const ST gh_xxz_r =
+        f3_xxz_r + (kZ * f_xx_i + 2 * kX * f_xz_i) - (kX * kX * dZ_r + 2 * kX * kZ * dX_r) - kX * kX * kZ * val_i;
+    const ST gh_xxz_i =
+        f3_xxz_i - (kZ * f_xx_r + 2 * kX * f_xz_r) - (kX * kX * dZ_i + 2 * kX * kZ * dX_i) + kX * kX * kZ * val_r;
+    const ST gh_xyy_r =
+        f3_xyy_r + (2 * kY * f_xy_i + kX * f_yy_i) - (2 * kX * kY * dY_r + kY * kY * dX_r) - kX * kY * kY * val_i;
+    const ST gh_xyy_i =
+        f3_xyy_i - (2 * kY * f_xy_r + kX * f_yy_r) - (2 * kX * kY * dY_i + kY * kY * dX_i) + kX * kY * kY * val_r;
+    const ST gh_xyz_r = f3_xyz_r + (kX * f_yz_i + kY * f_xz_i + kZ * f_xy_i) -
+        (kX * kY * dZ_r + kY * kZ * dX_r + kZ * kX * dY_r) - kX * kY * kZ * val_i;
+    const ST gh_xyz_i = f3_xyz_i - (kX * f_yz_r + kY * f_xz_r + kZ * f_xy_r) -
+        (kX * kY * dZ_i + kY * kZ * dX_i + kZ * kX * dY_i) + kX * kY * kZ * val_r;
+    const ST gh_xzz_r =
+        f3_xzz_r + (2 * kZ * f_xz_i + kX * f_zz_i) - (2 * kX * kZ * dZ_r + kZ * kZ * dX_r) - kX * kZ * kZ * val_i;
+    const ST gh_xzz_i =
+        f3_xzz_i - (2 * kZ * f_xz_r + kX * f_zz_r) - (2 * kX * kZ * dZ_i + kZ * kZ * dX_i) + kX * kZ * kZ * val_r;
+    const ST gh_yyy_r = f3_yyy_r + 3 * kY * f_yy_i - 3 * kY * kY * dY_r - kY * kY * kY * val_i;
+    const ST gh_yyy_i = f3_yyy_i - 3 * kY * f_yy_r - 3 * kY * kY * dY_i + kY * kY * kY * val_r;
+    const ST gh_yyz_r =
+        f3_yyz_r + (kZ * f_yy_i + 2 * kY * f_yz_i) - (kY * kY * dZ_r + 2 * kY * kZ * dY_r) - kY * kY * kZ * val_i;
+    const ST gh_yyz_i =
+        f3_yyz_i - (kZ * f_yy_r + 2 * kY * f_yz_r) - (kY * kY * dZ_i + 2 * kY * kZ * dY_i) + kY * kY * kZ * val_r;
+    const ST gh_yzz_r =
+        f3_yzz_r + (2 * kZ * f_yz_i + kY * f_zz_i) - (2 * kY * kZ * dZ_r + kZ * kZ * dY_r) - kY * kZ * kZ * val_i;
+    const ST gh_yzz_i =
+        f3_yzz_i - (2 * kZ * f_yz_r + kY * f_zz_r) - (2 * kY * kZ * dZ_i + kZ * kZ * dY_i) + kY * kZ * kZ * val_r;
+    const ST gh_zzz_r = f3_zzz_r + 3 * kZ * f_zz_i - 3 * kZ * kZ * dZ_r - kZ * kZ * kZ * val_i;
+    const ST gh_zzz_i = f3_zzz_i - 3 * kZ * f_zz_r - 3 * kZ * kZ * dZ_i + kZ * kZ * kZ * val_r;
+    //[x][xx] //These are the unique entries
+    grad_grad_grad_psi[psiIndex][0][0] = c * gh_xxx_r - s * gh_xxx_i;
+    grad_grad_grad_psi[psiIndex][0][1] = c * gh_xxy_r - s * gh_xxy_i;
+    grad_grad_grad_psi[psiIndex][0][2] = c * gh_xxz_r - s * gh_xxz_i;
+    grad_grad_grad_psi[psiIndex][0][3] = c * gh_xxy_r - s * gh_xxy_i;
+    grad_grad_grad_psi[psiIndex][0][4] = c * gh_xyy_r - s * gh_xyy_i;
+    grad_grad_grad_psi[psiIndex][0][5] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][0][6] = c * gh_xxz_r - s * gh_xxz_i;
+    grad_grad_grad_psi[psiIndex][0][7] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][0][8] = c * gh_xzz_r - s * gh_xzz_i;
+
+    grad_grad_grad_psi[psiIndex][1][0] = c * gh_xxy_r - s * gh_xxy_i;
+    grad_grad_grad_psi[psiIndex][1][1] = c * gh_xyy_r - s * gh_xyy_i;
+    grad_grad_grad_psi[psiIndex][1][2] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][1][3] = c * gh_xyy_r - s * gh_xyy_i;
+    grad_grad_grad_psi[psiIndex][1][4] = c * gh_yyy_r - s * gh_yyy_i;
+    grad_grad_grad_psi[psiIndex][1][5] = c * gh_yyz_r - s * gh_yyz_i;
+    grad_grad_grad_psi[psiIndex][1][6] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][1][7] = c * gh_yyz_r - s * gh_yyz_i;
+    grad_grad_grad_psi[psiIndex][1][8] = c * gh_yzz_r - s * gh_yzz_i;
+
+    grad_grad_grad_psi[psiIndex][2][0] = c * gh_xxz_r - s * gh_xxz_i;
+    grad_grad_grad_psi[psiIndex][2][1] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][2][2] = c * gh_xzz_r - s * gh_xzz_i;
+    grad_grad_grad_psi[psiIndex][2][3] = c * gh_xyz_r - s * gh_xyz_i;
+    grad_grad_grad_psi[psiIndex][2][4] = c * gh_yyz_r - s * gh_yyz_i;
+    grad_grad_grad_psi[psiIndex][2][5] = c * gh_yzz_r - s * gh_yzz_i;
+    grad_grad_grad_psi[psiIndex][2][6] = c * gh_xzz_r - s * gh_xzz_i;
+    grad_grad_grad_psi[psiIndex][2][7] = c * gh_yzz_r - s * gh_yzz_i;
+    grad_grad_grad_psi[psiIndex][2][8] = c * gh_zzz_r - s * gh_zzz_i;
+  }
+}
+
+template<typename ST>
+void SplineC2R<ST>::evaluateVGHGH(const ParticleSet& P,
+                                  const int iat,
+                                  ValueVector& psi,
+                                  GradVector& dpsi,
+                                  HessVector& grad_grad_psi,
+                                  GGGVector& grad_grad_grad_psi)
+{
+  const PointType& r = P.activeR(iat);
+  PointType ru(PrimLattice.toUnit_floor(r));
+#pragma omp parallel
+  {
+    int first, last;
+    FairDivideAligned(myV.size(), getAlignment<ST>(), omp_get_num_threads(), omp_get_thread_num(), first, last);
+
+    spline2::evaluate3d_vghgh(SplineInst->getSplinePtr(), ru, myV, myG, myH, mygH, first, last);
+    assign_vghgh(r, psi, dpsi, grad_grad_psi, grad_grad_grad_psi, first / 2, last / 2);
+  }
+}
+
+template class SplineC2R<float>;
+template class SplineC2R<double>;
+
+} // namespace qmcplusplus
diff --git a/src/QMCWaveFunctions/BsplineFactory/SplineC2RT.h b/src/QMCWaveFunctions/BsplineFactory/SplineC2RT.h
new file mode 100644
index 00000000000..05b8c4a0b34
--- /dev/null
+++ b/src/QMCWaveFunctions/BsplineFactory/SplineC2RT.h
@@ -0,0 +1,217 @@
+//////////////////////////////////////////////////////////////////////////////////////
+// This file is distributed under the University of Illinois/NCSA Open Source License.
+// See LICENSE file in top directory for details.
+//
+// Copyright (c) 2019 QMCPACK developers.
+//
+// File developed by: Jeremy McMinnis, jmcminis@gmail.com, University of Illinois at Urbana-Champaign
+//                    Jeongnim Kim, jeongnim.kim@intel.com, University of Illinois at Urbana-Champaign
+//                    Ye Luo, yeluo@anl.gov, Argonne National Laboratory
+//                    Anouar Benali, benali@anl.gov, Argonne National Laboratory
+//                    Mark A. Berrill, berrillma@ornl.gov, Oak Ridge National Laboratory
+//
+// File created by: Jeongnim Kim, jeongnim.kim@gmail.com, University of Illinois at Urbana-Champaign
+//////////////////////////////////////////////////////////////////////////////////////
+
+
+/** @file
+ *
+ * class to handle complex splines to real orbitals with splines of arbitrary precision
+ */
+#ifndef QMCPLUSPLUS_SPLINE_C2R_H
+#define QMCPLUSPLUS_SPLINE_C2R_H
+
+#include <memory>
+#include "QMCWaveFunctions/BsplineFactory/BsplineSet.h"
+#include "OhmmsSoA/VectorSoaContainer.h"
+#include "spline2/MultiBspline.hpp"
+#include "Utilities/FairDivide.h"
+
+namespace qmcplusplus
+{
+/** class to match std::complex<ST> spline with BsplineSet::ValueType (real) SPOs
+ * @tparam ST precision of spline
+ *
+ * Requires temporage storage and multiplication of phase vectors
+ * The internal storage of complex spline coefficients uses double sized real arrays of ST type, aligned and padded.
+ * The first nComplexBands complex splines produce 2 real orbitals.
+ * The rest complex splines produce 1 real orbital.
+ * All the output orbitals are real (C2R). The maximal number of output orbitals is OrbitalSetSize.
+ */
+template<typename ST>
+class SplineC2R : public BsplineSet
+{
+public:
+  using SplineType       = typename bspline_traits<ST, 3>::SplineType;
+  using BCType           = typename bspline_traits<ST, 3>::BCType;
+  using DataType         = ST;
+  using PointType        = TinyVector<ST, 3>;
+  using SingleSplineType = UBspline_3d_d;
+  // types for evaluation results
+  using TT = typename BsplineSet::ValueType;
+  using BsplineSet::GGGVector;
+  using BsplineSet::GradVector;
+  using BsplineSet::HessVector;
+  using BsplineSet::ValueVector;
+
+  using vContainer_type  = Vector<ST, aligned_allocator<ST>>;
+  using gContainer_type  = VectorSoaContainer<ST, 3>;
+  using hContainer_type  = VectorSoaContainer<ST, 6>;
+  using ghContainer_type = VectorSoaContainer<ST, 10>;
+
+private:
+  ///primitive cell
+  CrystalLattice<ST, 3> PrimLattice;
+  ///\f$GGt=G^t G \f$, transformation for tensor in LatticeUnit to CartesianUnit, e.g. Hessian
+  Tensor<ST, 3> GGt;
+  ///number of complex bands
+  int nComplexBands;
+  ///multi bspline set
+  std::shared_ptr<MultiBspline<ST>> SplineInst;
+
+  vContainer_type mKK;
+  VectorSoaContainer<ST, 3> myKcart;
+
+  ///thread private ratios for reduction when using nested threading, numVP x numThread
+  Matrix<TT> ratios_private;
+
+protected:
+  /// intermediate result vectors
+  vContainer_type myV;
+  vContainer_type myL;
+  gContainer_type myG;
+  hContainer_type myH;
+  ghContainer_type mygH;
+
+public:
+  SplineC2R(const std::string& my_name) : BsplineSet(my_name), nComplexBands(0) {}
+
+  SplineC2R(const SplineC2R& in);
+  virtual std::string getClassName() const override { return "SplineC2R"; }
+  virtual std::string getKeyword() const override { return "SplineC2R"; }
+  bool isComplex() const override { return true; };
+
+  std::unique_ptr<SPOSet> makeClone() const override { return std::make_unique<SplineC2R>(*this); }
+
+  inline void resizeStorage(size_t n, size_t nvals)
+  {
+    init_base(n);
+    size_t npad = getAlignedSize<ST>(2 * n);
+    myV.resize(npad);
+    myG.resize(npad);
+    myL.resize(npad);
+    myH.resize(npad);
+    mygH.resize(npad);
+  }
+
+  void bcast_tables(Communicate* comm) { chunked_bcast(comm, SplineInst->getSplinePtr()); }
+
+  void gather_tables(Communicate* comm)
+  {
+    if (comm->size() == 1)
+      return;
+    const int Nbands      = kPoints.size();
+    const int Nbandgroups = comm->size();
+    offset.resize(Nbandgroups + 1, 0);
+    FairDivideLow(Nbands, Nbandgroups, offset);
+
+    for (size_t ib = 0; ib < offset.size(); ib++)
+      offset[ib] = offset[ib] * 2;
+    gatherv(comm, SplineInst->getSplinePtr(), SplineInst->getSplinePtr()->z_stride, offset);
+  }
+
+  template<typename GT, typename BCT>
+  void create_spline(GT& xyz_g, BCT& xyz_bc)
+  {
+    resize_kpoints();
+    SplineInst = std::make_shared<MultiBspline<ST>>();
+    SplineInst->create(xyz_g, xyz_bc, myV.size());
+
+    app_log() << "MEMORY " << SplineInst->sizeInByte() / (1 << 20) << " MB allocated "
+              << "for the coefficients in 3D spline orbital representation" << std::endl;
+  }
+
+  inline void flush_zero() { SplineInst->flush_zero(); }
+
+  /** remap kPoints to pack the double copy */
+  inline void resize_kpoints()
+  {
+    nComplexBands = this->remap_kpoints();
+    const int nk  = kPoints.size();
+    mKK.resize(nk);
+    myKcart.resize(nk);
+    for (size_t i = 0; i < nk; ++i)
+    {
+      mKK[i]     = -dot(kPoints[i], kPoints[i]);
+      myKcart(i) = kPoints[i];
+    }
+  }
+
+  void set_spline(SingleSplineType* spline_r, SingleSplineType* spline_i, int twist, int ispline, int level);
+
+  bool read_splines(hdf_archive& h5f);
+
+  bool write_splines(hdf_archive& h5f);
+
+  void assign_v(const PointType& r, const vContainer_type& myV, ValueVector& psi, int first, int last) const;
+
+  void evaluateValue(const ParticleSet& P, const int iat, ValueVector& psi) override;
+
+  void evaluateDetRatios(const VirtualParticleSet& VP,
+                         ValueVector& psi,
+                         const ValueVector& psiinv,
+                         std::vector<TT>& ratios) override;
+
+  /** assign_vgl
+   */
+  void assign_vgl(const PointType& r, ValueVector& psi, GradVector& dpsi, ValueVector& d2psi, int first, int last)
+      const;
+
+  /** assign_vgl_from_l can be used when myL is precomputed and myV,myG,myL in cartesian
+   */
+  void assign_vgl_from_l(const PointType& r, ValueVector& psi, GradVector& dpsi, ValueVector& d2psi);
+
+  void evaluateVGL(const ParticleSet& P,
+                   const int iat,
+                   ValueVector& psi,
+                   GradVector& dpsi,
+                   ValueVector& d2psi) override;
+
+  void assign_vgh(const PointType& r,
+                  ValueVector& psi,
+                  GradVector& dpsi,
+                  HessVector& grad_grad_psi,
+                  int first,
+                  int last) const;
+
+  void evaluateVGH(const ParticleSet& P,
+                   const int iat,
+                   ValueVector& psi,
+                   GradVector& dpsi,
+                   HessVector& grad_grad_psi) override;
+
+  void assign_vghgh(const PointType& r,
+                    ValueVector& psi,
+                    GradVector& dpsi,
+                    HessVector& grad_grad_psi,
+                    GGGVector& grad_grad_grad_psi,
+                    int first = 0,
+                    int last  = -1) const;
+
+  void evaluateVGHGH(const ParticleSet& P,
+                     const int iat,
+                     ValueVector& psi,
+                     GradVector& dpsi,
+                     HessVector& grad_grad_psi,
+                     GGGVector& grad_grad_grad_psi) override;
+
+  template<class BSPLINESPO>
+  friend struct SplineSetReader;
+  friend struct BsplineReaderBase;
+};
+
+extern template class SplineC2R<float>;
+extern template class SplineC2R<double>;
+
+} // namespace qmcplusplus
+#endif
diff --git a/src/QMCWaveFunctions/CMakeLists.txt b/src/QMCWaveFunctions/CMakeLists.txt
index 9d6eace715f..abde3cb9651 100644
--- a/src/QMCWaveFunctions/CMakeLists.txt
+++ b/src/QMCWaveFunctions/CMakeLists.txt
@@ -118,7 +118,7 @@ if(OHMMS_DIM MATCHES 3)
       set(FERMION_OMPTARGET_SRCS ${FERMION_OMPTARGET_SRCS} BsplineFactory/SplineC2COMPTarget.cpp)
     else(QMC_COMPLEX)
       set(FERMION_SRCS ${FERMION_SRCS} BsplineFactory/createRealSingle.cpp BsplineFactory/createRealDouble.cpp
-        BsplineFactory/SplineC2R.cpp BsplineFactory/SplineR2R.cpp)
+                                       BsplineFactory/SplineC2R.cpp BsplineFactory/SplineC2RT.cpp BsplineFactory/SplineR2R.cpp)
       set(FERMION_OMPTARGET_SRCS ${FERMION_OMPTARGET_SRCS} BsplineFactory/SplineC2ROMPTarget.cpp)
     endif(QMC_COMPLEX)