doxygen/src/cs__sles__it__cuda_8h_source.html

#ifndef __CS_SLES_IT_CUDA_H__

#define __CS_SLES_IT_CUDA_H__


/*============================================================================

 * Sparse Linear Equation Solvers using CUDA

 *============================================================================*/


/*

  This file is part of code_saturne, a general-purpose CFD tool.


  Copyright (C) 1998-2024 EDF S.A.


  This program is free software; you can redistribute it and/or modify it under

  the terms of the GNU General Public License as published by the Free Software

  Foundation; either version 2 of the License, or (at your option) any later

  version.


  This program is distributed in the hope that it will be useful, but WITHOUT

  ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS

  FOR A PARTICULAR PURPOSE.  See the GNU General Public License for more

  details.


  You should have received a copy of the GNU General Public License along with

  this program; if not, write to the Free Software Foundation, Inc., 51 Franklin

  Street, Fifth Floor, Boston, MA 02110-1301, USA.

*/


/*----------------------------------------------------------------------------*/


/*----------------------------------------------------------------------------

 *  Local headers

 *----------------------------------------------------------------------------*/


#include "cs_base.h"

#include "cs_matrix.h"

#include "cs_sles.h"

#include "cs_sles_pc.h"


/*----------------------------------------------------------------------------*/


BEGIN_C_DECLS


/*============================================================================

 * Macro definitions

 *============================================================================*/


/*============================================================================

 * Type definitions

 *============================================================================*/


/*============================================================================

 *  Global variables

 *============================================================================*/


/*=============================================================================

 * User function prototypes

 *============================================================================*/


/*=============================================================================

 * Public function prototypes

 *============================================================================*/


/*----------------------------------------------------------------------------

 * Solution of A.vx = Rhs using Jacobi.

 *

 * On entry, vx is considered initialized.

 *

 * parameters:

 *   c               <-- pointer to solver context info

 *   a               <-- linear equation matrix

 *   diag_block_size <-- diagonal block size

 *   rotation_mode   <-- halo update option for rotational periodicity

 *   convergence     <-- convergence information structure

 *   rhs             <-- right hand side

 *   vx_ini          <-- initial system solution

 *                       (vx if nonzero, nullptr if zero)

 *   vx              <-> system solution

 *   aux_size        <-- number of elements in aux_vectors (in bytes)

 *   aux_vectors     --- optional working area (allocation otherwise)

 *

 * returns:

 *   convergence state

 *----------------------------------------------------------------------------*/


cs_sles_convergence_state_t

cs_sles_it_cuda_jacobi(cs_sles_it_t              *c,

                       const cs_matrix_t         *a,

                       cs_lnum_t                  diag_block_size,

                       cs_sles_it_convergence_t  *convergence,

                       const cs_real_t           *rhs,

                       cs_real_t                 *vx_ini,

                       cs_real_t                 *vx,

                       size_t                     aux_size,

                       void                      *aux_vectors);


/*----------------------------------------------------------------------------

 * Solution of A.vx = Rhs using block Jacobi.

 *

 * On entry, vx is considered initialized.

 *

 * parameters:

 *   c               <-- pointer to solver context info

 *   a               <-- linear equation matrix

 *   diag_block_size <-- diagonal block size

 *   rotation_mode   <-- halo update option for rotational periodicity

 *   convergence     <-- convergence information structure

 *   rhs             <-- right hand side

 *   vx_ini          <-- initial system solution

 *                       (vx if nonzero, nullptr if zero)

 *   vx              <-> system solution

 *   aux_size        <-- number of elements in aux_vectors (in bytes)

 *   aux_vectors     --- optional working area (allocation otherwise)

 *

 * returns:

 *   convergence state

 *----------------------------------------------------------------------------*/


cs_sles_convergence_state_t

cs_sles_it_cuda_block_jacobi(cs_sles_it_t              *c,

                             const cs_matrix_t         *a,

                             cs_lnum_t                  diag_block_size,

                             cs_sles_it_convergence_t  *convergence,

                             const cs_real_t           *rhs,

                             cs_real_t                 *vx_ini,

                             cs_real_t                 *vx,

                             size_t                     aux_size,

                             void                      *aux_vectors);


/*----------------------------------------------------------------------------

 * Solution of A.vx = Rhs using flexible preconditioned conjugate gradient.

 *

 * Compared to standard PCG, FCG supports variable preconditioners.

 *

 * This variant, described in \cite Notay:2015, allows computing the

 * required inner products with a single global communication.

 *

 * On entry, vx is considered initialized.

 *

 * parameters:

 *   c               <-- pointer to solver context info

 *   a               <-- matrix

 *   diag_block_size <-- diagonal block size

 *   convergence     <-- convergence information structure

 *   rhs             <-- right hand side

 *   vx_ini          <-- initial system solution

 *                       (vx if nonzero, nullptr if zero)

 *   vx              <-> system solution

 *   aux_size        <-- number of elements in aux_vectors (in bytes)

 *   aux_vectors     --- optional working area (allocation otherwise)

 *

 * returns:

 *   convergence state

 *----------------------------------------------------------------------------*/


cs_sles_convergence_state_t

cs_sles_it_cuda_fcg(cs_sles_it_t              *c,

                    const cs_matrix_t         *a,

                    cs_lnum_t                  diag_block_size,

                    cs_sles_it_convergence_t  *convergence,

                    const cs_real_t           *rhs,

                    cs_real_t                 *vx_ini,

                    cs_real_t                 *vx,

                    size_t                     aux_size,

                    void                      *aux_vectors);


/*----------------------------------------------------------------------------

 * Solution of A.vx = Rhs using optimised preconditioned GCR (CUDA version).

 *

 * On entry, vx is considered initialized.

 *

 * parameters:

 *   c               <-- pointer to solver context info

 *   a               <-- matrix

 *   diag_block_size <-- diagonal block size (unused here)

 *   convergence     <-- convergence information structure

 *   rhs             <-- right hand side

 *   vx_ini          <-- initial system solution

 *                       (vx if nonzero, nullptr if zero)

 *   vx              <-> system solution

 *   aux_size        <-- number of elements in aux_vectors (in bytes)

 *   aux_vectors     --- optional working area (allocation otherwise)

 *

 * returns:

 *   convergence state

 *----------------------------------------------------------------------------*/


cs_sles_convergence_state_t

cs_sles_it_cuda_gcr(cs_sles_it_t              *c,

                    const cs_matrix_t         *a,

                    cs_lnum_t                  diag_block_size,

                    cs_sles_it_convergence_t  *convergence,

                    const cs_real_t           *rhs,

                    cs_real_t                 *vx_ini,

                    cs_real_t                 *vx,

                    size_t                     aux_size,

                    void                      *aux_vectors);


/*----------------------------------------------------------------------------*/


END_C_DECLS


#endif /* __CS_SLES_IT_CUDA_H__ */

cs_base.h

BEGIN_C_DECLS
#define BEGIN_C_DECLS
Definition: cs_defs.h:542

cs_real_t
double cs_real_t
Floating-point value.
Definition: cs_defs.h:342

END_C_DECLS
#define END_C_DECLS
Definition: cs_defs.h:543

cs_lnum_t
int cs_lnum_t
local mesh entity id
Definition: cs_defs.h:335

cs_matrix.h

cs_matrix_t
struct _cs_matrix_t cs_matrix_t
Definition: cs_matrix.h:110

cs_sles.h

cs_sles_convergence_state_t
cs_sles_convergence_state_t
Definition: cs_sles.h:56

cs_sles_it_t
struct _cs_sles_it_t cs_sles_it_t
Definition: cs_sles_it.h:86

cs_sles_it_convergence_t
struct _cs_sles_it_convergence_t cs_sles_it_convergence_t
Definition: cs_sles_it.h:90

cs_sles_it_cuda_jacobi
cs_sles_convergence_state_t cs_sles_it_cuda_jacobi(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_it_cuda_fcg
cs_sles_convergence_state_t cs_sles_it_cuda_fcg(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_it_cuda_gcr
cs_sles_convergence_state_t cs_sles_it_cuda_gcr(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_it_cuda_block_jacobi
cs_sles_convergence_state_t cs_sles_it_cuda_block_jacobi(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_pc.h