doxygen/src/cs__sles__it__cuda_8h_source.html

 #ifndef __CS_SLES_IT_CUDA_H__

 #define __CS_SLES_IT_CUDA_H__


 /*============================================================================

  * Sparse Linear Equation Solvers using CUDA

  *============================================================================*/


 /*

   This file is part of code_saturne, a general-purpose CFD tool.


   Copyright (C) 1998-2024 EDF S.A.


   This program is free software; you can redistribute it and/or modify it under

   the terms of the GNU General Public License as published by the Free Software

   Foundation; either version 2 of the License, or (at your option) any later

   version.


   This program is distributed in the hope that it will be useful, but WITHOUT

   ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS

   FOR A PARTICULAR PURPOSE.  See the GNU General Public License for more

   details.


   You should have received a copy of the GNU General Public License along with

   this program; if not, write to the Free Software Foundation, Inc., 51 Franklin

   Street, Fifth Floor, Boston, MA 02110-1301, USA.

 */


 /*----------------------------------------------------------------------------*/


 /*----------------------------------------------------------------------------

  *  Local headers

  *----------------------------------------------------------------------------*/


 #include "cs_base.h"

 #include "cs_matrix.h"

 #include "cs_sles.h"

 #include "cs_sles_pc.h"


 /*----------------------------------------------------------------------------*/


 BEGIN_C_DECLS


 /*============================================================================

  * Macro definitions

  *============================================================================*/


 /*============================================================================

  * Type definitions

  *============================================================================*/


 /*============================================================================

  *  Global variables

  *============================================================================*/


 /*=============================================================================

  * User function prototypes

  *============================================================================*/


 /*=============================================================================

  * Public function prototypes

  *============================================================================*/


 /*----------------------------------------------------------------------------

  * Solution of A.vx = Rhs using Jacobi.

  *

  * On entry, vx is considered initialized.

  *

  * parameters:

  *   c               <-- pointer to solver context info

  *   a               <-- linear equation matrix

  *   diag_block_size <-- diagonal block size

  *   rotation_mode   <-- halo update option for rotational periodicity

  *   convergence     <-- convergence information structure

  *   rhs             <-- right hand side

  *   vx_ini          <-- initial system solution

  *                       (vx if nonzero, nullptr if zero)

  *   vx              <-> system solution

  *   aux_size        <-- number of elements in aux_vectors (in bytes)

  *   aux_vectors     --- optional working area (allocation otherwise)

  *

  * returns:

  *   convergence state

  *----------------------------------------------------------------------------*/


 cs_sles_convergence_state_t

 cs_sles_it_cuda_jacobi(cs_sles_it_t              *c,

                        const cs_matrix_t         *a,

                        cs_lnum_t                  diag_block_size,

                        cs_sles_it_convergence_t  *convergence,

                        const cs_real_t           *rhs,

                        cs_real_t                 *vx_ini,

                        cs_real_t                 *vx,

                        size_t                     aux_size,

                        void                      *aux_vectors);


 /*----------------------------------------------------------------------------

  * Solution of A.vx = Rhs using block Jacobi.

  *

  * On entry, vx is considered initialized.

  *

  * parameters:

  *   c               <-- pointer to solver context info

  *   a               <-- linear equation matrix

  *   diag_block_size <-- diagonal block size

  *   rotation_mode   <-- halo update option for rotational periodicity

  *   convergence     <-- convergence information structure

  *   rhs             <-- right hand side

  *   vx_ini          <-- initial system solution

  *                       (vx if nonzero, nullptr if zero)

  *   vx              <-> system solution

  *   aux_size        <-- number of elements in aux_vectors (in bytes)

  *   aux_vectors     --- optional working area (allocation otherwise)

  *

  * returns:

  *   convergence state

  *----------------------------------------------------------------------------*/


 cs_sles_convergence_state_t

 cs_sles_it_cuda_block_jacobi(cs_sles_it_t              *c,

                              const cs_matrix_t         *a,

                              cs_lnum_t                  diag_block_size,

                              cs_sles_it_convergence_t  *convergence,

                              const cs_real_t           *rhs,

                              cs_real_t                 *vx_ini,

                              cs_real_t                 *vx,

                              size_t                     aux_size,

                              void                      *aux_vectors);


 /*----------------------------------------------------------------------------

  * Solution of A.vx = Rhs using flexible preconditioned conjugate gradient.

  *

  * Compared to standard PCG, FCG supports variable preconditioners.

  *

  * This variant, described in \cite Notay:2015, allows computing the

  * required inner products with a single global communication.

  *

  * On entry, vx is considered initialized.

  *

  * parameters:

  *   c               <-- pointer to solver context info

  *   a               <-- matrix

  *   diag_block_size <-- diagonal block size

  *   convergence     <-- convergence information structure

  *   rhs             <-- right hand side

  *   vx_ini          <-- initial system solution

  *                       (vx if nonzero, nullptr if zero)

  *   vx              <-> system solution

  *   aux_size        <-- number of elements in aux_vectors (in bytes)

  *   aux_vectors     --- optional working area (allocation otherwise)

  *

  * returns:

  *   convergence state

  *----------------------------------------------------------------------------*/


 cs_sles_convergence_state_t

 cs_sles_it_cuda_fcg(cs_sles_it_t              *c,

                     const cs_matrix_t         *a,

                     cs_lnum_t                  diag_block_size,

                     cs_sles_it_convergence_t  *convergence,

                     const cs_real_t           *rhs,

                     cs_real_t                 *vx_ini,

                     cs_real_t                 *vx,

                     size_t                     aux_size,

                     void                      *aux_vectors);


 /*----------------------------------------------------------------------------

  * Solution of A.vx = Rhs using optimised preconditioned GCR (CUDA version).

  *

  * On entry, vx is considered initialized.

  *

  * parameters:

  *   c               <-- pointer to solver context info

  *   a               <-- matrix

  *   diag_block_size <-- diagonal block size (unused here)

  *   convergence     <-- convergence information structure

  *   rhs             <-- right hand side

  *   vx_ini          <-- initial system solution

  *                       (vx if nonzero, nullptr if zero)

  *   vx              <-> system solution

  *   aux_size        <-- number of elements in aux_vectors (in bytes)

  *   aux_vectors     --- optional working area (allocation otherwise)

  *

  * returns:

  *   convergence state

  *----------------------------------------------------------------------------*/


 cs_sles_convergence_state_t

 cs_sles_it_cuda_gcr(cs_sles_it_t              *c,

                     const cs_matrix_t         *a,

                     cs_lnum_t                  diag_block_size,

                     cs_sles_it_convergence_t  *convergence,

                     const cs_real_t           *rhs,

                     cs_real_t                 *vx_ini,

                     cs_real_t                 *vx,

                     size_t                     aux_size,

                     void                      *aux_vectors);


 /*----------------------------------------------------------------------------*/


 END_C_DECLS


 #endif /* __CS_SLES_IT_CUDA_H__ */

cs_base.h

BEGIN_C_DECLS
#define BEGIN_C_DECLS
Definition: cs_defs.h:528

cs_real_t
double cs_real_t
Floating-point value.
Definition: cs_defs.h:332

END_C_DECLS
#define END_C_DECLS
Definition: cs_defs.h:529

cs_lnum_t
int cs_lnum_t
local mesh entity id
Definition: cs_defs.h:325

cs_matrix.h

cs_matrix_t
struct _cs_matrix_t cs_matrix_t
Definition: cs_matrix.h:110

cs_sles.h

cs_sles_convergence_state_t
cs_sles_convergence_state_t
Definition: cs_sles.h:56

cs_sles_it_t
struct _cs_sles_it_t cs_sles_it_t
Definition: cs_sles_it.h:86

cs_sles_it_convergence_t
struct _cs_sles_it_convergence_t cs_sles_it_convergence_t
Definition: cs_sles_it.h:90

cs_sles_it_cuda_jacobi
cs_sles_convergence_state_t cs_sles_it_cuda_jacobi(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_it_cuda_fcg
cs_sles_convergence_state_t cs_sles_it_cuda_fcg(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_it_cuda_gcr
cs_sles_convergence_state_t cs_sles_it_cuda_gcr(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_it_cuda_block_jacobi
cs_sles_convergence_state_t cs_sles_it_cuda_block_jacobi(cs_sles_it_t *c, const cs_matrix_t *a, cs_lnum_t diag_block_size, cs_sles_it_convergence_t *convergence, const cs_real_t *rhs, cs_real_t *vx_ini, cs_real_t *vx, size_t aux_size, void *aux_vectors)

cs_sles_pc.h