milupHPC/device__predictor__corrector__euler_8cu_source.html

#include "../../include/integrator/device_predictor_corrector_euler.cuh"

#include "../../include/cuda_utils/cuda_launcher.cuh"


namespace PredictorCorrectorEulerNS {


    CUDA_CALLABLE_MEMBER Shared::Shared() {


    }

    CUDA_CALLABLE_MEMBER Shared::Shared(real *forces, real *courant, real *artVisc) {

        this->forces = forces;

        this->courant = courant;

        this->artVisc = artVisc;

    }

    CUDA_CALLABLE_MEMBER Shared::~Shared() {


    }

    CUDA_CALLABLE_MEMBER void Shared::set(real *forces, real *courant, real *artVisc) {

        this->forces = forces;

        this->courant = courant;

        this->artVisc= artVisc;

    }

    CUDA_CALLABLE_MEMBER void Shared::setE(real *e) {

        this->e = e;

    }

    CUDA_CALLABLE_MEMBER void Shared::setRho(real *rho) {

        this->rho = rho;

    }

    CUDA_CALLABLE_MEMBER void Shared::setVmax(real *vmax) {

        this->vmax = vmax;

    }

    namespace SharedNS {

        __global__ void set(Shared *shared, real *forces, real *courant, real *artVisc) {

            shared->set(forces, courant, artVisc);

        }

        __global__ void setE(Shared *shared, real *e) {

            shared->setE(e);

        }

        __global__ void setRho(Shared *shared, real *rho) {

            shared->setRho(rho);

        }

        __global__ void setVmax(Shared *shared, real *vmax) {

            shared->setVmax(vmax);

        }

        namespace Launch {

            void set(Shared *shared, real *forces, real *courant, real *artVisc) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::SharedNS::set, shared,

                             forces, courant, artVisc);

            }

            void setE(Shared *shared, real *e) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::SharedNS::setE, shared, e);

            }

            void setRho(Shared *shared, real *rho) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::SharedNS::setRho, shared, rho);

            }

            void setVmax(Shared *shared, real *vmax) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::SharedNS::setVmax, shared, vmax);

            }

        }

    }


    CUDA_CALLABLE_MEMBER BlockShared::BlockShared() {


    }

    CUDA_CALLABLE_MEMBER BlockShared::BlockShared(real *forces, real *courant, real *artVisc) {

        this->forces = forces;

        this->courant = courant;

        this->artVisc = artVisc;

    }

    CUDA_CALLABLE_MEMBER BlockShared::~BlockShared() {


    }

    CUDA_CALLABLE_MEMBER void BlockShared::set(real *forces, real *courant, real *artVisc) {

        this->forces = forces;

        this->courant = courant;

        this->artVisc= artVisc;

    }

    CUDA_CALLABLE_MEMBER void BlockShared::setE(real *e) {

        this->e = e;

    }

    CUDA_CALLABLE_MEMBER void BlockShared::setRho(real *rho) {

        this->rho = rho;

    }

    CUDA_CALLABLE_MEMBER void BlockShared::setVmax(real *vmax) {

        this->vmax = vmax;

    }

    namespace BlockSharedNS {

        __global__ void set(BlockShared *blockShared, real *forces, real *courant, real *artVisc) {

            blockShared->set(forces, courant, artVisc);

        }

        __global__ void setE(BlockShared *blockShared, real *e) {

            blockShared->setE(e);

        }

        __global__ void setRho(BlockShared *blockShared, real *rho) {

            blockShared->setRho(rho);

        }

        __global__ void setVmax(BlockShared *blockShared, real *vmax) {

            blockShared->setVmax(vmax);

        }


        namespace Launch {

            void set(BlockShared *blockShared, real *forces, real *courant, real *artVisc) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::BlockSharedNS::set, blockShared,

                             forces, courant, artVisc);

            }

            void setE(BlockShared *blockShared, real *e) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::BlockSharedNS::setE, blockShared, e);

            }

            void setRho(BlockShared *blockShared, real *rho) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::BlockSharedNS::setRho,

                             blockShared, rho);

            }

            void setVmax(BlockShared *blockShared, real *vmax) {

                ExecutionPolicy executionPolicy(1, 1);

                cuda::launch(false, executionPolicy, ::PredictorCorrectorEulerNS::BlockSharedNS::setVmax,

                             blockShared, vmax);

            }

        }

    }


    namespace Kernel {


        __global__ void corrector(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles) {


            int i;

            // particle loop

            for (i = threadIdx.x + blockIdx.x * blockDim.x; i < numParticles; i+= blockDim.x * gridDim.x) {


// just for debugging purposes!!!

/*

                particles->vx[i] += dt * (particles->ax[i] + particles->g_ax[i]);

#if DIM > 1

                particles->vy[i] += dt * (particles->ay[i] + particles->g_ay[i]);

#if DIM == 3

                particles->vz[i] += dt * (particles->az[i] + particles->g_az[i]);

#endif

#endif


                // calculating/updating the positions

                particles->x[i] += dt * particles->vx[i];

#if DIM > 1

                particles->y[i] += dt * particles->vy[i];

#if DIM == 3

                particles->z[i] += dt * particles->vz[i];

#endif

#endif

*/

// end: just for debugging purposes!!!


                particles->x[i] = particles->x[i] + dt/2 * (predictor->vx[i] + particles->vx[i]);

                //if (i == 12) { //(i % 1000 == 0) {

                //    printf("corrector: x[%i] = %e + %e/2 * (%e + %e)\n", i, particles->x[i], dt, predictor->vx[i],

                //           particles->vx[i]);

                //}

                particles->vx[i] = particles->vx[i] + dt/2 * (predictor->ax[i] + particles->ax[i] + 2 * particles->g_ax[i]);

                //if (i == 12) { //(i % 1000 == 0) {

                //    printf("corrector: vx[%i] = %e + %e/2 * (%e + %e + 2 * %e)\n", i, particles->vx[i], dt, predictor->ax[i],

                //           particles->ax[i], particles->g_ax);

                //}

                particles->ax[i] = 0.5 * (predictor->ax[i] + particles->ax[i]) + particles->g_ax[i];

                //if (i == 12) { //(i % 1000 == 0) {

                //    printf("corrector: ax[%i] = 1/2 * (%e + %e) + %e)\n", i, predictor->ax[i], particles->ax[i], particles->g_ax);

                //}

#if DIM > 1

                particles->y[i] = particles->y[i] + dt/2 * (predictor->vy[i] + particles->vy[i]);

                particles->vy[i] = particles->vy[i] + dt/2 * (predictor->ay[i] + particles->ay[i] + 2 * particles->g_ay[i]);

                particles->ay[i] = 0.5 * (predictor->ay[i] + particles->ay[i]) + particles->g_ay[i];

#if DIM == 3

                particles->z[i] = particles->z[i] + dt/2 * (predictor->vz[i] + particles->vz[i]);

                particles->vz[i] = particles->vz[i] + dt/2 * (predictor->az[i] + particles->az[i] + 2 * particles->g_az[i]);

                particles->az[i] = 0.5 * (predictor->az[i] + particles->az[i]) + particles->g_az[i];

#endif

#endif


// TODO: some SPH flag?

#if INTEGRATE_DENSITY

                particles->rho[i] = particles->rho[i] + dt/2 * (predictor->drhodt[i] + particles->drhodt[i]);

                particles->drhodt[i] = 0.5 * (predictor->drhodt[i] + particles->drhodt[i]);

                //if (i == 12) { //(i % 1000 == 0) {

                //    printf("corrector: rho[%i] = %e + %e/2 * (%e + %e)\n", i, particles->rho[i], dt, predictor->drhodt[i],

                //           particles->drhodt[i]);

                //}

#else

                //p.rho[i] = p.rho[i];

#endif

#if INTEGRATE_ENERGY

                particles->e[i] = particles->e[i] + dt/2 * (predictor->dedt[i] + particles->dedt[i]);

                if (particles->e[i] < 1e-6) {

                    particles->e[i] = 1e-6;

                }

                particles->dedt[i] = 0.5 * (predictor->dedt[i] + particles->dedt[i]);

                //if (i == 12) { //(i % 1000 == 0) {

                //    printf("corrector: e[%i] = %e + %e/2 * (%e + %e)\n", i, particles->e[i], dt, predictor->dedt[i],

                //           particles->dedt[i]);

                //}

#endif

#if INTEGRATE_SML

#if DECOUPLE_SML

                particles->sml[i] = particles->sml[i] + dt * particles->dsmldt[i];

                //particles->dsmldt[i] = particles->dsmldt[i];

#else

                particles->sml[i] = particles->sml[i] + dt/2 * (predictor->dsmldt[i] + particles->dsmldt[i]);

                particles->dsmldt[i] = 0.5 * (predictor->dsmldt[i] + particles->dsmldt[i]);

#endif

#else

                particles->sml[i] = predictor->sml[i];

#endif

                //if (i % 1000 == 0) {

                //    printf("i: %i, particles->cs = %e, predictor->cs = %e\n", i, particles->cs[i], predictor->cs[i]);

                //}

                // TODO: needed?

                //predictor->reset(i); //TODO: move somewhere else?

            }

        }


        __global__ void predictor(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles) {


            int i;


            for (i = threadIdx.x + blockIdx.x * blockDim.x; i < numParticles; i+= blockDim.x * gridDim.x) {


                predictor->x[i] = particles->x[i] + dt * particles->vx[i];

                predictor->vx[i] = particles->vx[i] + dt * (particles->ax[i] + particles->g_ax[i]);

#if DIM > 1

                predictor->y[i] = particles->y[i] + dt * particles->vy[i];

                predictor->vy[i] = particles->vy[i] + dt * (particles->ay[i] + particles->g_ay[i]);

#if DIM == 3

                predictor->z[i] = particles->z[i] + dt * particles->vz[i];

                predictor->vz[i] = particles->vz[i] + dt * (particles->az[i] + particles->g_az[i]);

#endif

#endif


// TODO: some SPH flag?

#if INTEGRATE_DENSITY

                predictor->rho[i] = particles->rho[i] + dt * particles->drhodt[i];

                //predictor->drhodt[i] = particles->drhodt[i];

#else

                //predictor->rho[i] = particles->rho[i];

#endif

#if INTEGRATE_ENERGY

                predictor->e[i] = particles->e[i] + dt * particles->dedt[i];

                // TODO: in principle there should not be a energy floor (but needed for sedov)

                if (predictor->e[i] < 1e-6) {

                    predictor->e[i] = 1e-6;

                }

#endif

#if INTEGRATE_SML

#if DECOUPLE_SML

                predictor->sml[i] = particles->sml[i] + dt * particles->dsmldt[i];

#else

                predictor->sml[i] = particles->sml[i];

#endif

#else

                predictor->sml[i] = particles->sml[i];

#endif

                predictor->cs[i] = particles->cs[i];

                // TODO: why is this needed?

                predictor->p[i] = particles->p[i];

                //predictor->ax[i] = particles->ax[i];

                //predictor->ay[i] = particles->ay[i];

                //predictor->az[i] = particles->az[i];

            }


        }


        __global__ void setTimeStep(SimulationTime *simulationTime, Material *materials, Particles *particles,

                                    BlockShared *blockShared, int *blockCount, real searchRadius, int numParticles) {


#define SAFETY_FIRST 0.1


            __shared__ real sharedForces[NUM_THREADS_LIMIT_TIME_STEP];

            __shared__ real sharedCourant[NUM_THREADS_LIMIT_TIME_STEP];

            __shared__ real sharedArtVisc[NUM_THREADS_LIMIT_TIME_STEP];

            __shared__ real sharede[NUM_THREADS_LIMIT_TIME_STEP];

            __shared__ real sharedrho[NUM_THREADS_LIMIT_TIME_STEP];

            __shared__ real sharedVmax[NUM_THREADS_LIMIT_TIME_STEP];


            int i, j, k, m;

            int d, dd;

            int index;

#if INTEGRATE_ENERGY

            bool hasEnergy;

#endif

            real forces = DBL_MAX;

            real courant = DBL_MAX;

            real dtx = DBL_MAX;

            real dtrho = DBL_MAX;

            real dte = DBL_MAX;

            real vmax = 0.; //TODO: initial value

            real temp;

            real sml;

            int matId;


            real ax;

#if DIM > 1

            real ay;

#if DIM == 3

            real az;

#endif

#endif

            real dtartvisc = DBL_MAX;


            for (i = threadIdx.x + blockIdx.x * blockDim.x; i < numParticles; i+= blockDim.x * gridDim.x) {


                matId = particles->materialId[i];


#if INTEGRATE_ENERGY

            hasEnergy = false;


//          switch  (matEOS[matId]) {

//              case (EOS_TYPE_TILLOTSON):

//                  hasEnergy = true;

//                  break;

//              case (EOS_TYPE_JUTZI):

//                  hasEnergy = true;

//                  break;

//                          case (EOS_TYPE_JUTZI_ANEOS):

//                                  hasEnergy = true;

//                                  break;

//              case (EOS_TYPE_SIRONO):

//                  hasEnergy = true;

//                  break;

//              case (EOS_TYPE_EPSILON):

//                  hasEnergy = true;

//                  break;

//              case (EOS_TYPE_ANEOS):

//                  hasEnergy = true;

//                  break;

//              default:

//                  hasEnergy = false;

//                  break;

//          }

#endif

                ax = 0.;

#if DIM > 1

                ay = 0.;

#if DIM == 3

                az = 0.;

#endif

#endif

#if GRAVITY_SIM

                ax += particles->g_ax[i];

#if DIM > 1

                ay += particles->g_ay[i];

#if DIM == 3

                az += particles->g_az[i];

#endif

#endif

#endif

#if SPH_SIM

                ax += particles->ax[i];

#if DIM > 1

                ay += particles->ay[i];

#if DIM == 3

                az += particles->az[i];

#endif

#endif

#endif

                temp = ax * ax;

#if DIM > 1

                temp += ay * ay;

#if DIM == 3

                temp += az * az;

#endif

#endif


                //if (i % 10000 == 0) {

                //    printf("i: %i ax = %e, ay = %e, az = %e\n", i, ax, ay, az);

                //}

                sml = particles->sml[i];

                temp = cuda::math::sqrt(sml / cuda::math::sqrt(temp));

                forces = cuda::math::min(forces, temp);

                //if (forces == 0.) {

                //    printf("forces: %e, sml: %e, temp: %e ax = %e, g_ax = %e (noi: %i)\n", forces, sml, temp, particles->ax[i],

                //           particles->g_ax[i], particles->noi[i]);

                //}

                temp = sml / particles->cs[i];

                courant = cuda::math::min(courant, temp);


                temp = COURANT_FACT * sml / (particles->cs[i] + 1.2 * materials[matId].artificialViscosity.alpha * particles->cs[i] +

                            materials[matId].artificialViscosity.beta * particles->muijmax[i]);

                dtartvisc = min(dtartvisc, temp);


#if DIM == 1

                temp = cuda::math::sqrt(particles->vx[i] * particles->vx[i]);

#elif DIM == 2

                temp = cuda::math::sqrt(particles->vx[i] * particles->vx[i] +

                                        particles->vy[i] * particles->vy[i]);

#else

                temp = cuda::math::sqrt(particles->vx[i] * particles->vx[i] +

                                        particles->vy[i] * particles->vy[i] +

                                        particles->vz[i] * particles->vz[i]);

#endif

                //if (i % 10000 == 0) {

                //    printf("i: %i vx = %e, vy = %e, vz = %e\n", i, particles->vx[i], particles->vy[i], particles->vz[i]);

                //}


                vmax = cuda::math::max(temp, vmax);


#if INTEGRATE_DENSITY

                if (particles->drhodt[i] != 0) {

                    //TODO: define rhomin_d

                    double rhomin_d = 0.01;

                    temp = SAFETY_FIRST * (cuda::math::abs(particles->rho[i])+rhomin_d)/cuda::math::abs(particles->drhodt[i]);

                    dtrho = cuda::math::min(temp, dtrho);

                }

#endif

#if INTEGRATE_ENERGY

                //if (particles->dedt[i] != 0 && hasEnergy) {

                    //TODO: define emin_d

                    //temp = SAFETY_FIRST * (cuda::math::abs(particles->e[i])+emin_d)/cuda::math::abs(particles->dedt[i]);

                    //dte = cuda::math::min(temp, dte);

                //}

#endif


            }


            __threadfence();


            i = threadIdx.x;

            sharedForces[i] = forces;

            sharedCourant[i] = courant;

            sharede[i] = dte;

            sharedrho[i] = dtrho;

            sharedArtVisc[i] = dtartvisc;

            sharedVmax[i] = vmax;


            for (j = NUM_THREADS_LIMIT_TIME_STEP / 2; j > 0; j /= 2) {

                __syncthreads();

                if (i < j) {

                    k = i + j;

                    sharedForces[i] = forces = cuda::math::min(forces, sharedForces[k]);

                    sharedCourant[i] = courant = cuda::math::min(courant, sharedCourant[k]);

                    sharede[i] = dte = cuda::math::min(dte, sharede[k]);

                    sharedrho[i] = dtrho = cuda::math::min(dtrho, sharedrho[k]);

                    sharedArtVisc[i] = dtartvisc = cuda::math::min(dtartvisc, sharedArtVisc[k]);

                    sharedVmax[i] = vmax = cuda::math::max(vmax, sharedVmax[k]);

                }

            }

            // write block result to global memory

            if (i == 0) {

                k = blockIdx.x;

                blockShared->forces[k] = forces;

                blockShared->courant[k] = courant;

                blockShared->e[k] = dte;

                blockShared->rho[k] = dtrho;

                blockShared->artVisc[k] = dtartvisc;

                blockShared->vmax[k] = vmax;


                m = gridDim.x - 1;

                if (m == atomicInc((unsigned int *)blockCount, m)) {

                    // last block, so combine all block results

                    for (j = 0; j <= m; j++) {

                        forces = cuda::math::min(forces, blockShared->forces[j]);

                        courant = cuda::math::min(courant, blockShared->courant[j]);

                        dte = cuda::math::min(dte, blockShared->e[j]);

                        dtrho = cuda::math::min(dtrho, blockShared->rho[j]);

                        dtartvisc = cuda::math::min(dtartvisc, blockShared->artVisc[j]);

                        vmax = cuda::math::min(vmax, blockShared->vmax[j]);

                    }

                    // set new timestep

                    *simulationTime->dt = dtx = cuda::math::min(COURANT_FACT*courant, FORCES_FACT*forces);

                    //printf("courant: dt = %e (courant = %e)\n", COURANT_FACT*courant, courant);

                    //printf("force  : dt = %e (forces = %e)\n", FORCES_FACT*forces, forces);


                    if (vmax > 0. && searchRadius > 0.) { // TODO: searchRadius = 0 for 1 process

                        *simulationTime->dt = cuda::math::min(*simulationTime->dt, searchRadius / (2 * vmax));

                        //printf("search : dt = %e (vmax = %e)\n", searchRadius / (2 * vmax), vmax);

                    }

#if INTEGRATE_ENERGY

                    *simulationTime->dt = cuda::math::min(*simulationTime->dt, dte);

                    //printf("dte: %e\n", dte);

#endif

#if INTEGRATE_DENSITY

                    *simulationTime->dt = cuda::math::min(*simulationTime->dt, dtrho);

                    //printf("dtrho: %e\n", dtrho);

#endif


                    *simulationTime->dt = cuda::math::min(*simulationTime->dt, dtartvisc);

                    //printf("viscos : dt = %e\n", dtartvisc);


                    *simulationTime->dt = cuda::math::min(*simulationTime->dt, *simulationTime->subEndTime - *simulationTime->currentTime);

                    if (*simulationTime->dt > *simulationTime->dt_max) {

                        *simulationTime->dt = *simulationTime->dt_max;

                    }

                    //if (*simulationTime->dt < 1.e8) {

                    //    *simulationTime->dt = 1.e8;

                    //}

                    //printf("max    : dt = %e\n", *simulationTime->dt_max);

                    //printf("dt: %e\n", *simulationTime->dt);


                    //printf("Time Step Information: dt(v and x): %.17e dtS: %.17e dte: %.17e dtrho: %.17e dtdamage: %.17e dtalpha: %.17e dtalpha_epspor: %.17e dtepsilon_v: %.17e\n", dtx, dtS, dte, dtrho, dtdamage, dtalpha, dtalpha_epspor, dtepsilon_v);

                    //printf("time: %.17e timestep set to %.17e, integrating until %.17e \n", currentTimeD, dt, endTimeD);


                    // reset block count

                    *blockCount = 0;

                }

            }

        }


        real Launch::corrector(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles) {

            ExecutionPolicy executionPolicy;

            return cuda::launch(true, executionPolicy, ::PredictorCorrectorEulerNS::Kernel::corrector, particles,

                                predictor, dt, numParticles);

        }

        real Launch::predictor(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles) {

            ExecutionPolicy executionPolicy;

            return cuda::launch(true, executionPolicy, ::PredictorCorrectorEulerNS::Kernel::predictor, particles,

                                predictor, dt, numParticles);

        }


        real Launch::setTimeStep(int multiProcessorCount, SimulationTime *simulationTime, Material *materials, Particles *particles,

                                 BlockShared *blockShared, int *blockCount, real searchRadius, int numParticles) {

            ExecutionPolicy executionPolicy(multiProcessorCount, 256);

            return cuda::launch(true, executionPolicy, ::PredictorCorrectorEulerNS::Kernel::setTimeStep, simulationTime,

                                materials, particles, blockShared, blockCount, searchRadius, numParticles);

        }


        real Launch::pressureChangeCheck() {


        }


    }

}

ExecutionPolicy
Execution policy/instruction for CUDA kernel execution.
Definition: cuda_launcher.cuh:33

IntegratedParticles
Definition: particles.cuh:979

Material
Material parameters.
Definition: material.cuh:88

Material::artificialViscosity
ArtificialViscosity artificialViscosity
Definition: material.cuh:114

Particles
Particle(s) class based on SoA (Structur of Arrays).
Definition: particles.cuh:50

Particles::e
real * e
(pointer to) internal energy (array)
Definition: particles.cuh:121

Particles::materialId
integer * materialId
(pointer to) material identifier (array)
Definition: particles.cuh:111

Particles::x
real * x
(pointer to) x position (array)
Definition: particles.cuh:62

Particles::rho
real * rho
(pointer to) density (array)
Definition: particles.cuh:133

Particles::drhodt
real * drhodt
(pointer to) time derivative of density (array)
Definition: particles.cuh:148

Particles::g_ay
real * g_ay
(pointer to) y gravitational acceleration (array)
Definition: particles.cuh:92

Particles::ay
real * ay
(pointer to) y acceleration (array)
Definition: particles.cuh:74

Particles::az
real * az
(pointer to) z acceleration (array)
Definition: particles.cuh:82

Particles::p
real * p
(pointer to) pressure (array)
Definition: particles.cuh:135

Particles::cs
real * cs
(pointer to) sound of speed (array)
Definition: particles.cuh:129

Particles::y
real * y
(pointer to) y position (array)
Definition: particles.cuh:70

Particles::ax
real * ax
(pointer to) x acceleration (array)
Definition: particles.cuh:66

Particles::g_ax
real * g_ax
(pointer to) x gravitational acceleration (array)
Definition: particles.cuh:88

Particles::sml
real * sml
(pointer to) smoothing length (array)
Definition: particles.cuh:113

Particles::dedt
real * dedt
(pointer to) time derivative of internal energy (array)
Definition: particles.cuh:123

Particles::z
real * z
(pointer to) z position (array)
Definition: particles.cuh:78

Particles::vz
real * vz
(pointer to) z velocity (array)
Definition: particles.cuh:80

Particles::muijmax
real * muijmax
(pointer) to max(mu_ij) (array) needed for artificial viscosity and determining timestp
Definition: particles.cuh:138

Particles::g_az
real * g_az
(pointer to) z gravitational acceleration (array)
Definition: particles.cuh:96

Particles::vx
real * vx
(pointer to) x velocity (array)
Definition: particles.cuh:64

Particles::vy
real * vy
(pointer to) y velocity (array)
Definition: particles.cuh:72

SimulationTime
Definition: simulation_time.cuh:14

SimulationTime::dt
real * dt
Definition: simulation_time.cuh:17

SimulationTime::currentTime
real * currentTime
Definition: simulation_time.cuh:21

SimulationTime::dt_max
real * dt_max
Definition: simulation_time.cuh:22

SimulationTime::subEndTime
real * subEndTime
Definition: simulation_time.cuh:19

CUDA_CALLABLE_MEMBER
#define CUDA_CALLABLE_MEMBER
Definition: cuda_utilities.cuh:30

SAFETY_FIRST
#define SAFETY_FIRST

Kernel
Definition: device_rhs.cuh:7

PredictorCorrectorEulerNS::BlockSharedNS::Launch::setE
void setE(BlockShared *blockShared, real *e)
Definition: device_predictor_corrector_euler.cu:111

PredictorCorrectorEulerNS::BlockSharedNS::Launch::setVmax
void setVmax(BlockShared *blockShared, real *vmax)
Definition: device_predictor_corrector_euler.cu:120

PredictorCorrectorEulerNS::BlockSharedNS::Launch::setRho
void setRho(BlockShared *blockShared, real *e)
Definition: device_predictor_corrector_euler.cu:115

PredictorCorrectorEulerNS::BlockSharedNS::Launch::set
void set(BlockShared *blockShared, real *forces, real *courant, real *artVisc)
Definition: device_predictor_corrector_euler.cu:106

PredictorCorrectorEulerNS::BlockSharedNS::setVmax
__global__ void setVmax(BlockShared *blockShared, real *vmax)
Definition: device_predictor_corrector_euler.cu:101

PredictorCorrectorEulerNS::BlockSharedNS::set
__global__ void set(BlockShared *blockShared, real *forces, real *courant, real *artVisc)
Definition: device_predictor_corrector_euler.cu:92

PredictorCorrectorEulerNS::BlockSharedNS::setRho
__global__ void setRho(BlockShared *blockShared, real *e)
Definition: device_predictor_corrector_euler.cu:98

PredictorCorrectorEulerNS::BlockSharedNS::setE
__global__ void setE(BlockShared *blockShared, real *e)
Definition: device_predictor_corrector_euler.cu:95

PredictorCorrectorEulerNS::Kernel::Launch::setTimeStep
real setTimeStep(int multiProcessorCount, SimulationTime *simulationTime, Material *materials, Particles *particles, BlockShared *blockShared, int *blockCount, real searchRadius, int numParticles)
Wrapper for PredictorCorrectorEulerNS::Kernel::setTimeStep().
Definition: device_predictor_corrector_euler.cu:534

PredictorCorrectorEulerNS::Kernel::Launch::predictor
real predictor(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles)
Wrapper for PredictorCorrectorEulerNS::Kernel::predictor().
Definition: device_predictor_corrector_euler.cu:528

PredictorCorrectorEulerNS::Kernel::Launch::pressureChangeCheck
real pressureChangeCheck()
Definition: device_predictor_corrector_euler.cu:541

PredictorCorrectorEulerNS::Kernel::Launch::corrector
real corrector(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles)
Wrapper for PredictorCorrectorEulerNS::Kernel::corrector().
Definition: device_predictor_corrector_euler.cu:523

PredictorCorrectorEulerNS::Kernel::corrector
__global__ void corrector(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles)
Corrector step.
Definition: device_predictor_corrector_euler.cu:130

PredictorCorrectorEulerNS::Kernel::setTimeStep
__global__ void setTimeStep(SimulationTime *simulationTime, Material *materials, Particles *particles, BlockShared *blockShared, int *blockCount, real searchRadius, int numParticles)
Definition: device_predictor_corrector_euler.cu:287

PredictorCorrectorEulerNS::Kernel::setTimeStep
__global__ void setTimeStep(SimulationTime *simulationTime, Material *materials, Particles *particles, BlockShared *blockShared, int *blockCount, int numParticles)
Setting correct time step.

PredictorCorrectorEulerNS::Kernel::predictor
__global__ void predictor(Particles *particles, IntegratedParticles *predictor, real dt, int numParticles)
Predictor step.
Definition: device_predictor_corrector_euler.cu:223

PredictorCorrectorEulerNS::SharedNS::Launch::set
void set(Shared *shared, real *forces, real *courant, real *artVisc)
Definition: device_predictor_corrector_euler.cu:46

PredictorCorrectorEulerNS::SharedNS::Launch::setRho
void setRho(Shared *shared, real *rho)
Definition: device_predictor_corrector_euler.cu:55

PredictorCorrectorEulerNS::SharedNS::Launch::setE
void setE(Shared *shared, real *e)
Definition: device_predictor_corrector_euler.cu:51

PredictorCorrectorEulerNS::SharedNS::Launch::setVmax
void setVmax(Shared *shared, real *vmax)
Definition: device_predictor_corrector_euler.cu:59

PredictorCorrectorEulerNS::SharedNS::setRho
__global__ void setRho(Shared *shared, real *rho)
Definition: device_predictor_corrector_euler.cu:39

PredictorCorrectorEulerNS::SharedNS::setVmax
__global__ void setVmax(Shared *shared, real *vmax)
Definition: device_predictor_corrector_euler.cu:42

PredictorCorrectorEulerNS::SharedNS::setE
__global__ void setE(Shared *shared, real *e)
Definition: device_predictor_corrector_euler.cu:36

PredictorCorrectorEulerNS::SharedNS::set
__global__ void set(Shared *shared, real *forces, real *courant, real *artVisc)
Definition: device_predictor_corrector_euler.cu:33

PredictorCorrectorEulerNS
predictor corrector euler (Heun) integrator
Definition: device_predictor_corrector_euler.cuh:16

ProfilerIds::numParticles
const char *const numParticles
Definition: h5profiler.h:29

cuda::math::min
__device__ real min(real a, real b)
Minimum value out of two floating point values.
Definition: cuda_utilities.cu:414

cuda::math::sqrt
__device__ real sqrt(real a)
Square root of a floating point value.
Definition: cuda_utilities.cu:456

cuda::math::abs
__device__ real abs(real a)
Absolute value of a floating point value.
Definition: cuda_utilities.cu:448

cuda::math::max
__device__ real max(real a, real b)
Maximum value out of two floating point values.
Definition: cuda_utilities.cu:431

cuda::set
void set(T *d_var, T val, std::size_t count=1)
Set device memory to a specific value.
Definition: cuda_runtime.h:56

cuda::launch
real launch(bool timeKernel, const ExecutionPolicy &policy, void(*f)(Arguments...), Arguments... args)
CUDA execution wrapper function.
Definition: cuda_launcher.cuh:114

real
double real
Definition: parameter.h:15

NUM_THREADS_LIMIT_TIME_STEP
#define NUM_THREADS_LIMIT_TIME_STEP
Definition: parameter.h:107

INTEGRATE_DENSITY
#define INTEGRATE_DENSITY
integrate density equation
Definition: parameter.h:58

COURANT_FACT
#define COURANT_FACT
Definition: parameter.h:111

DIM
#define DIM
Dimension of the problem.
Definition: parameter.h:38

FORCES_FACT
#define FORCES_FACT
Definition: parameter.h:113

DBL_MAX
#define DBL_MAX
Definition: parameter.h:116

ArtificialViscosity::alpha
real alpha
Artificial viscosity .
Definition: material.cuh:48

ArtificialViscosity::beta
real beta
Artificial viscosity .
Definition: material.cuh:50

PredictorCorrectorEulerNS::BlockShared
Definition: device_predictor_corrector_euler.cuh:50

PredictorCorrectorEulerNS::BlockShared::courant
real * courant
Definition: device_predictor_corrector_euler.cuh:52

PredictorCorrectorEulerNS::BlockShared::vmax
real * vmax
Definition: device_predictor_corrector_euler.cuh:56

PredictorCorrectorEulerNS::BlockShared::setRho
CUDA_CALLABLE_MEMBER void setRho(real *rho)
Definition: device_predictor_corrector_euler.cu:85

PredictorCorrectorEulerNS::BlockShared::~BlockShared
CUDA_CALLABLE_MEMBER ~BlockShared()
Definition: device_predictor_corrector_euler.cu:74

PredictorCorrectorEulerNS::BlockShared::set
CUDA_CALLABLE_MEMBER void set(real *forces, real *courant, real *artVisc)
Definition: device_predictor_corrector_euler.cu:77

PredictorCorrectorEulerNS::BlockShared::setE
CUDA_CALLABLE_MEMBER void setE(real *e)
Definition: device_predictor_corrector_euler.cu:82

PredictorCorrectorEulerNS::BlockShared::artVisc
real * artVisc
Definition: device_predictor_corrector_euler.cuh:53

PredictorCorrectorEulerNS::BlockShared::rho
real * rho
Definition: device_predictor_corrector_euler.cuh:55

PredictorCorrectorEulerNS::BlockShared::forces
real * forces
Definition: device_predictor_corrector_euler.cuh:51

PredictorCorrectorEulerNS::BlockShared::e
real * e
Definition: device_predictor_corrector_euler.cuh:54

PredictorCorrectorEulerNS::BlockShared::setVmax
CUDA_CALLABLE_MEMBER void setVmax(real *vmax)
Definition: device_predictor_corrector_euler.cu:88

PredictorCorrectorEulerNS::BlockShared::BlockShared
CUDA_CALLABLE_MEMBER BlockShared()
Definition: device_predictor_corrector_euler.cu:66

PredictorCorrectorEulerNS::Shared
Definition: device_predictor_corrector_euler.cuh:18

PredictorCorrectorEulerNS::Shared::courant
real * courant
Definition: device_predictor_corrector_euler.cuh:20

PredictorCorrectorEulerNS::Shared::rho
real * rho
Definition: device_predictor_corrector_euler.cuh:23

PredictorCorrectorEulerNS::Shared::Shared
CUDA_CALLABLE_MEMBER Shared()
Definition: device_predictor_corrector_euler.cu:7

PredictorCorrectorEulerNS::Shared::forces
real * forces
Definition: device_predictor_corrector_euler.cuh:19

PredictorCorrectorEulerNS::Shared::artVisc
real * artVisc
Definition: device_predictor_corrector_euler.cuh:21

PredictorCorrectorEulerNS::Shared::setVmax
CUDA_CALLABLE_MEMBER void setVmax(real *vmax)
Definition: device_predictor_corrector_euler.cu:29

PredictorCorrectorEulerNS::Shared::setE
CUDA_CALLABLE_MEMBER void setE(real *e)
Definition: device_predictor_corrector_euler.cu:23

PredictorCorrectorEulerNS::Shared::vmax
real * vmax
Definition: device_predictor_corrector_euler.cuh:24

PredictorCorrectorEulerNS::Shared::~Shared
CUDA_CALLABLE_MEMBER ~Shared()
Definition: device_predictor_corrector_euler.cu:15

PredictorCorrectorEulerNS::Shared::setRho
CUDA_CALLABLE_MEMBER void setRho(real *rho)
Definition: device_predictor_corrector_euler.cu:26

PredictorCorrectorEulerNS::Shared::set
CUDA_CALLABLE_MEMBER void set(real *forces, real *courant, real *artVisc)
Definition: device_predictor_corrector_euler.cu:18

PredictorCorrectorEulerNS::Shared::e
real * e
Definition: device_predictor_corrector_euler.cuh:22