Automatically Optimized GPU Acceleration of Element Subroutines
in Finite Element Method

D 2012

Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method

FILIPOVIČ, Jiří; Jan FOUSEK; Bedřich LAKOMÝ a Matúš MADZIN

Základní údaje

Originální název

Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method

Název česky

Automaticky optimalizovaná GPU akcelerace elementárních subrutin v metodě konečných prvků

Autoři

FILIPOVIČ, Jiří; Jan FOUSEK ; Bedřich LAKOMÝ a Matúš MADZIN

Vydání

LOS ALAMITOS, CA, USA, Symposium on Application Accelerators in High Performance Computing, od s. 141-144, 4 s. 2012

Nakladatel

IEEE

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Spojené státy

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/12:00057469

Organizační jednotka

Fakulta informatiky

ISBN

978-1-4673-2882-1

UT WoS

000309942800019

Klíčová slova česky

GPGPU; optimalizace kódu; fúze kernelů; FEM

Klíčová slova anglicky

GPGPU; code optimization; kernel fusion; FEM

Příznaky

Mezinárodní význam, Recenzováno

Změněno: 11. 4. 2013 10:58, doc. RNDr. Jiří Filipovič, Ph.D.

Anotace

ORIG CZ

V originále

The element subroutines in finite element method (FEM) provides enough parallelism to be successfully accelerated by contemporary GPUs. However, their efficient implementation is not straightforward and requires time-consuming exploration of numerous implementation variants. In this paper, we present optimization by kernel fusion for element subroutines. Moreover, we show how the optimization is automated using our source-to-source compiler. We demonstrate the optimization of the element subroutines for FEM model using St.\,Venant-Kirchhoff material. The performance of code generated by our compiler outperforms our previously published hand-tuned implementation by factor of 1.32 -- 1.54 depending on used GPU architecture. Although the optimization technique is demonstrated on element subroutines for using St.\,Venant-Kirchhoff material, it is generally usable for wider area of computationally-demanding problems.

Česky

Subrutiny aplikované na elementy v metodě konečných prvků (FEM) poskytují dostatečný paralelismus k tomu, aby byly akcelerovány dnešnímy GPU. Jejich efektivní implementace není však přímočará, vyžaduje časově náročný průzkum mnoha variant implementace. V tomto článku prezentujeme optimalizaci pomocí fúzí kernelů pro subroutiny aplikované na elementy. Navíc ukazujeme, jak tato optimalizace může být automatizována pomocí našeko překladače ze zdrojového do zdrojového kódu. Demonstrujeme optimalizaci subrutin pro FEM model používající St. Venant-Kirchhoff materiál. Výkon kódu generovaného naším překladačem překoná dříve publikovanou ručně-optimalizovanou implementaci 1.32-1.54x, v závislosti na použité GPU architektuře. Ačkoliv je optimalizační technika demonstrovaná na subroutinách pro St. Venant-Kirchhoff materiál, je zároveň obecně použitelná pro širší oblast výpočetně náročných problémů.

Návaznosti

GD102/09/H042, projekt VaV

Název: Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů

Investor: Grantová agentura ČR, Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů

MUNI/A/0914/2009, interní kód MU

Název: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace (Akronym: SV-FI MAV)

Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty

Přehled o publikaci