2012
Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method
FILIPOVIČ, Jiří; Jan FOUSEK; Bedřich LAKOMÝ a Matúš MADZINZákladní údaje
Originální název
Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method
Název česky
Automaticky optimalizovaná GPU akcelerace elementárních subrutin v metodě konečných prvků
Autoři
Vydání
LOS ALAMITOS, CA, USA, Symposium on Application Accelerators in High Performance Computing, od s. 141-144, 4 s. 2012
Nakladatel
IEEE
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Spojené státy
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14330/12:00057469
Organizační jednotka
Fakulta informatiky
ISBN
978-1-4673-2882-1
UT WoS
Klíčová slova česky
GPGPU; optimalizace kódu; fúze kernelů; FEM
Klíčová slova anglicky
GPGPU; code optimization; kernel fusion; FEM
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 11. 4. 2013 10:58, doc. RNDr. Jiří Filipovič, Ph.D.
V originále
The element subroutines in finite element method (FEM) provides enough parallelism to be successfully accelerated by contemporary GPUs. However, their efficient implementation is not straightforward and requires time-consuming exploration of numerous implementation variants. In this paper, we present optimization by kernel fusion for element subroutines. Moreover, we show how the optimization is automated using our source-to-source compiler. We demonstrate the optimization of the element subroutines for FEM model using St.\,Venant-Kirchhoff material. The performance of code generated by our compiler outperforms our previously published hand-tuned implementation by factor of 1.32 -- 1.54 depending on used GPU architecture. Although the optimization technique is demonstrated on element subroutines for using St.\,Venant-Kirchhoff material, it is generally usable for wider area of computationally-demanding problems.
Česky
Subrutiny aplikované na elementy v metodě konečných prvků (FEM) poskytují dostatečný paralelismus k tomu, aby byly akcelerovány dnešnímy GPU. Jejich efektivní implementace není však přímočará, vyžaduje časově náročný průzkum mnoha variant implementace. V tomto článku prezentujeme optimalizaci pomocí fúzí kernelů pro subroutiny aplikované na elementy. Navíc ukazujeme, jak tato optimalizace může být automatizována pomocí našeko překladače ze zdrojového do zdrojového kódu. Demonstrujeme optimalizaci subrutin pro FEM model používající St. Venant-Kirchhoff materiál. Výkon kódu generovaného naším překladačem překoná dříve publikovanou ručně-optimalizovanou implementaci 1.32-1.54x, v závislosti na použité GPU architektuře. Ačkoliv je optimalizační technika demonstrovaná na subroutinách pro St. Venant-Kirchhoff materiál, je zároveň obecně použitelná pro širší oblast výpočetně náročných problémů.
Návaznosti
| GD102/09/H042, projekt VaV |
| ||
| MUNI/A/0914/2009, interní kód MU |
|