FILIPOVIČ, Jiří, Jan FOUSEK, Bedřich LAKOMÝ and Matúš MADZIN. Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method. Online. In Symposium on Application Accelerators in High Performance Computing. LOS ALAMITOS, CA, USA: IEEE, 2012, p. 141-144. ISBN 978-1-4673-2882-1.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Automatically Optimized GPU Acceleration of Element Subroutines in Finite Element Method
Name in Czech Automaticky optimalizovaná GPU akcelerace elementárních subrutin v metodě konečných prvků
Authors FILIPOVIČ, Jiří (203 Czech Republic, guarantor, belonging to the institution), Jan FOUSEK (203 Czech Republic, belonging to the institution), Bedřich LAKOMÝ (203 Czech Republic, belonging to the institution) and Matúš MADZIN (703 Slovakia, belonging to the institution).
Edition LOS ALAMITOS, CA, USA, Symposium on Application Accelerators in High Performance Computing, p. 141-144, 4 pp. 2012.
Publisher IEEE
Other information
Original language English
Type of outcome Proceedings paper
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher United States of America
Confidentiality degree is not subject to a state or trade secret
Publication form electronic version available online
RIV identification code RIV/00216224:14330/12:00057469
Organization unit Faculty of Informatics
ISBN 978-1-4673-2882-1
UT WoS 000309942800019
Keywords (in Czech) GPGPU; optimalizace kódu; fúze kernelů; FEM
Keywords in English GPGPU; code optimization; kernel fusion; FEM
Tags International impact, Reviewed
Changed by Changed by: doc. RNDr. Jiří Filipovič, Ph.D., učo 72898. Changed: 11/4/2013 10:58.
Abstract
The element subroutines in finite element method (FEM) provides enough parallelism to be successfully accelerated by contemporary GPUs. However, their efficient implementation is not straightforward and requires time-consuming exploration of numerous implementation variants. In this paper, we present optimization by kernel fusion for element subroutines. Moreover, we show how the optimization is automated using our source-to-source compiler. We demonstrate the optimization of the element subroutines for FEM model using St.\,Venant-Kirchhoff material. The performance of code generated by our compiler outperforms our previously published hand-tuned implementation by factor of 1.32 -- 1.54 depending on used GPU architecture. Although the optimization technique is demonstrated on element subroutines for using St.\,Venant-Kirchhoff material, it is generally usable for wider area of computationally-demanding problems.
Abstract (in Czech)
Subrutiny aplikované na elementy v metodě konečných prvků (FEM) poskytují dostatečný paralelismus k tomu, aby byly akcelerovány dnešnímy GPU. Jejich efektivní implementace není však přímočará, vyžaduje časově náročný průzkum mnoha variant implementace. V tomto článku prezentujeme optimalizaci pomocí fúzí kernelů pro subroutiny aplikované na elementy. Navíc ukazujeme, jak tato optimalizace může být automatizována pomocí našeko překladače ze zdrojového do zdrojového kódu. Demonstrujeme optimalizaci subrutin pro FEM model používající St. Venant-Kirchhoff materiál. Výkon kódu generovaného naším překladačem překoná dříve publikovanou ručně-optimalizovanou implementaci 1.32-1.54x, v závislosti na použité GPU architektuře. Ačkoliv je optimalizační technika demonstrovaná na subroutinách pro St. Venant-Kirchhoff materiál, je zároveň obecně použitelná pro širší oblast výpočetně náročných problémů.
Links
GD102/09/H042, research and development projectName: Matematické a inženýrské metody pro vývoj spolehlivých a bezpečných paralelních a distribuovaných počítačových systémů
Investor: Czech Science Foundation
MUNI/A/0914/2009, interní kód MUName: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace (Acronym: SV-FI MAV)
Investor: Masaryk University, Category A
PrintDisplayed: 19/7/2024 01:33