FILIPOVIČ, Jiří a Siegfried BENKNER. OpenCL Kernel Fusion for GPU, Xeon Phi and CPU. In Proceedings of IEEE International Symposium on Computer Architecture and High Performance Computing. Florianópolis: IEEE, 2015, s. 98-105. ISSN 1550-6533. Dostupné z: https://dx.doi.org/10.1109/SBAC-PAD.2015.29.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název OpenCL Kernel Fusion for GPU, Xeon Phi and CPU
Název česky Fúze OpenCL kernelů pro GPU, Xeon Phi a CPU
Autoři FILIPOVIČ, Jiří (203 Česká republika, garant, domácí) a Siegfried BENKNER (40 Rakousko).
Vydání Florianópolis, Proceedings of IEEE International Symposium on Computer Architecture and High Performance Computing, od s. 98-105, 8 s. 2015.
Nakladatel IEEE
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Brazílie
Utajení není předmětem státního či obchodního tajemství
Forma vydání paměťový nosič (CD, DVD, flash disk)
Kód RIV RIV/00216224:14330/15:00083464
Organizační jednotka Fakulta informatiky
ISSN 1550-6533
Doi http://dx.doi.org/10.1109/SBAC-PAD.2015.29
UT WoS 000380430500013
Klíčová slova česky OpenCL; fúze kernelů; GPU; Xeon Phi; MIC; CPU
Klíčová slova anglicky OpenCL; kernel fusion; GPU; Xeon Phi; MIC; CPU
Štítky firank_B
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 27. 8. 2019 11:57.
Anotace
Kernel fusion is an optimization method, in which the code from several kernels is composed to create a new, fused kernel. It can push the performance of kernels beyond limits given for their isolated, unfused form. In this paper, we introduce a classification of different types of kernel fusion for both data dependent and data independent kernels. We study kernel fusion on three types of OpenCL devices: GPU, Xeon Phi and CPU. Those hardware platforms have quite different properties, thus, kernel fusion often affects performance in quite different ways. We analyze the impact of kernel fusion on those hardware platforms and show how it can be used to improve performance. Based on our study we also introduce a basic transformation method for generating fused kernels, which has good potential to be automatized.
Návaznosti
EE2.3.30.0037, projekt VaVNázev: Zaměstnáním nejlepších mladých vědců k rozvoji mezinárodní spolupráce
VytisknoutZobrazeno: 25. 4. 2024 13:16