STŘELÁK, David, Carlos Óscar S. SORZANO, José María CARAZO a Jiří FILIPOVIČ. A GPU acceleration of 3-D Fourier reconstruction in cryo-EM. The International Journal of High Performance Computing Applications. SAGE Publishing, 2019, roč. 33, č. 5, s. 948-959. ISSN 1094-3420. Dostupné z: https://dx.doi.org/10.1177/1094342019832958.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název A GPU acceleration of 3-D Fourier reconstruction in cryo-EM
Název česky GPU akcelerace 3D Fourierovy rekonstrukce v cryo-EM
Autoři STŘELÁK, David (203 Česká republika, domácí), Carlos Óscar S. SORZANO, José María CARAZO a Jiří FILIPOVIČ (203 Česká republika, garant, domácí).
Vydání The International Journal of High Performance Computing Applications, SAGE Publishing, 2019, 1094-3420.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Spojené státy
Utajení není předmětem státního či obchodního tajemství
WWW URL
Impakt faktor Impact factor: 2.365
Kód RIV RIV/00216224:14610/19:00109272
Organizační jednotka Ústav výpočetní techniky
Doi http://dx.doi.org/10.1177/1094342019832958
UT WoS 000484527300014
Klíčová slova česky Cryo-EM; GPU; CUDA; 3D Fourierova rekonstrukce; auto-tuning
Klíčová slova anglicky Cryo-EM; GPU; CUDA; 3-D Fourier reconstruction; auto-tuning
Štítky J-Q2, rivok
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Jiří Filipovič, Ph.D., učo 72898. Změněno: 6. 4. 2020 20:44.
Anotace
Cryo-electron microscopy is a popular method for macromolecules structure determination. Reconstruction of a 3-D volume from raw data obtained from a microscope is highly computationally demanding. Thus, acceleration of the reconstruction has a great practical value. In this article, we introduce a novel graphics processing unit (GPU)-friendly algorithm for direct Fourier reconstruction, one of the main computational bottlenecks in the 3-D volume reconstruction pipeline for some experimental cases (particularly those with a large number of images and a high internal symmetry). Contrary to the state of the art, our algorithm uses a gather memory pattern, improving cache locality and removing race conditions in parallel writing into the 3-D volume. We also introduce a finely tuned CUDA implementation of our algorithm, using auto-tuning to search for a combination of optimization parameters maximizing performance on a given GPU architecture. Our CUDA implementation is integrated in widely used software Xmipp, version 3.19, reaching 11.4× speedup compared to the original parallel CPU implementation using GPU with comparable power consumption. Moreover, we have reached 31.7× speedup using four GPUs and 2.14×–5.96× speedup compared to optimized GPU implementation based on a scatter memory pattern.
Anotace česky
Cryo-elektronová mikroskopie je oblíbená metoda pro determinaci struktury makromolekul. Rekonstrukce 3D objektu z hrubých dat zázkaných z mikroskopu je vysoce výpočetně náročná. Proto má akcelerace rekonstrukce vysokou praktickou hodnotu. V tomto článku představujeme nový pro GPU architekturu vhodný algoritmus sloužící k přímé Fourierově rekonstrukci, což je jedna z výpočetně nejnáročnějších částí rekonstrukce 3D objektu v některých experimentech (především v takových, kde je použit velký počet obrázků s vysokou vnitřní symetrií). Ve srovnání se současným stavem poznání využívá náš algoritmus gather přístup do paměti, což zlepšuje cache lokalitu a odstraňuje race conditions v paralelním zápisu do 3D objemu. Představujeme také detailně vyladěnou CUDA implementaci algoritmu, která využívá autotuning pro vyhledání kombinace parametrů maximalizujích výkon na dané GPU architektuře. Naše CUDA implementace je integrována v široce používaném nástroji Xmipp verze 3.19 a dosahuje 11.4x zrychlení ve srovnání s původní paralelní CPU implementací při použití GPU s obdobnou spotřebou. Navíc jsme dosáhli 31.7x zrychlení při použití čtyř GPU a 2.14x až 5.96x zrychlení oproti optimalizované GPU implementaci založené na scatter přístupu do paměti.
Návaznosti
EF16_013/0001802, projekt VaVNázev: CERIT Scientific Cloud
MUNI/A/1018/2018, interní kód MUNázev: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 29. 7. 2024 00:18