STŘELÁK, David, Carlos Óscar S. SORZANO, José María CARAZO and Jiří FILIPOVIČ. A GPU acceleration of 3-D Fourier reconstruction in cryo-EM. The International Journal of High Performance Computing Applications. SAGE Publishing, vol. 33, No 5, p. 948-959. ISSN 1094-3420. doi:10.1177/1094342019832958. 2019.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name A GPU acceleration of 3-D Fourier reconstruction in cryo-EM
Name in Czech GPU akcelerace 3D Fourierovy rekonstrukce v cryo-EM
Authors STŘELÁK, David (203 Czech Republic, belonging to the institution), Carlos Óscar S. SORZANO, José María CARAZO and Jiří FILIPOVIČ (203 Czech Republic, guarantor, belonging to the institution).
Edition The International Journal of High Performance Computing Applications, SAGE Publishing, 2019, 1094-3420.
Other information
Original language English
Type of outcome Article in a journal
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher United States of America
Confidentiality degree is not subject to a state or trade secret
WWW URL
Impact factor Impact factor: 2.365
RIV identification code RIV/00216224:14610/19:00109272
Organization unit Institute of Computer Science
Doi http://dx.doi.org/10.1177/1094342019832958
UT WoS 000484527300014
Keywords (in Czech) Cryo-EM; GPU; CUDA; 3D Fourierova rekonstrukce; auto-tuning
Keywords in English Cryo-EM; GPU; CUDA; 3-D Fourier reconstruction; auto-tuning
Tags J-Q2, rivok
Tags International impact, Reviewed
Changed by Changed by: RNDr. Jiří Filipovič, Ph.D., učo 72898. Changed: 6/4/2020 20:44.
Abstract
Cryo-electron microscopy is a popular method for macromolecules structure determination. Reconstruction of a 3-D volume from raw data obtained from a microscope is highly computationally demanding. Thus, acceleration of the reconstruction has a great practical value. In this article, we introduce a novel graphics processing unit (GPU)-friendly algorithm for direct Fourier reconstruction, one of the main computational bottlenecks in the 3-D volume reconstruction pipeline for some experimental cases (particularly those with a large number of images and a high internal symmetry). Contrary to the state of the art, our algorithm uses a gather memory pattern, improving cache locality and removing race conditions in parallel writing into the 3-D volume. We also introduce a finely tuned CUDA implementation of our algorithm, using auto-tuning to search for a combination of optimization parameters maximizing performance on a given GPU architecture. Our CUDA implementation is integrated in widely used software Xmipp, version 3.19, reaching 11.4× speedup compared to the original parallel CPU implementation using GPU with comparable power consumption. Moreover, we have reached 31.7× speedup using four GPUs and 2.14×–5.96× speedup compared to optimized GPU implementation based on a scatter memory pattern.
Abstract (in Czech)
Cryo-elektronová mikroskopie je oblíbená metoda pro determinaci struktury makromolekul. Rekonstrukce 3D objektu z hrubých dat zázkaných z mikroskopu je vysoce výpočetně náročná. Proto má akcelerace rekonstrukce vysokou praktickou hodnotu. V tomto článku představujeme nový pro GPU architekturu vhodný algoritmus sloužící k přímé Fourierově rekonstrukci, což je jedna z výpočetně nejnáročnějších částí rekonstrukce 3D objektu v některých experimentech (především v takových, kde je použit velký počet obrázků s vysokou vnitřní symetrií). Ve srovnání se současným stavem poznání využívá náš algoritmus gather přístup do paměti, což zlepšuje cache lokalitu a odstraňuje race conditions v paralelním zápisu do 3D objemu. Představujeme také detailně vyladěnou CUDA implementaci algoritmu, která využívá autotuning pro vyhledání kombinace parametrů maximalizujích výkon na dané GPU architektuře. Naše CUDA implementace je integrována v široce používaném nástroji Xmipp verze 3.19 a dosahuje 11.4x zrychlení ve srovnání s původní paralelní CPU implementací při použití GPU s obdobnou spotřebou. Navíc jsme dosáhli 31.7x zrychlení při použití čtyř GPU a 2.14x až 5.96x zrychlení oproti optimalizované GPU implementaci založené na scatter přístupu do paměti.
Links
EF16_013/0001802, research and development projectName: CERIT Scientific Cloud
MUNI/A/1018/2018, interní kód MUName: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII.
Investor: Masaryk University, Category A
PrintDisplayed: 29/3/2024 06:40