Detailed Information on Publication Record
2019
A GPU acceleration of 3-D Fourier reconstruction in cryo-EM
STŘELÁK, David, Carlos Óscar S. SORZANO, José María CARAZO and Jiří FILIPOVIČBasic information
Original name
A GPU acceleration of 3-D Fourier reconstruction in cryo-EM
Name in Czech
GPU akcelerace 3D Fourierovy rekonstrukce v cryo-EM
Authors
STŘELÁK, David (203 Czech Republic, belonging to the institution), Carlos Óscar S. SORZANO, José María CARAZO and Jiří FILIPOVIČ (203 Czech Republic, guarantor, belonging to the institution)
Edition
The International Journal of High Performance Computing Applications, SAGE Publishing, 2019, 1094-3420
Other information
Language
English
Type of outcome
Článek v odborném periodiku
Field of Study
10201 Computer sciences, information science, bioinformatics
Country of publisher
United States of America
Confidentiality degree
není předmětem státního či obchodního tajemství
References:
Impact factor
Impact factor: 2.365
RIV identification code
RIV/00216224:14610/19:00109272
Organization unit
Institute of Computer Science
UT WoS
000484527300014
Keywords (in Czech)
Cryo-EM; GPU; CUDA; 3D Fourierova rekonstrukce; auto-tuning
Keywords in English
Cryo-EM; GPU; CUDA; 3-D Fourier reconstruction; auto-tuning
Tags
International impact, Reviewed
Změněno: 6/4/2020 20:44, doc. RNDr. Jiří Filipovič, Ph.D.
V originále
Cryo-electron microscopy is a popular method for macromolecules structure determination. Reconstruction of a 3-D volume from raw data obtained from a microscope is highly computationally demanding. Thus, acceleration of the reconstruction has a great practical value. In this article, we introduce a novel graphics processing unit (GPU)-friendly algorithm for direct Fourier reconstruction, one of the main computational bottlenecks in the 3-D volume reconstruction pipeline for some experimental cases (particularly those with a large number of images and a high internal symmetry). Contrary to the state of the art, our algorithm uses a gather memory pattern, improving cache locality and removing race conditions in parallel writing into the 3-D volume. We also introduce a finely tuned CUDA implementation of our algorithm, using auto-tuning to search for a combination of optimization parameters maximizing performance on a given GPU architecture. Our CUDA implementation is integrated in widely used software Xmipp, version 3.19, reaching 11.4× speedup compared to the original parallel CPU implementation using GPU with comparable power consumption. Moreover, we have reached 31.7× speedup using four GPUs and 2.14×–5.96× speedup compared to optimized GPU implementation based on a scatter memory pattern.
In Czech
Cryo-elektronová mikroskopie je oblíbená metoda pro determinaci struktury makromolekul. Rekonstrukce 3D objektu z hrubých dat zázkaných z mikroskopu je vysoce výpočetně náročná. Proto má akcelerace rekonstrukce vysokou praktickou hodnotu. V tomto článku představujeme nový pro GPU architekturu vhodný algoritmus sloužící k přímé Fourierově rekonstrukci, což je jedna z výpočetně nejnáročnějších částí rekonstrukce 3D objektu v některých experimentech (především v takových, kde je použit velký počet obrázků s vysokou vnitřní symetrií). Ve srovnání se současným stavem poznání využívá náš algoritmus gather přístup do paměti, což zlepšuje cache lokalitu a odstraňuje race conditions v paralelním zápisu do 3D objemu. Představujeme také detailně vyladěnou CUDA implementaci algoritmu, která využívá autotuning pro vyhledání kombinace parametrů maximalizujích výkon na dané GPU architektuře. Naše CUDA implementace je integrována v široce používaném nástroji Xmipp verze 3.19 a dosahuje 11.4x zrychlení ve srovnání s původní paralelní CPU implementací při použití GPU s obdobnou spotřebou. Navíc jsme dosáhli 31.7x zrychlení při použití čtyř GPU a 2.14x až 5.96x zrychlení oproti optimalizované GPU implementaci založené na scatter přístupu do paměti.
Links
EF16_013/0001802, research and development project |
| ||
MUNI/A/1018/2018, interní kód MU |
|