J 2014

Genome assembly and annotation for red clover (Trifolium pratense; Fabaceae)

IŠTVÁNEK, Jan, Michal JAROŠ, Aleš KŘENEK a Jana ŘEPKOVÁ

Základní údaje

Originální název

Genome assembly and annotation for red clover (Trifolium pratense; Fabaceae)

Autoři

IŠTVÁNEK, Jan (203 Česká republika, domácí), Michal JAROŠ (203 Česká republika, domácí), Aleš KŘENEK (203 Česká republika, domácí) a Jana ŘEPKOVÁ (203 Česká republika, garant, domácí)

Vydání

American Journal of Botany, St Louis, Botanical Soc Amer Inc, 2014, 0002-9122

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

Genetika a molekulární biologie

Stát vydavatele

Spojené státy

Utajení

není předmětem státního či obchodního tajemství

Impakt faktor

Impact factor: 2.603

Kód RIV

RIV/00216224:14310/14:00073251

Organizační jednotka

Přírodovědecká fakulta

UT WoS

000340451700010

Klíčová slova česky

hodnocení softwaru pro assembly; de novo assembly; Fabaceae; anotace genomu; red clover; Trifolium pratense

Klíčová slova anglicky

assessment of assembly software; de novo assembly; Fabaceae; genome annotation; red clover; Trifolium pratense

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 1. 12. 2014 10:22, prof. RNDr. Jana Řepková, CSc.

Anotace

V originále

Red clover (Trifolium pratense ) is an important forage plant from the legume family with great importace in agronomy and livestock nourishment. Nevertheless, assembling its medium-sized genome presents a challenge, given current hardware and software possibilities. Next-generation sequencing technologies enable us to generate large amounts of sequence data at low cost. In this study, the genome assembly and red clover genome features are presented. First, assembly software was assessed using data sets from a closely related species to find the best possible combination of assembler plus error correction program to assemble the red clover genome. The newly sequenced genome was characterized by repetitive content, number of protein-coding and nonprotein-coding genes, and gene families and functions. Genome features were also compared with those of other sequenced plant species. Abyss with Echo correction was used for de novo assembly of the red clover genome. The presented assembly comprises ~314.6 Mbp. In contrast to leguminous species with comparable genome sizes, the genome of T. pratense contains a larger repetitive portion and more abundant retrotransposons and DNA transposons. Overall, 47 398 protein-coding genes were annotated from 64 761 predicted genes. Comparative analysis revealed several gene families that are characteristic for T.pratense. Resistance genes, leghemoglobins, and nodule-specifi c cystein-rich peptides were identifi ed and compared with other sequenced species. The presented red clover genomic data constitute a resource for improvement through molecular breeding and for comparison to other sequenced plant species.

Česky

Jetel luční (Trifolium pratense ) je důležitá pícnina ze skupiny leguminóz, s velkým významem pro zemědělství a výživu zvířat. Skládání sekvencí jeho genomu střední velikosti je důležitým úkolem z hlediska nalezení vhodného softwaru a hardwaru. Technika sekvenování nové generace umožňuje tvorbu velkého množství sekvenačních dat za nízkou cenu. V této práce jsou prezentovány výsledky skládání genomu jetele lučního a charakteristiky tohoto genomu. Software pro assembly byl hodnocen pomocí dat z blízce příbuzného druhu s cílem najít nejlepší kombinaci assembleru a programu pro korekci chyb. Nově osekvenovaný genom jetele lučního byl charakterizován z hlediska obsahu repeticí, počtu genů kódujících proteiny a nekódujících genů, genových rodin a jejich funkcí. Charakteristiky genomu byly porovnány s dalšími osekvenovanými genomy rostlin. Abyss a Echo byly využity pro de novo assembly genomu jetele lučního, která zahrnuje ~314.6 Mbp. Na rozdíl od jiných leguminóz s porovnatelnými genomy, obsahuje genom jetele lučního velký podíl repeticí a více retrotranspozonů a DNA transpozonů. Celkem bylo anotováno 47 398 genů kódujících proteiny z 64 761 predikovaných genů. Srovnávací analýza identifikovala několik genových rodin, které jsou characteristické pro T. pratense. Byly identifikovány geny rezistence, geny pro leghemoglobin a pro specifické peptidy hlízek. Genomická data jetele lučního jsou zdrojem pro zlepšování genomu prostřednictvím molekulárního šlechtění a pro srovnání s dalšími osekvenovanými druhy rostlin.

Návaznosti

LM2010005, projekt VaV
Název: Velká infrastruktura CESNET (Akronym: VI CESNET)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Velká infrastruktura CESNET
QI111A019, projekt VaV
Název: Nové genomické postupy pro šlechtění cizosprašných plodin na zlepšení užitkových vlastností (Akronym: HJ2010)
Investor: Ministerstvo zemědělství ČR, Nové genomické postupy pro šlechtění cizosprašných plodin na zlepšení užitkových vlastností, Udržitelný rozvoj agrárního sektoru