Manipulace se sekvenčními daty Získání a manipulace se sekvencemi Databases 1 Entrez SRS Retrival System i DNA NCBI-GenBANK DDBJ EBI-EMBL Information Sequnece, Pdb, Image Protein PIR SWISSPROT EXPASY, PDB Softwares v._ í_ GCG SeqWEB Vector NTI JGenoMAX CLC Workbench GenBANK GCG FASTA Staden Image Formats Sequence Converter Sdílení dat v základních databázích J> NCBI OOnBdnki http://www.ncbi.nlm.nih.gov/ National Center for Biotechnology Information (NCBI) DDBJ D D BÜ '• http://www. ddbj. nig. ac.jp/ National Institute of Genetics (NIG) EMBLi http://www.ebi.ac.uk embl European Bioinformatics Institute (EBI) European Bioinformatics Institute_ ExPASy: http://tw.expasy.org Expert Protein Analysis System Zápis sekvence Sekvence - zápis posloupnosti jednoznačných znaků odpovídajících jednotlivým zbytkům (monomerům), které se nacházejí v odpovídající posloupnosti v dané makromolekule ♦ DNA nebo RNA od 5'-konce k 3'-konci protein od N-konce k C-konci ■ používají se jednopísmenové kódy dle pravidel IUPAC Standardní kódy pro sekvence nukleových kyselin podle IUB/IUPAC A adenosin C cytidin G guanidin T thymidin U uridin R G/A (puRin) Y T/C (pYrimidin) K G/T (nukleosid s Keto skupinou) M A/C (nukleosid s aMino skupinou) S G/C (silná = strong vazba) W A/T (slabá = Weak vazba) B G/T/C (not A) D G/A/T (not C) H A/C/T (not G) V G/C/A (not T) N A/G/C/T (jakýkoli) - mezera (gap) neurčené délky Standardní kódy pro sekvence aminokyselin podle IUB/IUPAC A alanin B kys. asparag ová n ebo asparag i n C cystein D kys. asparag ová E kys. glutamová F fenylalanin G glycin H histidin I isoleucin K lysin L leucin M metionin N asparag i n P prolin Q glutamin R arginin S serin T treonin U selenocystein V valin W tryptofan Y tyrosin Z kys. glutamová nebo glutamin X jakákoli aminokyselina * translační stop (terminační kodon) mezera (gap) neurčené délky Soubory se sekvencemi DNA/proteinů ■ Rozdílné formáty ♦ Informační obsah ■ Konverze ■ Použití ■ Editace Běžné formáty sekvencí http://orion.sci.muni.cz/kqmb/bioinformat/seq samples.htm ■ FASTA ■ Genbank ■ EMBL ■ GCG ■ PIR ■ ASN1 ■ IG(lntelligenetics) ■ Text Formáty sekvencí obsahující mnohonásobná přiložení ■ Multi FASTA ■ Phylip ■ PAUP/NEXUS ■ Clustal ■ MSF PLAIN SEQUENCE FORMAT FASTA FORMAT EMBL FORMAT GENBANK FORMAT Poznámka k používaným fontům gaattttttt cttaaa&cicičL Proporcionální fonty ♦ Arial, Times Každý znak jma sirka Nevhodné Neproporcionální fonty ♦ Vhodné k použití ♦ Všechny znaky stejná šíka Courier, Monospaced K editaci jsou vhodné editory, které neukládají informace o formátu textu (Notepad, vývojářské editory - PSPad, aj.) Některé formáty jako např. GCG obsahují vnitřní kontrolní součty Surová data - elektroforetogramy ze sekvenování v kapiláře Různé formáty ♦ *.abi ♦ *.ab1 ♦ *.scf Prohlížeče ♦ Chromas ♦ ABIView ♦ Ridom Trace Edit Export FASTA ♦ Prostý text Lipl-il.abl - Chromas File Edit Options Help y V m ■+N #4 I Open Save Export Print Next Find Sample: Lipl-il Basels 100 110 TCCCCG TG CCGCG GTCCATCACA CTC P V P R f„ S I T L N T J P E A 'A 1 V H H T "' Q H H 120 CACCACAT T H 130 GGCGC G G A V O l,l.,„ I,. -1.1;. i- i •• H- ■■■■■> It Q*_fa«:atí_A8750_l65< »I [C (PHOmr Sí_h«fl_AZ3M5je.St «bl [OÍPioojím™ OB Citeu» »11778 16Sr atil (C:V*o»»r« 2 yjA twdrcph láSt.abl (C ^proo/al QAjMMkjMKOJttf.AI [CAProřW Bjxrets_M1778_169.abl [C:V>ogr«W »8_««CS».rs**«a_jrcC5«J> [C:\Dotu Otó^areCSa.rsxJřConbo. (C:\pokircnteu 5ji«0L*237«_169 abl [CVTooamms C_««tovJM»6a_I$Sf.abl [C:V*09r«r> ».Kr*ool>.A3S654_165l.»l (C IPraV« Cja»_/M38WJeSr.*l [C:\FV09r«» < > Posten: 9 Quatty: 24 [C] Sttotted: 0 Jednoduché formáty sekvencí mají omezení a neobsahují ■ Data o expresi genů ■ Variace a polymorfismy ■ WWW odkazy na další informace ■ Specifické informace o klonech Konverze formátů sekvencí UNIX-GCG ♦ To Genbank, To Fasta.... ♦ From Genbank, From Fasta... READSEQ, SEQRET ■ http://www.ebi.ac.uk/Tools/sfc/readseq/ SMS - The Sequence Manipulation Suite v2 ♦ http://www.bioinformatics.org/sms2/ EMBLto FASTA ♦ GenBankto FASTA ♦ Reverse Complement Filter DNA / Protein Příklady jednoduchých manipulací Spojování / rozdělování ♦ subsekvence Převod na reverzní komplementární ♦ Ne reverzní ♦ Ne komplementární Translace ♦ Volba vhodného genetického kódu Hledání ♦ Přesné versus podobné Hledání motivů GAATTC GARYTC GAAN(l-50)TTC Standardní příklady hledání Reštrikční místa Repetice přímé Obrácené (vlásenky se smyčkou) Konsenzní vzory Uživatelem definované vzory Otevřené čtecí rámce Reštrikční analýza in silico m Reštrikční endonukleázy třídy II ♦ Sekvenčně specifické endonukleázy, které štěpí DNA v rozpoznávaných sekvencích ♦ Přehled dostupný v databázi REBASE- Restriction Enzyme Database http ://rebase. neb .com/rebase/rebase .html ♦ Sekvence rozpoznávacích míst ♦ Producent enzymu ♦ Reference ♦ Komerční dostupnost ♦ Sekvence genů ♦ Krystalografická data ♦ Citlivost k metylaci ♦ REBpredictor - predikce rozpoznávací sekvence u nových enzymů Rebase genomes - identifikace genů pro RE v genomech Software pro reštrikční mapování ■ Konstrukce restrikčních map na základě analýzy sekvence DNA-vyhledání restrikčních míst ♦ Nezbytný předpoklad pro klonování Interpretace RFLP polymorfizmu Simulace výsledků gelové elektroforézy restrikčních fragmentů ■ Virtuální klonování ■ Vytvoření kvalitní grafiky ilustrující reštrikční mapy ♦ RestrictionMapper (http://www.restrictionmapper.org/) ♦ WebCutter (http://www.firstmarket.com/cutter/cut2.html) ♦ NEB Cutter v2.0 (http://tools.neb.com/NEBcutter2/) ♦ EMBOSS Restrict (http://bioweb.pasteur.fr/seqanal/interfaces/restrict.html) ♦ Restriction Maps (http://arbl.cvmbs.colostate.edu/molkit/mapper/index.html) pDRAW32 (http://www.acaclone.com/) Výsledky reštrikční analýzy in silico ■ Enzymy - výstup tabulka ♦ kompletní sada ♦ komerční sada ♦ které sekvenci neštěpí ♦ které štěpí - počet a pozice rozpoznávacích míst ■ Lineární nebo kružnicová mapa sekvence se znázorněním pozice restrikčních míst ♦ Grafika ♦ Identifikace ORF a translace do proteinu NEB Cutter http://tools.neb.com/NEBcutter2/ ma ^}) & http://tooli.neb.... p - §0 % NEB cutter G> * €s5 um'OJGLMD SoLabsi NEBc utter Circular Sequence: LOS752 - Cleavage code Help Comments L-ieavd Display: - XEB single cutter restriction enzymes I I blunt end cut - Main non-overlapping, min. 100 aa ORFs W 5' extension GC=51%, AT=49% ^ I 3' extension T I cuts 1 strand ORFs: a: 286 aa b: 133 aa c: 118 aa Enzyme name code — Available from NEB Has other supplier Not commercially available *: cleavage affected by CpG meth. It: cleavage affected by other meth. (enz.name): ambiguous site WARNING: Not all enzymes shown See linear display x*PluTI ^*SfoI "~*NarI 'tKssl BstAPIvNdeI EcoO-1091 "*flatlls*Zrai % 100% Vyhledání otevřených čtecích rámců ■ ORF (Open Reading Frame) Sada překládaných kodonů mezi iniciačním a terminačním kodonem ■ Výsledek je závislý na použitém genetickém kódu ♦ U prokaryot, které nemají introny je základem hledání genů ♦ U eukaryot zpravidla využíváme analýzu sekvencí komplementární DNA (cDNA) ORF Finder (Open Reading Frame Finder) http://www.ncbi.nlm.nih.gov/qorf/qorf.html <- -> O fi D www.ricbi.nlm.nih.gov/gorf/ % NCBI ORF Finder (Open Reading Frame Finder) Entrez BLAST Taxonomy Structure The ORF Finder (Open Reading Frame Finder) is a graphical analysis tool which finds all open reading frames of a selectable minimum size in a user's sequence or in a sequence already in the database. This tool identifies all open reading frames using the standard or alternative genetic cades. The deduced amino acid sequence can be saved in various formats and searched against the sequence database using the WWW BLAST server. The ORF Finder should be helpful in preparing complete and accurate sequence submissions. It is also packaged with the Sequin sequence submission software. Enter Gl or ACCESSION or sequence in FASTA format OrfFind Clear AF513857 FROM: Genetic codes NCBI I Tools for data mining GenBank sequence submission support and software FTP site download data and software 11 Bacterial Code Translace in silico ■ 6 možných čtecích rámců ■ Vymezené oblasti - exony ■ Jaký genetický kód? Databáze genetických kódů v NCBI ♦ http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wp rintqc.cai EMBOSS Transeq http://www.ebi.ac.uk/Tools/st/emboss transeq '- Q http://www.ebi.ac.... P ■» § C EMBOSS Transeq < Sequen... x ^ & ® EMBL-EBI Services Research Training Industry About us Input form | Web services | Help & Documentation Tools > Sequence Translation > EMBOSS Transeq < Share Feedback EMBOSS Transeq EMBOSS Transeq translates nucleic acid sequences to their corresponding peptide sequences. It can translate to the three forward and three reverse frames, and output multiple frame translations at once. STEP 1 - Enter your input sequence Enter or paste a set of |DNA/RNA v| sequences in any supported format: Or, upload a file: F (Forward three frames) -1 2 3 R (Reverse three frames) 6 (All six frames)_ Procházet.. CODON TABLE Standard Code ost users and, for that reason, are not visible. M00% - Příklady translace in silico Translate Tool - Results of translation Open reading frames are highlighted in refl Please select one of the following frames 5'3' Frame 1 11ZQCAKSNSET"FAMPLDTCGAMS QGMIGYWLET EIKRILT EMNS DRTVGTIVT RVEVD KDDPRFDNPT KPIGPF YT KE E VE E LQKE QPDS VFKE DAGRG YRKWAS PLPQSILE HQLI QT LADGKNIVIACGGGGIPVIKKEKT YE GVEA 53' Frame 2 Y-SHKLNRTVT QRRQC HWIL WQCHRV—AIGWKLKSIAF-LK-1VIEL-AQSLHVWK-1 KMIHDLIT QLNQLVLFIRKKKLKN YKKNS QT QS LKKMQDWIEK -1RH H YLNL Y-NT S - F KL -QT VKILSLHAWAVFQL-KKK Z FMKVLK 5'3' Frame 3 INPTS-IEQ-HNAGNAIGYLWCNVT GYDRLLVGN-NQS HFN-NE---NC RHNRYTCGSR- R-STI--PN-TNWSFLYERRS-RITKRTARLSL-RRCRTWL-KSSCVTTTSIYTRTPVNS NFS RR-KYCH CMRWWRYS S YKKRKYL-RC - S Příklady translace in silico EMBOSS Sixpack Input Form | Web services | Help & Documentation Tools > Sequence .Translation > EMBOSS Sixpack Results for job emboss_sixpack-l20141006-192122-0940-32029869-oy Result Summary Tool Output Submission Details Download Sixpack File DÍEDSS 001 LL IQQAKSH5DTT P A M P L D T Fl Y * 5NKLNB.TVTQRRQCHWI1 72 IlTPTS*IEQ*HNňGNAIGYl F3 1 TtattAaTccaACAaGCTAAatCGAACaGTGACACAkCGCC^^ 60 ----.----i----.----i----.----1----.----i----.----1----.----1 1 AataaTtíigigtTGTtCGa.TrtaGCrTGtCACTGTGTTGCGGCCGrrACGGTAaCCTATGa 60 XNIWCALDFLSVVGAIGNSV F6 XIIGVL*ISCHCLAPLAMPY FS * * DLLS FRVTVCRRCHWQ IS F4 CGAMSQGMI GYWLETEIHRI Fl VVQCHRV* iAIGWRrLKSIAF T2 WCNVTGYDRLIVGN*NQ5HF F3 61 TGTGGT&CAaTGTCACAGGGTArGATAGGCTATTGGTTGGA^rGAiiArCAATCGCATT 120 ----.----i----.----i----.----1----.----i----.----1----.----1 61 ACACCACGTTACAGTGTCCCArACrATCCGATAaCCA&CCTTTGACrrrAGTTAGCGTAA 120 QPAIDCPIIP*QNSVSILRM F6 KHH1TVPYSL5NTPFQF±DC F5 TTCH*LrHYAIPQFSFDIAN F4 Další typy analýz sekvencí DNA Analýza využití kodonů Klonování in silico, konstrukce vektorů Návrh sekvencí oligonukleotidů ■ primery pro PCR ■ primery pro sekvenování ■ hybridizační sondy Párové přiložení sekvencí, stanovení identity podobnosti Mnohonásobné přiložení sekvencí Nejčastěji používané softwarové balíky pro manipulaci se sekvencemi a jejich analýzu Accelrys GCG Package (Accelrys Inc., San Diego, CA) Vector NTI® (Life Technologies, Carlsbad, CA) CLC Genomics Workbench (CLC bio, Cambridge, MA) The Bioinformatics Toolbox rozšíření pro MATLAB® Hitachi DNASIS® MAX Sequence Analysis Software (Helixx Technologies, Inc., Canada) DNASTAR Lasergene (DNASTAR, Inc., Madison, Wl) Příklad software Vector NTI Vector NTI - [pBR322] File Edit View Molecule Analyze Gel DB List Tools Window Help □EE -Ifflx án| a ďl »1 1^1 □ ^ General (I DHA Plasmi ATCC 37017 length: 43 storage ty form: Giro □ €3 Function CDS (3 Miscfe Promote RBS [2 S 0 s s [151 2Ö1 CTTGGTTATG CCGGTACTGC CGGGCCTCTT GCGGGATATC GTCCATTCCS ^ GAACCAATAC GGCCATGACG GCCCGGAGAA CGCCCTATAG CAGGTAAGGT Ready ACAGCATCGC CAGTCACTAT GGCGTGCTGC TAGCGCTATA TGCGTTGATG TGTCGTAGCG GTCAGTGATA CCGCACGACG ATCGCGATAT ACGCAACTAC CAATTTCTAT GCGCACCCGT TCTCGGAGCA CTGTCCGACC GCTTTGGCCG 200 bp-1200 bp 1201 bp [2 A Analýza využití kodonů (codon usage) Využití synonymních kodonů ♦ není náhodné ♦ je rozdílné u různých genomů, které mají určité preferované kodony pro určité aminokyseliny Databáze využití kodonů http ://www. kaz usa. o r. i p/codo n/ The Hurnan Codon Usage Table ! Cly I GGG ! 17.08 i 0.23 j Arg j AGG | 12.09 j 0.22 j Trp ! TGG j 14.74 ! 1.00 j Arg j CGG 110.40 j 0.19 j I Gly ! GGA ! 19.31 ! 0.26 I Arg | AGA | 11.73 | 0.21 I End I TGA I 2.64 I 0.61 ! Arg ! COA ! 5.63 i 0.10 I ! Oly ! GGT i 13.66 ! 0.18 I Ser ! AGT j 10.18 ! 0.14 j Otf I TG1 | 9.99 j 0.42 | Arg j COT j 5.16 i 0.09 | ! Oly j GGC 124.94 i 0.33 j Ser j AGC | 18.54 | 0.25 I Otf I TGC j 13.85 j 0.58 | Arg j COC j 10.S2 i 0.19 | ! Olu ! GAG i 38.82 j 0.59 | Lys ! AAG i 33.79 i 0.60 j End j TAG j 0.73 j 0.17 | Gin j CAG j 32.95 i 0.73 j ! Glu j GAA ! 27.51 I 0.41 j Lys j AAA | 22.32 | 0.40 j End j TAA j 0.95 j 0.22 | Gin j CAA ! 11.94 i 0.27 j Klonování in siiico, konstrukce vektorů ■ Kombinace segmentů sekvencí ♦ známé/neznámé funkce ■ Plazmidy ♦ přebírané z databáze ♦ zpravidla známé funkce ■ Inzerty - obvykle nové sekvence ♦ charakterizované reštrikční mapou ♦ charakterizované sekvencí DNA ♦ charakterizované funkcí ■ Nomenklatura pro konstrukty není stanovena Clone Manager (Sci-Ed Software) http://www.scied.com/pr cmbas.htm [W1 Clone Manager File View Clone Map Primer Align Discover Operations Window Help a D EU iil £ 5*ľ =■ Ö\ iai^i = i2' riS Sa I í SYN P U C18V (2686 bps] ^ x ^ . \ _ / ' 5 mini extension n%infliT-rf!Tíií*'}' I 1 s 2 minutes 72 °C only dNTP's I V K- .1 M-r PCR - Syntéza obou řetězců u specifické sekvence 5' 3' TTGAGAAAGGAATAAGCAGAATTCGTTCCAAAAAGAATGAGCTGTTGTTTGCAGAAATCGAGTATATGC AACTCTTTCCTTATTCGTCTTAAGCAAGGTTTTTCTTACTCGACAACAAACGTCTTTAGCTCATATACG 3' I S' Přímý (forward) dNTPs I primer 3 ^ ^ T T GAGAAAGGAATAAGC AACTCTTTCCTTATTCGTCTTAAGCAAGGTTTTTCTTACTCGACAACAAACGTCTTTAGCTCATATACG T T GAGAAAGGAATAAGCAGAAT T CGT T C CAAAAAGAAT GAGC T GT TG dNTPs GC AGAAAT C GAGTAT AT GC k TCTTTAGCTCATATACG 3' 5' Zpětný (reverse) primer 3' T T GAGAAAGGAATAAGCAGAAT T CGT T C CAAAAAGAAT GAGC TGTTGTTT GC AGAAATC GAGTAT AT GC AACTCTTTCCTTATTCGTCTTAAGCAAGGTTTTTCTTACTCGACAACAAACGTCTTTAGCTCATATACG T T GAGAAAGGAATAAGCAGAAT T CGT T C CAAAAAGAAT GAGC TGTTGTTT GC AGAAATC GAGTAT AT GC 31 Výběr vhodné strategie před návrhem primerů ■ K čemu jsou primery určeny ♦ Standardní end-point PCR ♦ Sekvenování ♦ Detekce jednonukleotidových polymorfizmů (SNP) nebo variací ♦ Studium metylace Real-time PCR ♦ Sondy pro microarray ♦ Degenerovaná PCR Multiplex PCR ■ Z jakých dat vycházíme Jednoduchá sekvence DNA / proteinu ♦ Sekvenční přiložení DNA / proteinu GenBank ID/Gene ID/rsSNP ID Pravidla pro design primeru pro PCR ■ Relativně snadná výpočetní záležitost -prohledávání sekvence a identifikace krátkých sekvencí splňujících určitá kritéria ♦ Délka primeru ♦ Obsah G+C ♦ Teplota Tm ♦ Specificita ♦ Komplementarita příměrových sekvencí ♦ Sekvence 3'-konce Jedinečnost primem ■ Na jedinečnost primem a jeho hybridizační vlastnosti (annealing) má vliv délka primem a velikost templátové DNA ♦ Délka (17-28 bází dlouhé) ■ Možná hybridizační místa primem by se také neměla nacházet na DNA tvořících případné kontaminace vzorků Templátová DNA 5' . . .TCAACTTAGCATGATCGGGTA. . .GTAGCAGTTGACTGTACAACTCAGGAA. Primerl 5'-TGCTAAGTTG-3' Není jedinečný! Primer2 5' -cagtcaactgctac-3' Jedinečný! Zastoupení bází Zastoupení bází ovlivňuje vlastnosti hybridizace a reasociace primeru Žádoucí je náhodná distribuce bází bez oblastí bohatých na AT nebo GC Obvyklý obsah G+C, který poskytuje stabilní hybridy je 40-60 %, ale závisí také na obsahu G+C templátu Templátová DNA 5'...TCAACTTAGCATGATCGGGCA...AAGATGCACGGGCCTGTACACAA...3' Teplota Tm (Melting temperature) ♦ mají Tm teplotu 50 - 65 °C T = 0,3 x Tprimer + 0,7 x TProdukt - 25 am m fffí J® hodnota Jm nšfyméwě sfertsitortfos) páru primer-matrice a Tm Produkt je hodnota Tm amplifikačního produktu. i Orientačně \w wpoSMM Ts fP®^fe \)^^riw: m = 2(A+T) + 4(G+C) Vnitřní sekvence a struktura primeru nejsou komplementární navzájem na 3'-koncích, takže nevytvářejí navzájem nebo samy se sebou duplexy fl@@b§§hují vfířířf?P §@iktífl<ááffiip šfrrfstey ♦ Chybně navržená dvojice primerů, která vytváří stabilní duplex na 3'-konci: 5- ATTCAACCGTTCAAACAAGCCC 3' 3' GTTCGGCCTACCTTTATTTCTC 5' ♦ Správně navržená dvojice primerů, která vytváří pouze málo stabilní duplex na 5'-konci; na 3'-konci je G nebo C zaručující stabilní párování s templátem: 5' CGAAATAAGACTAGTAAAGC 3' I I I I I I I 3' CCTTACTCCACGCCTAATACAATCC 5' ♦ Chybně navržený primer, vytvářející vlásenku: 51 TTTTTCAAGG-III C 3' AAAAGAGAT-" Hairpin 3' GGGAAA^i I I I I 5' TATCTAGGACCTTA-J 3' GGGAA"^ II I A 5' TATCTAGGACCTTA-J Self-Dimer S top 3' GGGAAAATTC C AGGATC TAT 5' I I I I I I I I 5 1 TATC TAGGAC C TTAAAAGGG 3 1 4 bp 31 GGGAAAATTC C AGGATC TAT 51 I I I I 5 1 TATC TAGGAC C TTAAAAGGG 3 1 Dimer forward primer 5' TATCTAGGACCTTAAAAGGG 3' I I I I I 3' C ATGGAAAC G TAGGAGAC 5' reverse primer GC svorky a 3 - koncová stabilita GC svorka ♦ Přítomnost G nebo C mezi posledním 4 bázemi na 3'-konci primem ♦ Zásadní pro zvýšení prevence falešného prodlužování a zvýšení specifičnosti primeru ♦ >3 G nebo C v blízkosti 3'-konce jsou však nežádoucí Maximální 3'-koncová stabilita ♦ Maximalizace AG posledních 5 bází na 3'-konci primeru. Jedinečnost primerů ♦ na matricové DNA nemají falešná vazebná místa Nesprávně navržený primer s falešnými vazebnými místy , .. 5'(1 029) AAGGCTAGAGAAAAATATGG (1 048)3' na tempiatove unai tttcttacccttttt-tacc (966)5' 5'(1 029) AAGGCTAGAGAAAAATATGG (1 048)3' II II I II MIMI 3'(1191) tttgtattgcattatatacc (1210)5' 5'(1 029) AAGGCTAGAGAAAAATATGG (1 048)3' II I I I I I I I I I I 3'(395) tccatttttctttttatctt (414)5' Správně navržený primer, který nemá falešná vazebná míSta na templátU. 5'(2476)CCTAACATAATCCGCACCTCATTCC (2452)3' I I I I I I I I III 3'(787) taaatctattagttt acacataacc (811)5' 5Y2476) CCTAACATAATCCGCACCTCATTCC (2452)3' I I I I I I I I I I 3'(3211) caattgt aact at aactgcgttatc (3235)5' 5'(2476) CCTAACATAATCCGCACCTCATTCC (2452)3' I I I I I I I I I I 3'(1194) gtattgcattatat acctctgttag (1218)5' 5Y2476) CCTAACATAATCCGCACCTCATTCC (2452)3' I I I I I I I I II I 3'(1469) atattgta-tatacgaactaaatct (1492)5' Kdy je primer ještě primerem? / 5' iiiiiiiiiiiiiiiiiiiiiiiiiiiinfi 3'_ Pro návrh primem se obvykle používá specializovaný software Dot display mode Bar graph mode Lower Primer False Priming Sites M13MP18 HB Lover Primer - M13MP 18:63101.19 (positive strand) Priming efficiency of the perfect match is 428 (above the threshold) Priming efficiency : 428 (above the threshold) 5'(6328) GGTTTTCCCftGTCACGRCG (6310)3' IIIIIIIIIMIIIIIIII 3'(6328) ccaaaagggtcagtgctgc (6310)5' Priming efficiency : 205 (above the threshold) 5*(6328) GGTTTTCCCAGTCACGRCG (6310)3' III till IIIIII 3*(626) agcaacitggtc—tgctgc (610)5" Priming efficiency : 194 (above the threshold) 5(6328) GGTTTTCCCflGTCACGflCG (6310)3' tl I lllllll Mil 3'(808) gtaatatggtcagtcctgc (790)5* Priming efficiency : 185 (above the threshold) 5 (6328) GGTTTTCCCflGTCflCGRCG (6310)3' „ I II MUMM III 3*(5125) tctaagtggtccigtg-tgc (5108)5' Priming efficiency : 121 5*(6328) GGTTTTC-CCflGTCfiCGflCG (6310)3* k lllll I I I I I I I I I 3'(5989) agaaaagtggtc-gctctgc (5971)5' Lover Primer - M1 3MP1 8 :631 0L1 9 (negative strand) Priming efficiency of the perfect match is 428 (above the threshold) Priming efficiency : 76 5'(6328) GGTTTTCCCAGTCfiCGflCG (6310)3' IIIIII I Mil 3'(5744) ccaaaaagcgggaaactgc (5762)5' Current Oligo pCBIu5 seq Sequence Length: 1842 Current Oligo (+ strand) 5' CCCGCCTGATGAATGCTCATC 3* Length: 21-mer 5' Position: AG (25 *C): Degeneracy: P.E.*: 1 373 72.1 °C -42.7 kcal/m 492 5.30 nmol/A jrj.ij 34.0 /íg/A2Ě0 Current Oligo (- strand) 5* G ATG AGC ATTC ATC AGGCGGG 3' P.E.*: 537 4.SO nmol/A260 31 .7 /ig/A2Ě0 1/E: Selected Primers pCBIu3:269U21 Upper Primer 5' CGGCGCC AG ATCTGGT ACCC A 3' Length: 21-mer 5" Position: 269 Tm: 76.9 °C AG (25 °C): -46.1 kcal/mol Degeneracy: 1 P.E.* 1/E: 542/542 5.12 nmol/A jrj.ij 33.1 /fg/A260 pC8lu3 :81 7L21 Lover Primer 5' T ACCGGGTTGG ACTC A AG ACG 3' Length: 21-mer 3" Position: S17 AG (25 °C): Degeneracy: P.E.*: 69.5 °C -41.4 kcal/m 502/502 4.S9 nmol/A jrj.ij 32.0 rg/A260 PCR pCBlu.seq" Optimal Annealing Temperature: 58.3° (Max: 72.0°) Position and Length Tm ra GC [%] P.E.« Product 1352 88.0 51.3 Upper Primer 37 21 72.2 47.6 452 Lover Primer 1368 21 79.9 57.1 506 Product Tm - Upper Primer Tjy Primers Tm difference: 15.8 7.6 Concentration Upper Primer 200.0 nM Lover Primer 200 0 nM Monovalent Cation 50.0 mM Free Mg[2+] 0.7 mM Terminal stability of the Lower Primer is too high. Total Na[+] Equivalent: 155.8 Počítačový návrh primem Umoňuje řada molekulárně biologických programů Některé jsou volně dostupné na internetu Primer3 Primer3Plus PrimerZ PerIPrimer ♦ BioTools WebPrimer Kalkulátory vlastností primem IDT Oligo Analyzer fhttp://euJdtdna-com/SciTools/SciTools.aspx?cat=DesianAnalvze) BioMath (http://www.promeaa.com/biomath/calc11 .htm) PrimerBlast UCSC In-Silico PCR AutoDimer Primer 3 (http://frodo.wi.mit.edu/primer3/input.htm) Primer3 Input (version 0.4.0) - MoziMa Firefox Soubor Úpravy Zobrazení Historie Záložky Nástroje Nápověda T C X ^ (\V hi:r,p://rroďo" . wi. mit. edu/prirner3/input. htm \V Primer3 Input (version 0.4.0) PrilTlSr^ (v. 0.4.0) Pick primers from a DNA sequence. Checks for misprinting in template. disclaimer Primer3 Home Primer3pms interface cautions FAQ/WIKI Paste source sequence below (5'->3', string of ACGTNacgtn -- other letters treated as N -- numbers and blanks ignored). FASTA format ok. Please N-out undesirable sequence (vector, ALUs, LLNEs, etc.) or use a Mispnrning Library (repeat library): NONE >SA44kkj001 [org=Staphylococcus aureus] [strain=ccm 885] [clone=7/IV] Staphylococcus aureuss < EcoRI-clone from common 44 kin Smal fragment gaattcaaaaccagcaaaagctgtgaaaaagccattaccaagtaaagataatttggctatattgtatggagaaggatttcatatttgtaaaggcgI aattatttggaaaacatcgacatggtgaagattgtctgttctgtttagaagttttaagtgattaatcaagcacactcaaatagtgttataattat aaatgaatatggtttggataagtctgagacaatgcatgtttcaggctttaattgtgtataaagttttggtgattgcataagagatggcggtacta aatgttattattaagtgtgcacgcagtatcattagttataaaatgtagctgttaaaagtcaaaaatacatcgaatgtagttaggcatataatataQ fib ]0 0 Pick left primer, or use left primer below: D Pick hybridization probe (internal oligo), or use oligo below: 0 Pick right primer, or use right primer below (5' to 3' on opposite strand): Pick Primers Reset Form Sequence Id: Targets: Hotovo A string to identify your output. E.g. 50,2 requires primers to simuum, [ and ]: e.g. ...ATCT[CCCC]TCAT.. E.g. 50,2 requires primers to surround the 2 bases at positions 50 and 51. Or mark the source sequence with . U1C £ □cllCS 0.1 positions JU dllU. Jl. IlldllL uic i means that primers must flank the central CCCC. @Primer3 Input (version 0.4.0) - Mozilla Firefox Soubor Úpravy Zobrazení Historie Záložky Nástroje Nápověda T C X ítí (W http://rrodo .iwi.ľinit.edu/priľiner3/input.htrin Ô T £IT Google P W Primer3 Input (version 0.4.0) Pick Primers Reset Form Sequence Id: Targets: Excluded Regions: Product Size Ranges A string to identify your output. E.g. 50,2 requires primers to surround the 2 bases at positions 50 and 51. Or mark the source sequence with [ and ]: e.g. ...ATCT[CCCC]TCAT.. means that primers must flank the central CCCC. E.g. 401,7 68,3 forbids selection of primers in the 7 bases starting at 401 and the 3 bases at 68. Or mark the source sequence with < and >: e.g. ...ATCTTCAT.. forbids primers in the central CCCC. 150-250 1 00-300 301-400 401-500 501-600 601-700 701-850 851-1 000 Number To Return Max Repeat Misprirning Max Template Misprirning Max 3' Stability 9.0 12.00 Pair Max Repeat Misprirning 24.00 12.00 Pair Max Template Msprirning 24.00 Pick Primers Reset Form General Primer Picking Conditions Primer Size Min: Primer Tm Min: Product Tm Min: Primer GC% Min: Hotovo 57.0 20.0 Opt: Opt: Opt: Opt: 20 60.0 Max: Max: Max: Max: 27 63.0 Max Tm Difference: 100.0 Table of thermodynamic parameters: Breslauer et al. 1906 v] 80.0 Primer3 Output (p rime r3_resu Its. cgi release 0.4.0) - Mozilla Firefox 5oubor Úpravy Zobrazení Historie Záložky Nástroje Nápověda T C X ťfr (\V http://frodo" ,wi,mit,edu/cgi-bin/primer3-web-cgi-bin-0,4,0/prirner3_results,cgi ^ T {|' Google ý J W PrimeTTuTtpuTípřímeTŠ^ PRIMER PICKING RESULTS FOR SA44kfciÜÜl [ücg=StaphylüCüccus aureus] [stuain=CCM 885] [clone=7/IV] Staphylococcus aure No niispuiniing library specified Using 1-based sequence positions OLIGO start len tin gc% any 3' seq LEFT PRIMER 159 2 5 57.21 32.00 6.00 2.00 AATCAAGCACACTCAAATAGTGTTA RIGHT PRIMER 42 9 2 5 58.40 36.00 4.00 3.00 AACTCCTATGAAGACAACCTTTTTC SEQUENCE SIZE: 2052 INCLUDED REGION SIZE: 2052 PRODUCT SIZE: 271, PAIR ANY COMPL: 5.ÜÜ, PAIR 3' COMPL: 3.00 TARGETS (start, len)*: 2ÜÜ,2ÜÜ 1 GAATTCAAAACCAGCAAAAGCTGTGAAAAAGCCATTACCAAGTAAAGATAATTTGGCTAT 61 ATTGTATGGAGAAGGATTTCATATTTGTAAAGGCGAATTATTTGGAAAACATCGACATGG 121 TGAAGATTGTCTGTTCTGTTTAGAAGTTTTAAGTGATTAATCAAGCACACTCAAATAGTG >>>>>>>>>>>>>>>>>>>>>> 181 TTATAATTATAAATGAATATGGTTTGGATAAGTCTGAGACAATGCATGTTTCAGGCTTTA >>> ***************************************** 241 ATTGTGTATAAAGTTTTGGTGATTGCATAAGAGATGGCGGTACTAAATGTTATTATTAAG ************************************************************ 301 TGTGCACGCAGTATCATTAGTTATAAAATGTAGCTGTTAAAAGTCAAAAATACATCGAAT ************************************************************ 3 61 GTAGTTAGGCATATAATATAAAAAGAGTTTTCAATTACTCAATAGAAAAAGGTTGTCTTC *************************************** <<<<<<<<<<<<<<<< <1 m, I___\y\ Hotovo Primer3Plus - rozsirene rozhrani (2007) Primer 3 http://www.bioinformatics.nl/cqi-bin/primer3plus/primer3plus.cqi r Hi £>J -EL http://www.bi(wnf... p - § ß — Prirner3Pluü fa & ® Main General Settings Advanced Settings Internal Oligo Penalty Weights Sequence Quality P rime r3 Plus P rim er3M an ager Hein pick primers ftom a DNA sequence Ate* Source Code Task: Detection Sftic;priraerpairs to dezeci the given template sequence. Opiionaiiy largen and included/excludedregicnz can be specified. Pick Primers | Reset Form Sequence Id: Paste source sequence below Or upload sequence file Procriaz&t. . upload Fils Mark selected region: <>[]{} aar Save Sequence Excluded Regions: Targets: Included Region: 0 Pick left primer or use left primer bel } □ Pick hybridization probe (internal oligo) or use oligo below. 0Pick right primer or use right primer below (5'->3' on opposite strand). ^,90% Primer Z: streamlined primer design for promoters, exons and human SNPs http://qenepipe.nqc.sinica.edu.tw/primerz/beqinDesiqn.do a Hi erz/beqinDesiqn.do H Primer Z Gift® HistdF arioWatch PrimerZ QualiSeq Affyrmation SeqTool A high performance bioinformatics pipeline for large-scale human genomic variation studies mnU v?2 / dBSNl Home DB Info Blog About Us Help FAQ History NCBI 37.3 Switch to NCB1 36.3 Information > Main Menu > Document > Help > Release Notes » 2013.07.03 Update Ensembl database to release 72. ► 2013.05.22 Fix bug of masking indel snp. ► 2013.03.05 Update Ensembl database to release 70. PrimerZ: streamlined primer design for promoters, exons and human SNPs Tsai, M.F., Lin, Y.J., Cheng, Y.C., Lee, K.H., Huang, C.C., Chen, Y.T. and Yao, Adam (2007) PrimerZ: streamlined primer design for promoters, exons and human SNPs, Nucleic Acids Research, doi:10.1093/nar/gkm383 Full Text Species Human Query By Primer for Promoter regions and exons (NCBI) Gene Name (NCBI Official Symbol) Maximum Genes : 200 ® Input Genes OUpload a File Procházet.. [ Result Preview ex. ACE Ma<;lr <;NP<: Upload Parameters \90% Oligo J>J Oligo 7 Demo - Human elF-4E.seq File Edit Analyze Search Select Change View Window Help ms ad & Seq uence File: Human elF-4E.seq DNA Sequence Sequence Length: 1868 nt Reading Frame: +1 Current Oligo Length: 21 nt Position: 956 H> W 49.1°C Selected Oligo Position Length Hi S Forward Primer 997 22 SB □ Reverse Primer 1061 21 m □ Upper Oligo 956 21 0 Lower Oligo — — m PCR Product [85,—] nt Feature Location -18..1850 joo ,jso ,400 ,4so ,soo ,sso ,eoo ,«o .too ,T£0 300 ,950 ,1000 ,1050 ,1100 ,1150 ,1200 ,12S0 ,1300 ,1JS0 ,1400 ,1440 ,1500 ,1SS0 ,1600 ,1640 ,1700 ,1750 ,1300 I =■=■-' >.■•.:• || r| rru ||i7-^ | =■=■-■ | iuuu | iltu | i i| i i?j | iji>.>j | im | pos: tm: ,950 ,960 ,970 ,980 ,990 ,1000 ,1010 ,1020 ,1030 ,1040 ,1050 ,1060 ,1070 ,1030 ......'.........i.........'.........'.........'.........'.........'.........'.........'.........'.........'.........'.........'.........'..... TGGCATTTCTATACTTTACAGG.............................. ACATACAGATTTTAC CTATCC......................... ATTAC C ATTAATTAC ATAC AGATTTTAC CTATC C AC AATAGTC AGAAAACAACTTGGC ATTTCTATACTTTACAGGAAAAAAMTTCTGTTG TAATGGTAATTAATGTATGTCTAAAATGGATAGGTGTTATCAGTCTTTTGTTGAAC C GTAAAGATATGAAATGTC CTTTTTTTTAAGACAACAAGGTAAAATAC GTCTTCGTATAAAAC GAC CAAACTTTCTAATACTAC GTJi CGACCAAACTTTCTAATACTA ITINYIQILPIHHSQKTTUHFYTLQEKKFCCSILCRSIFCWFERL-CI peady.. PCR Primer Mapping - UCSC In-Silico PCR http://qenome.ucsc.edu/cqi-bin/hqPcr?db=mm9 Genomes Tables Gene Sorter Session UCSC In-Silico PCR Genome: Mouse Assembly: Forward Primer: Reverse Primer: Jul. 2007 v TGCACCACCAaCTGCTT GGATGCAGGGATGATG' submit Max Product Size: 50000 Min Perfect Match: 18 Min Good Match: 18 Flip Reverse Primer: □ About In Silico PCR In-Silico PCR searches a sequence database with a pair of PCR primers: using an indexing strategy for fast performance. Configuration Options Genome and Assembly - The sequence database to search. Forward Primer - Must be at least 15 bases in lengm. Reverse Primer - On the opposite strand from the forward primer. Minimum length of 15 bases. Mas Product Size - Maximum size of amplified region. Min Perfect Match - Number of bases mat match exactly on 3' end of primers. Minimum match size is 15. Min Good Match - Number of bases on 3' end of primers where at least 2 out of 3 bases match. Flip Reverse Primer - Invert the sequence order of the reverse primer and complement it. Output When successful, the search returns a sequence output file in fasta format containing all sequence in the database that lie between and include the primer pair. The fasta header describes the region in the database and the primers. The fasta body is capitalized in areas where the primer sequence matches the database sequence and in lower-case elsewhere. Here is an example: >chr22:31000551+31001000 TAACAGATTGATGATGCATGAAATGGG CCCATGAGTGGCTCCTAAAGCAGCTGC TtACAGAI T GATGAT GCATGAAAT GGGgggt ggc c aggggt ggggggt ga g£ctgc£gsg£ddggcdgggctggttc£td£C£dgct.ttgt.gcgt.ccc££ titgdcigctgaagttttccaggggctgatggtgdgccagtgagggtdig Výsledky Výběr optimálního páru primem Sekvence primerů Délka primerů a hodnota Tm Velikost produktu Posouzení sekundárních struktur Podmínky reakce Alternativní primery Pokročilý návrh primerů ■ Alelově specifické primery ■ Molekulární diagnostika ■ Vícenásobné detekce - primery pro multiplex PCR ♦ Zajištění kompatibility primerů v reakci ■ Konsenzní primery ♦ Pro klonování ♦ Pro PCR-RFLP (např. 16S rRNA) ♦ Vyžaduje identifikaci konzervativních oblastí na základě mnohonásobných přiložení sekvencí (multiple alignment) ■ Primery pro modifikaci konců produktů PCR Modifikace konců DNA, Připojení sekvencí prostřednictvím 5'-konců primerů 5' 3' 5' 5" 3'- Cílová sekvence 3' 5' Denaturace 1 a připojení primerů 1 a 2 Primer 1 GCGC, Hinó\\\ 5' GCGCAJAGCTT 3' CGCGTTCGAA | PCR Target region 3" C7TAAGCCGG 5' Primer 2 5' Eco Rl 3MTTCGGCC CTTAAGCCGG ti sticky foot" Přidávané sekvence ♦ RE místa Promotory ♦ Terminátory ♦ Translační signály Zdroje pro návrh multiplex PCR ■ MultiPLX (http://bioinfo.ebc.ee/multiplx/) ■ PrimerStation (http://ps.cb.k.u-tokvo.ac.ip/index.html) ♦ Lidský genom ♦ Specifikace exonů ♦ Vyloučení variabilních oblastí se SNP ■ Oligo Explorer (http://www.genelink.com/tools/ql-oe.asp) ♦ Posouzení dimerů primerů v multiplexovém uspořádání Webové zdroje pro design primerů pro real-time PCR ■ NCBI Probe Database ■ RTPrimerDB ■ Primer Bank ■ qPrimerDepot ■ PCR-QPPD ■ PerIPrimer ■ Komerční databáze (např. ROCHE,...) NCBI Probe O© ■=£>) H Jv/probe/fctatistics/ P ' §C Statistics - Probe - NCBI folk® NCIM Resources " How To 1 Probe P'obe Limits Advanced Sign m to NCBI Help 4)The MormaBoa on thts weft site remains access**, out. due to the lapse In government funding, the Inrormatfan may not oe up to date, and the agency may not be able to respond to mqulr)es untl aporccrtaltoos are enacted. For updates regarding government operating status see U3A.p,cr» Welcome to Probe Database The IMC8I Probe Database is a public registry of nucleic acd reagents designed for use in a wwJe variety of bomedica research applications, logetie- w.h information on reagent distributors, probe ef ectiveness. and computed sequence similarities Number of ProbeDB entries by experimental application. Aoc cation Genotvping Gene Expression Gene Silercing SNF C:=c.:>'Sr-/ Genome fťac-fr-a Probes 10.401.414 3.028.48Í 491.716 308.174 288.656 Number of ProbeOe entries by probe type. Probe Types P robes Sequence-soecfic Olioonuoeoode iSSOi 4.803.564 Mtcroarray Element (microarrav) 2.508.311 3~33 M c"3~3v E e.Tient 2.476.004 Ts:Man C-=- = Exc-essci i~aq\'3r 2.011.644 Pnmer Set ipnmer seti 835.202 DMA Wicroarrav Element iDNA mcroarravl 746.163 Submitdb Brokenng Default Probe Type í generic) 561.466 Resequence Ampiicon (RSA) 430.101 Long Range °r,mers llong Rar;e Frirre's'i 302.920 Simple Sequence Receats ÍSSR) 291.225 Its -■ - R*ii shR*JA 270.511 Smjl 'terfe--q R\A 5iF\- 177.534 \75% - Další technologie vyžadující návrh oligonukleotidů Real-time PCR ♦ TaqMan ♦ Molecular Beacons Primer extension Sekvenování ♦ Sangerovo sekvenování ♦ Pyrosekvenování Ligázová řetězová reakce Microarrays