Optika nabitých částic Tomáš Radlička January 4, 2025 2 Chapter 1 Základy optiky nabitých částic 1.1 Nabitá částice v elektromagnetickém statickém poli relativistická formulace Předpokládejme částici o klidové hmotnosti m s nábojem q ve statickém elektromagnetickém poli popsaném pomoci elektrostatického potenciálu ϕ(r) a magnetického vektorového potenciálu A(r). Elektromagnetické pole je spojeno s potenciály vztahy: E = − ϕ, B = × A [4] Pohyb nabité částice je pak popsán pomoci Lagrangeovy funkce L = mc2 1 − v2 c2 + qvA − qϕ (1.1) kde c je rychlost světla, v rychlost nabité částice. Kinematický impulz je definovaný jako g = mγv, kde jsme použili notaci γ = (1 − v2 /c2 )−1/2 pro relativistický faktor. Jeho velikost je pak svázaná s energií E2 c2 − g2 = m2 c2 (1.2) Kanonický impulz je definovaný jako [2] p = ∂L ∂v = g + qA . (1.3) V případě statického elektromagnetického pole není Lagrangián explicitně závislý na čase, proto se zachovává celková energie částice [6] H(r, p) = pv − L (1.4) užitím vztahu E = γmc2 a (1.2) dostaneme pro relativistický faktor γ γ = 1 + g2 m2c2 (1.5) a pro rychlost v = c p − qA m2c2 + (p − qA)2 (1.6) Dosazením těchto vztahů do (1.4) a jednoduchých úpravách dostaneme Hamiltonián ve tvaru H = c (p − qA(r))2 + m2c2 + qϕ(r) = mc2 (1.7) 3 4 CHAPTER 1. ZÁKLADY OPTIKY NABITÝCH ČÁSTIC poslední rovnost platí při volbě aditivní konstanty v elektrostatické potenciálu tak, že je roven nule v místě v němž mají částice nulovou rychlost [6]. Pak −qϕ odpovídá kinetické energii částic v systému. Tato volba je typická pro optiku nabitých částic. Díky tomu můžeme vyjádřit, energii částic, relativistický faktor i velikost kinetického impulzu jako funkci souřadnic: E = mc2 − qϕ (1.8) γ = 1 − qϕ mc2 (1.9) | g | = E2 c2 − m2c2 = −2mqϕ 1 − qϕ 2mc2 = −2mqϕ∗ (1.10) kde jsme zavedli relativisticky korigovaný elektrostatický potenciál ϕ∗ = ϕ(1 − qϕ 2mc2 ) 1.2 Charakteristická funkce, eikonál a index lomu Charakteristická funkce je definovaná jako stacionární hodnota akce W = W(r0, t0; r, t) = Ex t t0 L(r, ˙r)dt (1.11) to znamená, že za r se dosadí skutečné trajektorie částic spojující body r0 a r. Jelikož se pro skutečné trajektorie zachovává hodnota energie, můžeme pro charakteristickou funkci psát W(r0, t0; r, t) = Ex t t0 (pv − H(r, p)) dt = Ex r r0 pdr − E(t − t0) (1.12) kde poslední integrál je přes reálnou trajektorii spojující body r0, r a definuje eikonál: S(r0, r, E) = Ex r r0 pdr. (1.13) Trajektorie v systému pak lze najít jako extremály funcionálu r r0 pdr. Pokud mírně změníme souřadnice konečného bodu r → r + δr a t → t + δt, charakteristická funkce se v první aproximaci změní o δW = ∂W ∂r δr + ∂W ∂t δt = ∂S ∂r δr − Eδt (1.14) ekvivalentně lze psát δW = W(r0, t0; r + δr, t + δt) − W(r0, t0; r, t) = (1.15) = t+δt t0 (p + δp)( ˙r + δ ˙r) − H(p + δp, r + δr)dt − t t0 p ˙r − H(p, r)dt = = t t0 pδ ˙r + δp ˙r − ∂H ∂r δr − ∂H ∂p δp dt + p1v1δt − Eδt Užitím pδ ˙r = d/dt(pδr) − ˙pδr a Hamiltonových rovnic dostaneme δW = p1δr1 + p1v1δt − Eδt = p1δr − Eδt (1.16) 1.2. CHARAKTERISTICKÁ FUNKCE, EIKONÁL A INDEX LOMU 5 srovnáním (1.14) a (1.16) pak pro eikonál dostaneme rS(r0, r, E) − qA = g (1.17) z tohoto vztahu plyne, že trajektorie částic jsou v případě absence magnetického pole kolmé na plochy konstantního eikonálu S(r0, r, R). Kvadrátem obou stran (1.17) dostaneme HamiltonJacobiho rovnici, ( S − qA)2 = g2 = −2mqϕ∗ (r) (1.18) Trajektorie v systému lze tedy vypočítat pomoci δ r r0 pdr = δ s s0 mγv t | t | − qA tds = −2mqϕ∗ 0 δ s s0 n(r, t)ds (1.19) kde t je tečný vektor trajektorie t = dr(s) ds a n(r, t) = ϕ∗ ϕ∗ 0 1 2 | t | − − q 2mϕ∗ 0 At (1.20) je index lomu. Figure 1.1: Centrální trajektorie a volba soustavy souřadnic V částicové optice se standardně používá parametrizace délkou oblouku centrální trajektorie. Je to trajektorie částice, která se shoduje s nějakou význačnou křivkou symetrie, působí na ní pouze vychylovací pole. Souřadnicový systém je vhodné zvolit následovně: (a) nezávislá proměnná - délka oblouku centrální trajektorie (osa z) (b) osy x a y jsou kolmé na centrální trajektorii (Frenet-Serret trihedral [8]. My se v dalším omezíme na dva případy: a) systémy s přímou osou: s = z, t = x ex + y ey + ez b) systémy s mid-section symmetry (rovina y = 0): s = z, dl2 = dx2 + dy2 + dz2 ρ − x ρ 2 = dx + dy + dz(1 − xΓ)2 kde ρ je poloměr křivosti a Γ je křivost trajektorie. Tečný vektor trajektorie pak vychází t = x ex + y ey + ezg3 a jeho velikost | t |= g2 3 + x 2 + y 2, kde jsme označily g3 = 1 − xΓ 6 CHAPTER 1. ZÁKLADY OPTIKY NABITÝCH ČÁSTIC Figure 1.2: Systémy s přímou osou Figure 1.3: Systémy s mid-section symmetry Pro index lomu pak můžeme psát n = ϕ∗ ϕ0∗ 1 2 g2 3 + x 2 + y 2 − − q 2mϕ∗ 0 (g3Az + Axx + Ayy ) (1.21) Tento výraz platí pro oba druhy systémů, v případě systéme s přímou osou je pouze křivost trajektorii nulová a g3 = 1. V optice nabitých částic se standardně používají komplexní souřadnice w = x + iy, ¯w = x − iy (1.22) Kvadrát dvourozměrného vektoru a → a = ax + iay pak lze psát jako a2 = a¯a. Skalární součin ab = (a¯b) = (¯ab). Obdobně lze přepsat i parciální derivace: ∂ ∂x = ∂w ∂x ∂ ∂w + ∂ ¯w ∂x ∂ ∂ ¯w = ∂ ∂w + ∂ ∂ ¯w (1.23) ∂ ∂y = ∂w ∂y ∂ ∂w + ∂ ¯w ∂y ∂ ∂ ¯w = i ∂ ∂w − i ∂ ∂ ¯w (1.24) ∆ = ∂2 ∂x2 + ∂2 ∂y2 = 4 ∂2 ∂w∂ ¯w (1.25) 1.2. CHARAKTERISTICKÁ FUNKCE, EIKONÁL A INDEX LOMU 7 Index lomu pak můžeme psát ve tvaru n = ϕ∗ ϕ0∗ 1 2 g2 3 + w ¯w − − q 2mϕ∗ 0 (g3Az + (A ¯w )) (1.26) 8 CHAPTER 1. ZÁKLADY OPTIKY NABITÝCH ČÁSTIC Chapter 2 Elektromagnetické stacionární pole Až na některé triviální předpoklady jsme doposud nespecifikovali pole ve kterých se nabité částice pohybují. Protože naprostá většina systémů užívá pouze statické elektromagnetické pole nebudeme uvažovat časově proměnné pole. 2.1 Základní rovnice Elektromagnetické pole je zcela popsané Maxwellovými rovnicemi, které v lze v případě stacionárního pole psát ve tvaru [4] × E = 0 × H = j (2.1a) · D = ρ · B = 0 . (2.1b) Tyto rovnice musí být doplněny materiálovými rovnicemi D = E , B = µH (H = νB) . (2.2) Ve feromagnetických materiálech je magnetický odpor ν funkcí velikosti magnetické indukce B =| B |. Proudová hustota a hustota náboje jsou funkcemi prostorových souřadnic. Elektrostatický potenciál a magnetický vektorový potenciál jsou definované vztahy E = − ϕ , B = × A (2.3) Skalární potenciál je řešením rovnice − · ( (r) ϕ) = ρ , (2.4) která se redukuje na 2 ϕ = 0 (2.5) v oblasti bez prostorového náboje. Obdobně můžeme nalézt rovnici pro magnetický vektorový potenciál × (ν(| ×A|) × A) = j , (2.6) která se při konstantním magnetickém odporu vychází ν a Coulombovské kalibraci · A = 0 zjednodušuje na 2 A = µj . (2.7) 9 10 CHAPTER 2. ELEKTROMAGNETICKÉ STACIONÁRNÍ POLE Další zjednodušení je možné ve vakuu, kde nejsou přítomny žádné proudy a × H = 0. V tom případě můžeme psát B(r) = − ψ(r) . (2.8) Kde jsme zavedli magnetický skalární potenciál ψ(r). Protože platí ·B = 0 skalární magnetický potenciál splňuje Laplaceovu rovnici 2 ψ = 0 (2.9) Laplaceův operátor v ortogonálních křivočarých souřadnicích s Lamého koeficienty g1 = g2 = 1 a g3 = 1 − ( ¯wΓ) lze psát ve tvaru 2 = 1 g3 ∂ ∂x g3 ∂ ∂x + ∂ ∂y g3 ∂ ∂y + ∂ ∂z 1 g3 ∂ ∂x = 0 (2.10) nebo použitím komplexních souřadnic 2 = 4 g3 ∂ ∂w g3 ∂ ∂ ¯w + ∂ ∂z 1 g3 ∂ ∂z (2.11) 2.2 Elektrostatické pole - systémy s přímou osou V tomto případě je Lamého koeficient g3 = 1 a Laplaceova rovnice má tvar ∆ϕ = ∂2 ϕ ∂x2 + ∂2 ϕ ∂y2 + ∂2 ϕ ∂z2 = 4 ∂2 ϕ ∂w∂ ¯w + ∂2 ϕ ∂z2 = 0 (2.12) Vzhledem k tomu, že v systémů máme jednu význačnou přímou osu (optická osa) je vhodné přejít do válcových souřadnic x = r cos(φ), y = r sin(φ), z = z (2.13) v nichž má Laplaceova rovnice tvar ∆ϕ = 1 r ∂ ∂r r ∂ϕ ∂r + 1 r2 ∂2 ϕ ∂φ2 + ∂2 ϕ ∂z2 = 0 (2.14) Standardní separací proměnných ϕ(r, φ, z) = ˜U(r, z)f(φ) (2.15) dostaneme skalární potenciál ve tvaru multipólového rozvoje ϕ = ∞ m=0 rm ˜Vm(r, z)(c1 cos(mφ) + c2 sin(mφ)) (2.16) kde ˜Vm = Um/rm je řešením parciální differenciální rovnice ∂2 ˜Vm ∂r2 + 2m + 1 r ∂ ˜Vm ∂r + ∂2 ˜Vm ∂z2 = 0 (2.17) která je vhodná pro numerické řešení. Zavedením komplexní funkce Vm = c1 ˜Vm + ic2 ˜Vm můžeme multipólový rozvoj psát ve tvaru ϕ = m {Vm ¯wm } (2.18) 2.2. ELEKTROSTATICKÉ POLE - SYSTÉMY S PŘÍMOU OSOU 11 Protože se pohybujeme v bezprostřední blízkosti osy lze funkce ˜Vm(r, z) rozvinout do Taylorovy řady ve vzdálenostech od osy ˜Vm(r, z) = ∞ n=0 am,n(z)rn (2.19) dosazením do (2.17) a relativně dlouhých úpravách dostaneme ˜Vm = ∞ n=0 (−1)n m! n!(m + n)! r2 4 n a (2n) m,0 (2.20) Pokud zavedeme komplexní multipólový koeficient Φm = c1am,0 + ic2am,0 můžeme skalární potenciál psát ve tvaru ϕ = m n (−1)n m! n!(m + n)! w ¯w 4 n {Φ(2n) m ¯wm } (2.21) Význam jednotlivých koeficientů dostaneme relativně snadno z hodnot, nebo derivací skalárního potenciálu na ose Φ0 = ϕ(0, z) (2.22a) Φ1 = ∂ϕ ∂ ¯w w=0 = −Ex(0, z) − iEy(0, z) (2.22b) 2.2.1 Elektrostatické pole - systémy se zakřivenou osou V tomto případě nelze provést separaci proměnných, což výrazně komplikuje odvození. Vyjdeme z obecného rozvoje elektrostatického potenciálu do mocnin v w a ¯w ϕ = ∞ λ=0 ∞ µ bλµ(z)wλ ¯wµ (2.23) a dosadíme do Laplaceovy rovnice. Po relativně dlouhém výpočtu lze najít elektrostatický potenciál ve tvaru ϕ = Φ0 + Φ1 ¯w + Φ2 ¯w2 − 1 4 (Φ − ΓΦ1)w ¯w + Φ3 ¯w3 + (2.24) + 1 16 (4Φ2Γ − 2Φ1 + 3Γ2 Φ1c − 5Φ Γ − 2Φ Γ )w ¯w2 + · · · 2.2.2 Magnetické pole Magnetický skalární potenciál je řešením stejné rovnice jako elektrostatický, proto je jeho rozvoj analogický rozvoji elektrostatického potenciálu, jen jsou jinak označeny osové potenciály Φm → Ψm (2.25) t.j. ψ = m n (−1)n m! n!(m + n)! w ¯w 4 n {Ψ(2n) m ¯wm } (2.26) kde Ψ0 = ψ(0, z) = z zo B(0, 0, z) (2.27a) Ψ1 = ∂ψ ∂ ¯w w=0 = −Bx(0, z) − iBy(0, z) (2.27b) 12 CHAPTER 2. ELEKTROMAGNETICKÉ STACIONÁRNÍ POLE obdobně postupujeme i pro případ magnetické skalárního potenciálu systémů se zakřivenou osou. Pro index lomu ale potřebujeme znát také magnetický vektorový potenciál A. Ten je se skalárním magnetickým potenciálem svázán vztahem B = − ψ = × A (2.28) kterou lze v křivočarých ortogonálních souřadnicích rozepsat do tvaru ∂ψ ∂x = 1 g3 ∂Ay ∂z − ∂g3Az ∂y (2.29a) ∂ψ ∂y = − 1 g3 ∂Ax ∂z − ∂g3Az ∂x (2.29b) 1 g3 ∂ψ ∂z = ∂Ax ∂z − ∂Ay ∂x (2.29c) a pomoci komplexních souřadnic 2ig3 ∂ψ ∂w = − ∂ ¯A ∂z + 2 ∂g3Az ∂w (2.30a) 1 g3 ∂ψ ∂z = −2 ∂A ∂w = −2 i ∂ ¯A ∂ ¯w (2.30b) Pro snadnější odvození je vhodné zavést komplexní magnetické potenciál Π, který splňuje Laplaceovu rovnici a jehož reálná část je magnetický skalární potenciál ψ = {Π}. Rovnice (2.30b) pak lze psát ve tvaru 1 g3 ∂ Π ∂z = −2 ∂A ∂w (2.31) Zavedením kalibrační podmínky 1 g3 ∂ Π ∂z = −2 ∂A ∂w (2.32) můžeme předchozí rovnici psát ve tvaru 1 g3 ∂Π ∂z = −2i ∂ ¯A ∂ ¯w (2.33) Transverzální část vektorového potenciálu můžeme tedy psát v integrálním tvaru ¯A = i 2 ¯w 0 1 g3 ∂Π ∂z d ¯w (2.34) Pokud rovnici (2.30a) zderivujeme podle ¯w a rozepíšeme skalární magnetický potenciál pomoci komplexního magnetického potenciálu 2ψ = Π + ¯Π můžeme užitím (2.34) psát i ∂ ∂ ¯w g3 ∂(Π + ¯Π) ∂w = − 1 2 ∂ ∂z 1 g3 ∂Π ∂z + 2 ∂2 g3Az ∂ ¯w∂w (2.35) Protože je Π řešením Laplaceovy rovnice 2 ∂ ∂w g3 ∂Π ∂ ¯w + 2 ∂ ∂ ¯w g3 ∂Π ∂w + ∂ ∂z 1 g3 ∂Π ∂z = 0 (2.36) můžeme rovnici (2.35) psát ve tvaru i 2 ∂ ∂ ¯w g3 ∂ ¯Π ∂ ¯w − i 2 ∂ ∂w g3 ∂ ¯Π ∂ ¯w = ∂2 g3Az ∂ ¯w∂w (2.37) 2.2. ELEKTROSTATICKÉ POLE - SYSTÉMY S PŘÍMOU OSOU 13 a po dvojí integraci dostaneme gAz =    ¯w 0 g3 ∂Π ∂ ¯w d ¯w    = g3 Π + 1 2    Γ ¯w 0 (Π − Π0)    d ¯w (2.38) kde Π0 = Π(0, 0, z). V případě systémů s přímou osou se g3 = 0, Γ = 0 a výraz pro z-tovou složku vektorového potenciálu se redukuje na Az = {Π} (2.39) Poznamenejme jen, že v tomto případě kalibrace (2.32) přechází na standardní Coulombovskou kalibraci A = 0 14 CHAPTER 2. ELEKTROMAGNETICKÉ STACIONÁRNÍ POLE Chapter 3 Paraxiální aproximace 3.1 Obecná paraxiální rovnice trajektorie V dalším se budeme zabývat pouze elektronovou optikou, proto bude používat hodnoty klidové hmotnosti a elektrického náboje pro elektron: qe = −e, m = me (3.1) Obecnou rovnici trajektorie dostaneme minimalizací funkcionálu pro optickou dráhu C n(w(z), ¯w(z), w (z), ¯w (z), z)dz (3.2) kde index lomu je je dán rovnicí (1.26) s elektrostatickým a magnetickým polem ve tvaru odvozeném v předchozí kapitole. Abychom postihli i malé deviace energie od hlavní energie svazku, místo elektrostatického potenciálu ϕ dosadíme do výrazu pro index lomu ϕ + dE, kde dE je odchylka energie v eV. Z variačního počtu je známo, že tato minimalizační úloha vede na Euler-Lagrangovu rovnici, kterou v můžeme v komplexních proměnných psát ve tvaru d dz ∂n ∂ ¯w − ∂n ∂ ¯w = 0 (3.3) Tato rovnice lze řešit numericky, nicméně nám tento typ řešení neposkytne dostatečný vhled do optických vlastností systému. Systémy v částicové optice se vyznačují relativně velkou stabilitou, odchylky trajektorií od centrální trajektorie a jejich směrnice jsou velmi malé. V takovémto případě dává velmi dobrý smysl rozvinout rovnici trajektorie do polynomu vzhledem k těmto odchylkám. Pokud se omezíme na polynom prvního řádu mluvíme o paraxiální aproximaci - jedná se o lineární aproximaci. Vyšší řády polynomu popisují nelineární chování - aberace. Jelikož se v rovnici trajektorie (3.3) vyskytuje index lomu pouze derivovaný podle ¯w nebo ¯w je paraxiální aproximace zcela popsaná indexem lomu druhého řádu n = n(0) + n(1) + n(2) (3.4) 15 16 CHAPTER 3. PARAXIÁLNÍ APROXIMACE kde n(0) = Φ∗ Φ∗ 0 1 2 (3.5a) n(1) = − e qo {Ψ1 ¯w} + Φ∗ Φ∗ 0 1 2 γ0 2Φ∗ Φ1 ¯w − Γ ¯w + Φ∗ Φ∗ 0 1 2 γ0Φ0 2Φ∗ κ (3.5b) n(2) = e q0 1 2 Ψ ¯ww + 1 4 Ψ1 ¯Γw ¯w + 1 4 Ψ1Γ − Ψ2 + (3.5c) + 1 2 Φ∗ Φ∗ 0 1 2 w ¯w − w ¯w γ0 4Φ∗ (Φ + Φ1Γ) + Φ1 ¯Φ1 8Φ∗ + γ0 Φ∗ (Φ2 − 1 2 Φ1Γ) − Φ2 1 8Φ∗2 ¯w2 − Φ∗ Φ∗ 0 1 2 Φ∗ 0 4Φ∗ Φ1 Φ∗ + 2γ0Γ ¯w κ − 1 8 Φ∗ Φ∗ 0 1 2 Φ2 0 Φ∗2 κ2 kde κ = dE/Φ0 je relativní odchylka od hlavní energie svazku. Což po dosazení do EulerLagrangeovy rovnice (3.3) dává obecnou paraxiální rovnici trajektorie w + γ0 2Φ∗ (Φ − iv0B)w + γ0 4Φ∗ Φ − iv0B + {(Φ1 + iv0Ψ1)Γ} + Φ1 ¯Φ1 2Φ∗ w− (3.6) − γ0 Φ∗ Φ2 + iv0Ψ2 − Γ 4 (2Φ1 + iv0Ψ1)) − Φ2 1 8γ0Φ∗ ¯w = − Φ0 4Φ∗ Φ1 Φ∗ + 2γ0Γ κ + γ0 2Φ∗ (Φ1 + iv0Ψ1) − Γ Pokud rovnici rozepíšeme pro reálnou a imaginární část dostaneme soustavu dvou lineárních diferenciálních nehomogenních rovnic druhého řádu s koeficienty, které jsou známými funkcemi nezávislé proměnné. V obecném případě jsou tyto rovnice provázané a výrazně komplikované pro popis optických vlastností systému. Budeme se zabývat dvěma základními typy systému (a) Systémy s přímou osou (b) systémy s ”midsection symmetry”. 3.2 Systémy s přímou osou V případě systémů s přímou osou je křivost trajektorie Γ nulová, rovnice trajektorie se pak redukuje na w + γ0 2Φ∗ (Φ − iv0B)w + γ0 4Φ∗ Φ − iv0B + Φ1 ¯Φ1 2γ0Φ∗ w − γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ ¯w (3.7) = − Φ0Φ1 4Φ∗2 κ + γ0 2Φ∗ (Φ1 + iv0Ψ1) člen iv0B v koeficientu u w a člen iv0B v koeficientu u w způsobují mícháni souřadnic x a y, jedná se o Larmorovu rotaci svazku v důsledku přítomnosti osově symetrického magnetického pole. Tento efekt se dá odstranit přechodem do souřadnic, které rotují kolem optické osy zároveň se svazkem - ”Larmor rotating frame” [6]. Rotaci kolem osy lze vyjádřit pomoci jednoduchého vztahu w = eiχ(z) u (3.8) Pokud dosadíme tento tvar do (3.7) a požadujeme, aby byl koeficient u u a u reálný, dostaneme χ ve tvaru χ(z) = e 8me z zo B Φ∗1/2 dz (3.9) 3.2. SYSTÉMY S PŘÍMOU OSOU 17 a paraxiální rovnici v rotačních souřadnicích pak nabývá tvaru u + γ0Φ 2Φ∗ u + γ0Φ 4Φ∗ + eB2 8meΦ∗ + Φ1 ¯Φ1 8Φ∗2 u − γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) ¯u (3.10) = − Φ0Φ1 4Φ∗2 e−iχ(z) κ + γ0 2Φ∗ (Φ1 + iv0Ψ1)e−iχ(z) Druhý výraz na pravé straně způsobuje, že u = 0 není řešením této rovnice, tj. optická osa není řešením paraxiální rovnice trajektorie, což je v rozporu s definicí optické osy. Je tedy nutné, aby tento člen byl nulový - Wienova podmínka Φ1 + iv0Ψ1 = 0 (3.11) což odpovídá případu, kdy pro osovou částici vymizí příčná složka Lorentzovy síla, tj. (E + (0, 0, vz) × B)⊥ = 0. Rovnici (3.10) lze dále zjednodušit, pokud zavedeme podmínky pro dipólová a kvadrupólová pole, tak aby se zjednodušil člen u ¯u. Nejpoužívanější je nastavení systému, při kterém tento člen zcela vymizí, tj. Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ = 0 (3.12) Paraxiální rovnice trajektorie pak separovaná pro x a y a je pro obě souřadnice stejná u + γ0Φ 2Φ∗ u + γ0Φ 4Φ∗ + eB2 8meΦ∗ + Φ1 ¯Φ1 8Φ∗2 u = − Φ0Φ1 4Φ∗2 e−iχ(z) κ (3.13) To že je rovnice v obou souřadnicích stejná zaručuje, že pokud nastane fokus v jednom směru, nastane zároveň i v druhém směru. Takovým systémům se říká stigmatické a o podmínce (3.12) mluvíme jako o podmínce stigmatičnosti. Těmito systémy se budeme podrobněji zabývat v následující kapitole. V případě, že v systému není magnetické osově symetrické pole, nedochází k rotaci χ(z) = 0 lze rovnice pro x a y vzájemně odseparovat při vhodným nastavením orientace dipólových a kvadrupólových polí, Φ1 = Φ1c, Φ2 = Φ2c a Ψ2 = iΨ2s w + γ0Φ 2Φ∗ w + γ0 4Φ∗ Φ + Φ2 1c 2Φ∗ w − γ0 Φ∗ Φ2c − v0Ψ2s − Φ2 1c 8γ0Φ∗ ¯w = − Φ0Φ1c 4Φ∗2 κ (3.14) V tomto případě je ale rovnice různá pro oba směry a systém není stigmatický. Jedná se o speciální případ systému s ”midsection symmetry” kterém se budeme věnovat později. 3.2.1 Optické vlastnosti stigmatických systémů Paraxiální vlastnosti obecného stigmatického systému jsou popsané lineární nehomogenní diferenciální rovnicí druhého řádu (3.13), kterou můžeme přepsat do tvaru Φ∗ 1 2 d dz (Φ∗ 1 2 u ) + γ0 4 Φ + e 8me B2 + Φ1 ¯Φ1 8Φ∗ u = − Φ0Φ1 4Φ∗ e−iχ(z) κ (3.15) Protože koeficienty u jednotlivých derivací hledané trajektorie jsou funkcemi z neexistuje analytické řešení této rovnice (kromě několika speciálních tvarů potenciálu, které ale nejsou z praktického hlediska důležité) a je nutné rovnici řešit numericky, standardně se používá metoda Runge-Kutta. Nicméně i tak může z tvaru rovnice popsat základní optické vlastnosti systému. Zhomognenizované řešení a jeho vlastnosti Při řešení lineárních diferenciálních rovnic se vychází ze zhomogenizované rovnice Φ∗ 1 2 d dz (Φ∗ 1 2 u ) + γ0 4 Φ + e 8me B2 + Φ1 ¯Φ1 8Φ∗ u = 0 (3.16) 18 CHAPTER 3. PARAXIÁLNÍ APROXIMACE Vlastnosti této rovnice probereme relativně podrobně, protože v případě nulového dipólového pole odpovídá přímo paraxiální rovnici trajektorie - paraxiální trajektorie osově symetrických systémů. Řešení této rovnice tvoří dvou dimenzionální vektorový prostor. Každé její řešení je tedy lineární kombinace dvou řešení u1 a u2, pro které můžeme psát Φ∗ 1 2 d dz (Φ∗ 1 2 u1) + γ0 4 Φ + e 8me B2 + Φ1 ¯Φ1 8Φ∗ u1 = 0 (3.17) Φ∗ 1 2 d dz (Φ∗ 1 2 u2) + γ0 4 Φ + e 8me B2 + Φ1 ¯Φ1 8Φ∗ u2 = 0 (3.18) Pokud první rovnici vynásobíme u2, druhou rovnici vynásobíme u1 a sečteme, po krátké úpravě dostaneme rovnici Φ∗ 1 2 d dz Φ∗ 1 2 (u1u2 − u2u1) = 0 (3.19) která po integraci vede k zákonu zachování Wronskiánu W = Φ∗ 1 2 (u1u2 − u2u1) = const (3.20) který lze použít pro odvození několika základních optických vlastostí. Nejprve ale zavedeme dvě základní sady paraxiálních řešení • Principiální trajektorie uπ, u¯π, které splňují uπ(−∞) = 1, uπ(−∞) = 0 (3.21a) u¯π(∞) = 1, u¯π(∞) = 0 (3.21b) • Charakteristické uα, uγ, které v rovině předmětu splňují uα(zo) = 0, uα(zo) = 1 (3.22a) uγ(zo) = 1, uγ(zo) = 0 (3.22b) V tomto případě lze je obecné řešení zhomogenizované rovnice psát ve tvaru u(z) = αuα + γuγ (3.23) kde α = xo + iyo je komplexní směrnice v předmětu a γ = xo + iyo je komplexní poloha v předmětu. V rovině obrazu se setkávají všechny paprsky, které vychází z jednoho bodu, nezávisle na jejich počáteční směrnici, toho lze dosáhnout pouze pokud je v této rovině trajektorie uα(zi) = 0. Pak tedy u(zi) = uγ(zi)γ = Mγ, kde jsme zavedli příčné zvětšení M a u (zi) = αuα(zi) + γuγ(zi) = αm + γuγ(zi), kde jsme zavedli úhlové zvětšení m. Lagrange-Helmholtz Relations Aplikujeme-li zákon zachování Wronskiánu na paraxiální trajektorie uα, uγ a rovinu obrazu a předmětu dostaneme vztah mezi příčným a úhlovým zvětšením Φ ∗ 1 2 o = Φ ∗ 1 2 i uγ(zi)uα(zi) = Φ ∗ 1 2 i Mm (3.24) Užitím zákonu zachování Wronskiánu na principiální paprsky a roviny z = −∞, z = ∞ dostaneme Φ ∗ 1 2 −∞u¯π(−∞) = −Φ ∗ 1 2 ∞ uπ(∞) (3.25) z obrázku je patrné, že u¯π(−∞) = 1/ ¯f a uπ(∞) = −1/f. Pak dostaneme vztah mezi předmětovou a obrazovou ohniskovou vzdáleností ¯f f = Φ∗ −∞ Φ∗ ∞ (3.26) 3.2. SYSTÉMY S PŘÍMOU OSOU 19 Figure 3.1: Principiální trajektorie Figure 3.2: Charakteristické trajektorie 20 CHAPTER 3. PARAXIÁLNÍ APROXIMACE Figure 3.3: Longitudial magnification Longitudial magnification Při změně předmětové roviny zo → zo + dzo se také posune rovina obrazu zi → zi + dzi, pokud je tato změna dostatečně malá, je změna obrazové roviny přímo úměrná změně roviny předmětu, kde konstantu úměrnosti nazýváme longitudiálním zvětšením. Pokud tedy posuneme rovinu předmětu změní se i trajektorie uα → ˜uα. Jelikož se také jedná o řešení paraxiální rovnice trajektorie lze ji psát jako lineární kombinaci původních charakteristických trajektorií ˜uα = uα + dzouα(zo)uγ = uα + dzouγ (3.27) Pokud vyjádříme tuto trajektorii v novém fokusu 0 = ˜ualpha(zi + dzi) = uα(zi + dzi) + dzouγ(zi + dzi) (3.28) po rozvoji do mocnin v dzi a zanedbání kvadratických členů v dzi a dzo dostaneme dzi = −dzoM2 Φ∗ i Φ∗ o (3.29) Aproximace tenkou čočkou V tomto případě zhomogenizovanou rovnici ještě dále upravíme pomoci Pichtovy transformace u(z) = Φ∗− 1 4 v(z) (3.30) na tvar v + G(z)v = 0 (3.31) kde koeficient G(z) = 3 16 Φ 2 Φ∗2 1 + 4 3 Φ∗ + eB2 8meΦ∗ + Φ1 ¯Φ1 8Φ (3.32) je vždy kladný. Předpokládejme, že čočka je tenká, můžeme v ní tedy zanedbat změnu souřadnice v, změní se pouze její směrnice v = − ∞ −∞ G(z)v(z)dz ≈ −v0 ∞ −∞ G(z)dz (3.33) 3.2. SYSTÉMY S PŘÍMOU OSOU 21 pokud tento vztah aplikujeme na principiální paprsky vπ, v¯π, použijeme vztah u = vΦ∗−1/4 a uvážíme že v nekonečnech je osový potenciál konstantní, tj uπ(∞) = Φ ∗−1/4 ∞ vπ(∞), u¯π(−∞) = Φ ∗−1/4 −∞ v¯π(−∞) můžeme psát vπ(∞) = uπ(∞)Φ∗1/4 ∞ = −vπ(−∞) ∞ −∞ G(z)dz = −Φ ∗1/4 −∞ uπ(−∞) ∞ −∞ G(z)dz (3.34a) v¯π(−∞) = u¯π(−∞)Φ ∗1/4 −∞ = v¯π(∞) ∞ −∞ G(z)dz = Φ∗1/4 ∞ u¯π(∞) ∞ −∞ G(z)dz (3.34b) Pro ohniskové dálky pak můžeme psát: 1 f = Φ ∗1/4 −∞ Φ ∗1/4 ∞ ∞ −∞ G(z)dz, 1 ¯f = Φ ∗1/4 ∞ Φ ∗1/4 −∞ ∞ −∞ G(z)dz, (3.35) tedy: f ¯f = Φ ∗1/2 ∞ Φ ∗1/2 −∞ (3.36) Vliv pravé strany - Energiová disperze Pokud známe řešení zhomogenizované rovnice (3.13) lze obecné řešení najít metodou variace konstanty, patřičnou teorii lze najít například na Wikipedii (https://cs.wikipedia.org/wiki/Variace_konstant), kde je nicméně použitá jiná definice Wronskiánu (Ww = u1u2 − u2u1 místo námi zvolené (3.20)). Pokud zvolíme u1 = uγ a u2 = uα dostaneme W = Φ ∗ 1 2 o a vztah mezi Wronskiánem používaným na Wikipedii a námi definovaným pak dostaneme Φ∗ 1 2 Ww = W = Φ ∗ 1 2 o ⇒ Ww = Φ∗ o Φ∗ (3.37) Výsledné řešení pak tedy můžeme psát ve tvaru u(z) = γuγ + αuα + udκ (3.38) kde ud je disperzní trajektorie ud = Φ ∗− 1 2 o uγ z zo Φ∗ 1 2 uα Φ0Φ1 4Φ∗ e−iχ(z) dz − Φ ∗− 1 2 o uα z zo Φ∗ 1 2 uγ Φ0Φ1 4Φ∗ e−iχ(z) dz (3.39) Ze vztahu pro disperzi je patrné, že je podmíněna nenulovým dipólovým polem, v případě soustav s přímou osou lze realizovat pouze Wienovým filtrem. Disperze se projevuje tak, že pro nenulové odchylky energie elektronů od hlavní energie svazku jsou elektrony mírně vychylovány od osy. K fokusu pak dochází ve stejné rovině ale v různých vzdálenostech od osy. Použití metody variace konstanty je v elektronové optice velmi časté, proto se budeme obdobnými vztahy vztahu (3.39) setkávat relativně často. Je zřejmé, že tento vztah můžeme napsat ve tvaru ud = Cd(z)uγ + cd(z)uα (3.40) kde Cd = Φ ∗− 1 2 o z zo Φ∗ 1 2 uα Φ0Φ1 4Φ∗ e−iχ(z) dz (3.41a) cd = −Φ ∗− 1 2 o z zo Φ∗ 1 2 uγ Φ0Φ1 4Φ∗ e−iχ(z) dz (3.41b) 22 CHAPTER 3. PARAXIÁLNÍ APROXIMACE Protože je ve výrazu pro disperzní trajektorii koeficient cd násobený paprskem uα jeho vliv na hodnotu ud v obraze vymizí, bude se ale projevovat v jeho směrnici, v odporné literatuře se mluví o slope coefficient. Hodnota ud v obrazu bude tedy ovlivněna pouze koeficientem Cd - image coefficient 3.2.2 Parazitické aberace stigmatických systémů Vznikají v důsledků nedokonalostí systému, nebo jeho špatným seřízením. Pokud je porušena osová symetrie systému, vznikají slabá dipólová, kvadrupólová pole, či pole s vyšší symetrií, která se ale neprojeví v paraxiální aproximaci. V důsledku přítomnosti těchto parazitických polí není zcela splněna Wienova podmínka a podmínka stigmatičnosti, nicméně můžeme předpokládat, že obě podmínky jsou splněny relativně přesně a odchylka je velmi malá, to vyjádříme přidáním koeficientu δ k těmto členům v (3.10) u + γ0Φ 2Φ∗ u + γ0Φ 4Φ∗ + eB2 8meΦ∗ + Φ1 ¯Φ1 8Φ∗2 u = (3.42) = γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) δ¯u − Φ0Φ1 4Φ∗2 e−iχ(z) κ + γ0 2Φ∗ (Φ1 + iv0Ψ1)e−iχ(z) δ tuto rovnici pak řešíme iteračně. V nulté iteraci se spočítá zhomogenizovaná rovnice, v první iteraci se toto řešení dosadí do pravé strany u + γ0Φ 2Φ∗ u + γ0Φ 4Φ∗ + eB2 8meΦ∗ + Φ1 ¯Φ1 8Φ∗2 u = (3.43) = γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) δ(¯αuα(z) + ¯γuγ(z))− − Φ0Φ1 4Φ∗2 e−iχ(z) κ + γ0 2Φ∗ (Φ1 + iv0Ψ1)e−iχ(z) δ a spočítá se výsledná trajektorie metodou variace konstanty, u = γuγ + αuα + ¯αu¯α + ¯γu¯γ + uw + udκ (3.44) kde trajektorie u¯α = − uγ z zo u2 α γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) δdz (3.45) + uα z zo uαuγ γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) δdz popisuje osový astigmatizmus (two-fold astigmatism), image coefficient označujeme A1 A1 = − z zo u2 α γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) δdz (3.46) Trajektorie u¯γ = − uγ z zo uαuγ γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) δdz (3.47) + uα z zo u2 γ γ0 Φ∗ Φ2 + iv0Ψ2 − Φ2 1 8γ0Φ∗ e−2iχ(z) δdz 3.2. SYSTÉMY S PŘÍMOU OSOU 23 popisuje neosový astigmatizmus a trajektorie uw = −uγ z zo uα γ0 2Φ∗ (Φ1 + iv0Ψ1)e−iχ(z) δdz + uα z zo uγ γ0 2Φ∗ (Φ1 + iv0Ψ1)e−iχ(z) δdz (3.48) deflekci svazku v důsledku porušení Wienovy podmínky. V tomto případě už další iteraci potřebovat nebudeme. 3.2.3 Kvadrupólové systémy Figure 3.4: Možná realizace elektrostatického a magnetického kvadrupólu V tomto případě budeme uvažovat pouze silné kvadrupólové pole, v tom případě mu paraxiální rovnice tvar w − G ¯w = 0 (3.49) kde G = γ0 Φ∗ (Φ2 + iv0Ψ2) = γ0Φ2c Φ∗ 0 − 2e meΦ∗ 0 Ψ2s + i γ0Φ2s Φ∗ 0 + 2e meΦ∗ 0 Ψ2c (3.50) Řešení této rovnice pro obecné kvadrupólové pole je relativně složité, protože koeficient G je obecně komplexní a proto dochází k míchání souřadnice x a y. V reálných systémech se tedy pole omezují tak, aby byl koeficient reálný, nebo ryze imaginární. My se zde omezíme na situaci, kdy je G reálné (druhý případ lze na tuto situaci lehce převést rotací systému souřadnic o 45 deg), tj. Φ2s = 0, Ψ2c = 0 (3.51) což redukuje koeficient G G = ¯G = γ0Φ2c Φ∗ 0 − 2e meΦ∗ 0 Ψ2s (3.52) a separuje paraxiálni rovnici v x a y směru x − Gx = 0 (3.53a) y + Gy = 0 (3.53b) 24 CHAPTER 3. PARAXIÁLNÍ APROXIMACE Protože je délka silných kvadrupólů výrazně větší než jejich poloměr a síla fokusačního účinku nezáleží na derivacích kvadrupólových osových koeficientů můžeme aproximovat koeficient (3.52) koeficientem G(z) = 0, |z − zM | > l/2 G0, |z − zM | ≤ l/2 (3.54) kde G0 je velikost G uvnitř kvadrupólu (tam kde je už konstantní) a l je efektivní délka kvadrupólu l = 1 G0 ∞ −∞ G(z)dz (3.55) Principiální paprsky pak mají v kvadrupólu tvar yπ = cos( G0(z + l/2) xπ = cosh( G0(z + l/2) (3.56) y¯π = cos( G0(z − l/2) x¯π = cosh( G0(z − l/2) Pro prvotní design kadrupólových systémů je vhodné použít aproximaci tenké čočky, která je obdobou aproximace tenké čočky v osově symetrickém systému. V tomto případě platí 1 fx = − 1 ¯fx = − 1 fy = 1 ¯fy = ∞ −∞ G(z)dz (3.57) Kvadrupól v jednom směru fokusuje, v druhém defokusuje. Kombinací několika kvadropólů lze najít systémy, které umožňují stigmatické zobrazení, jedná se tzv. kvadrupólové anastigmátory. Aby byl kvadrupólový systém integrálně stigmatický, musí skládat z nejméně čtyř kvadrupólů, nicméně v tomto případě není možné měnit ohniskovou dálku systému. Nejpoužívanější systém se skládá z pěti kvadrupólů. Tyto systémy se používají v případě, že osově symetrické čočky jsou příliš slabé na fokusaci vysoce energetického svazku jejich aplikace je především v urychlovačích. Složitější kvadrupólové systémy se také používají v korektorech vad. 3.3 Systémy s mid-section symmetry Paraxiální aproximace obecného systému je popsaná rovnicí (3.6). Aby centrální trajektorie byla řešením paraxiální rovnice, musí být poslední člen nulový γ0 2Φ∗ (Φ1 + iv0Ψ1) − Γ = 0 . (3.58) Tato podmínka svazuje dipólová pole systému s křivostí centrální trajektorie a v případě systémů s přímou osou přechází ve Wienovu podmínku. Pokud si z rovnice (3.58) vyjádříme křivost dosadíme do rovnice (3.6), dostaneme rovnici ve tvaru w + γ0 2Φ∗ (Φ − iv0B)w + γ0 4Φ∗ Φ − iv0B + γ0 2Φ∗ |Φ1 + iv0Ψ1|2 } + Φ1 ¯Φ1 2Φ∗ w− (3.59) + γ0 32Φ∗2 (3Φ1 + 2iv0Ψ1)2 + 4 − γ0 32 Φ2 1 Φ∗2 − γ0 Φ∗ (Φ2 + iv0Ψ2) ¯w = − Φ0 4Φ∗ (1 − γ2 0 ) Φ1 Φ∗ + i γ2 0 v0 Φ∗ Ψ1 κ Systémy s mid-section symmetry jsou takové, u nichž existuje rovina (v našem případě y = 0), vůči níž je Elektrický skalární potenciál symetrický a magnetický skalární potenciál antisymetrický, což znamená, že všechny elektrostatické multipólové osové koeficienty jsou reálné a všechny magnetické multipolové koeficienty ryze imaginární: Φk = Φkc, Ψk = iΨks (3.60) 3.3. SYSTÉMY S MID-SECTION SYMMETRY 25 Tato symetrie zaručuje, že centrální trajektorie zůstává v rovině y = 0 a křivost trajektorie je reálná. Pokud tyto podmínky dosadíme do obecné paraxiální rovnice trajektorie dostaneme dvě separované rovnice x + γ0Φ 2Φ∗ x + γ0Φ 4Φ∗ + 3γ2 0 + 2 8 Φ2 1c Φ∗2 + η2 Ψ2 1s Φ∗ − 5γ0Φ1c 4Φ∗ ηΨ1s √ Φ∗ − γ0 Φ2c Φ∗ + 2η Ψ2s √ Φ∗ x = (3.61a) = − Φ0 Φ∗ 1 + γ2 0 4 Φ1c Φ∗ − γ0 2 η Ψ1s √ Φ∗ κ y + γ0Φ 2Φ∗ y + γ0Φ 4Φ∗ − γ2 0 8 Φ2 1c Φ∗2 + γ0Φ1c 4Φ∗ ηΨ1s √ Φ∗ + γ0 Φ2c Φ∗ − 2η Ψ2s √ Φ∗ y = 0 (3.61b) Z tvaru rovnic je jasné, že fokusační vlastnosti jsou obecně různé ve směru x a y. K energiové disperzi dochází pouze v rovině y = 0. Energiová disperze je hlavní důvod, proč se přechází k systémům jejichž centrální trajektorie není přímka. V praxi se v drtivé většině vyskytují buď čistě magnetické nebo čistě elektrostatické systémy. V magnetickém systému se paraxiální rovnice trajektorie redukuje na x + η2 Ψ2 1s Φ∗ + 2η Ψ2s √ Φ∗ x = κ∗ ηΨ1s 2 √ Φ∗ (3.62a) y − 2η Ψ2s √ Φ∗ y = 0 (3.62b) kde κ∗ = 2γ0/(1 + γ0) · κ. Upravením výrazu pro křivost (3.58) Γ = −η Ψ1s √ Φ∗ (3.63) a substitucí k2 = −2η Ψ2s √ Φ∗ (3.64) můžeme paraxialní rovnice trajektorie psát v kompaktním tvaru x + 1 R2 − k2 x = − 1 2R κ∗ (3.65a) y + k2y = 0 (3.65b) kde R je poloměr křivosti. Typickými příklady takovýchto systémů jsou sektorové magnety, nebo zobrazující energiové filtry. V elektrostatickém případě se paraxiální rovnice redukuje x + γ0Φ 2Φ∗ x + γ0Φ 4Φ∗ + 3γ2 0 + 2 8 Φ2 1c Φ∗2 − γ0 Φ2c Φ∗ x = − 1 + γ2 0 4 Φ0Φ1c Φ∗2 κ (3.66a) y + γ0Φ 2Φ∗ y + γ0Φ 4Φ∗ − γ2 0 8 Φ2 1c Φ∗2 + γ0 Φ2c Φ∗ y = 0 (3.66b) V případě sférického analyzátoru a monochromátoru je osově symetrické pole nulové Φ = 0 a Φ = 0 a kvadrupólové pole je s dipólovým pole svázané vztahem Φ2c = 3 4 ΓΦ1c. Paraxiální rovnice se pak dále zjednodušuje na x + 1 4 Φ2 1c Φ∗2 x = − 1 2 1 + γ2 0 1 + γ0 Φ1c Φ∗ κ (3.67a) y + γ2 0 4 Φ2 1c Φ∗2 y = 0 (3.67b) V nerelativistické aproximaci je fokusace v obou směrech stejná. 26 CHAPTER 3. PARAXIÁLNÍ APROXIMACE Chapter 4 Aberace v optice nabitých částic 4.1 Aberace Doposud jsme popisovali pouze paraxiální aproximaci, která vyjadřuje lineární chování systému. V optice nabitých částic je velmi důležité nelineární chování systému, tj. aberace. V případě paraxiálního zobrazení se bod v předmětu zobrazí na bod v obrazu - dokonalý obraz. V případě, že se bere v úvahu nelineární chování systému, se bod zobrazí na nějakou plošku. To nám výrazně zhoršuje optické vlastnosti systému a zhoršuje rozlišení. Výpočet aberací je relativně přímočarý, ale nesmírně zdlouhavý. Z tohoto důvodu pouze vysvětlím metodu, jak se dají jednotlivé aberace spočítat, ale konkrétní výpočet provádět nebudeme, pro detailní výpočet můžete použít [2], nebo poznámky k přednášce prof. Lence. V případě paraxiální aproximace je vztah mezi pozicí a směrnicí v rovině předmětu z = zo a pozicí a směrnicí v libovolné rovině z dán lineárním zobrazením:   q q κ   = M(z)   qo qo κ   (4.1) Pokud opustíme předpoklady paraxiálního zobrazení lze vztah mezi souřadnicemi v předmětu a obrazu psát ve tvaru aberačního polynomu w(z) = i,j,k,l,m = Ci,j,k,l,m(z)wi o ¯wj ow k o w l o κm (4.2) kde koeficienty Ci,j,k,l,m(z) jsou funkcemi proměnné z, které jsou dané vlastnostmi systému. Koeficienty nejsou zcela nezávislé, ale jsou svázané jednak symetrií systému jednat tím, že zobrazení musí být symplektické. Jejich konkrétní rozbor jde nad rámec této přednášky, je velmi pečlivě rozebrán v [2] str. 315. V případě, že zobrazení je mezi rovinou předmětu a obrazu mluvíme o aberačních koeficientech. Součet exponentů u proměnných w, ¯w, w a ¯w se označuje jako řád polynomu, pokud k němu připočteme i exponent u energiové šířky κ mluvíme o stupni aberace. 4.2 Metody výpočtu aberací Pro výpočet aberací se používá několik metod, nejjednodušší je metoda trajektorií, která byla použitá při výpočtu parazitických aberací. V elektronové optice se často používá metoda eikonálu, v případu urychlovačů se pak často používá metoda Lieových algeber. Všechny tyto metody vedou na aberační koeficienty ve formě aberačních integrálů. Na druhé straně jsou metody, které poskytují pouze numerické hodnoty koeficientů. První takovou metodou je metoda diferenciálních algeber, která vychází z metod nestandardní analýzy, druhou je metoda, která využívá fitování 27 28 CHAPTER 4. ABERACE V OPTICE NABITÝCH ČÁSTIC aberačního polynomu na výsledky přesného trasování. Tyto metody lze relativně jednoduše aplikovat na obecné systémy, nicméně nám nedávají téměř žádné informace o vzájemných vztazích aberačních koeficientů, ani o vlivu jednotlivých prvků na hodnoty aberačních koeficientů. Z tohoto důvodu se budeme blíže věnovat pouze metodě trajektorií. 4.2.1 Metoda trajektorií Tuto metodu jsme již použili v případě výpočtu parazitických aberací. Uvažme nyní i vyšší členy v rozvoji indexu lomu n(w, ¯w, w , ¯w , κ, z) = n(2) (w, ¯w, w , ¯w , κ, z) + n(3) (w, ¯w, w , ¯w , κ, z) + n(4) (w, ¯w, w , ¯w , κ, z) + ... (4.3) kde horní index (k) určuje řád homogenního polynomu v proměnných w, ¯w, w , ¯w a κ. Polynom druhého řádu popisuje paraxiální aproximaci, polynomy vyšších řádů pak popisují nelineární chování. Rovnici trajektorie pak můžeme psát ve tvaru ˆL(w, ¯w, w , ¯w , κ, z) = P3(w, ¯w, w , ¯w , κ, z) + P4(w, ¯w, w , ¯w , δ, z) + · · · (4.4) kde ˆL(w, ¯w, w , ¯w , κ, z) je lineární diferenciální operátor popisující paraxiální rovnici a Pk jsou homogenní polynomy k-tého řádu v proměnných w, ¯w, w , ¯w a κ, pro které platí Pk = − d dz ∂n(k+1) ∂ ¯w + ∂n(k+1) ∂ ¯w (4.5) Postup výpočtu je pak následující 1. Vypočteme paraxiální aproximaci w(0) (wo, ¯wo, wo, ¯wo, κ, z) vyřešením rovnice ˆL(w, ¯w, w , ¯w , κ, z) = 0 2. Do pravé strany rovnice (4.4) dosadíme za w, ¯w, w , ¯w paraxiální aproximaci, takže pak dostaneme na pravé straně funkci proměnné z: ˆL(w, ¯w, w , ¯w , κ, z) = P3(w(0) , ¯w(0) , w(0) , ¯w(0) , κ, z) + P4(w(0) , ¯w(0) , w(0) , ¯w(0) , κ, z) + · · · = ˜P3(wo, ¯wo, wo, ¯wo, κ, z) + ˜P4(wo, ¯wo, wo, ¯wo, δ, z) + · · · (4.6) a tu vyřeším metodou variace konstanty, stejně jako v případě parazitických aberací. Tímto dostaneme trajektorie, které jsou součtem paraxiální aproximace a primárních aberací. w(1) . 3. Pokud chceme vyšší řády aberací musíme postup opakovat s tím, že tentokrát do prvé strany nedosazujeme paraxiální aproximaci ale už výsledek první iterace w(1) . Celkově tento postup vede k iterační proceduře ˆL(w(k+1) , ¯w(k+1) , w(k+1) , ¯w(k+1) , κ, z) = P3(w(k) , ¯w(k) , w(k) , ¯w(k) , κ, z)+ (4.7) + P4(w(k) , ¯w(k) , w(k) , ¯w(k) , κ, z) + · · · (4.8) 4.3 Aberace osově symetrických systémů 4.3.1 Chromatická vada V případě osově symetrických systémů je první oprava indexu lomu nI polynom třetího řádu, který můžeme v rotačních souřadnicích psát ve tvaru n(3) = κΦo 4Φ ∗ 1/2 o Φ∗ 1/2 γ0u ¯u + Φ Φ∗ + γ0χ 2 u¯u + iχ (u¯u − u ¯u) (4.9) 4.3. ABERACE OSOVĚ SYMETRICKÝCH SYSTÉMŮ 29 Figure 4.1: Efekt chromatické aberace Ze vztahu je patrné, že pro nulovou energiovou šířku (κ = 0) je tento člen nulový - mluvím o chromatických vadách. Po dosazení do (4.22) a relativně přímočarém výpočtu dostaneme porušenou trajektorii ve tvaru u(2) = −Mκ(Ccwo + Ac ¯wo + Dcrwo + Dce ¯wo) (4.10) Aberační koeficient Cc je označován jako chromatická aberace prvního řádu, nebo též chromatický defokus, koeficient Ac je označován jako chromatický axiální defokus, koeficient Dcr jako chromatická distorze a Dce jako eliptická chromatická distorze. Bližší diskuzi těchto koeficientů je možné najít například v [2, 6], my se budeme blíže věnovat pouze koeficientu chromatické aberace. Koeficient chromatické aberace lze nalézt ve tvaru Cc = 1 1 + Φo zi zo γ0 Φ∗ o Φ∗ eB2 8meΦ∗ + 2 + γ0 8 Φ 2 Φ∗2 u2 αdz > 0 (4.11) za kterého je zřejmé, že pro osově symetrické systémy je vždy kladný. Bez porušení osové symetrie ho tedy není možné odstranit. Abychom mohli lépe popsat jeho efekt na trajektorie popíšeme jeho efekt na trajektorii, která je v předmětu na ose a vychází pod úhlem α. V blízkosti fokus lze pro tuto trajektorii psát u(z) = m(z − zi)α − MCcκα (4.12) Je tedy zřejmé, že tento paprsek neprotne osu v rovině obrazu, ale v rovině z = zi + M m Ccκ. Tento efekt je způsobený rozdílnou fokusační silou optických prvků, které mají na elektrony o různých energiích. Například chromatická vada čočky způsobí, že elektrony s mírně nižší energií se fokusují dříve, než elektrony s vyšší energií. 4.3.2 Geometrické vady Pokud neuvažujeme energiovou šířku svazku, máme první opravu indexu lomu až polynom čtvrtého řádu nI = Φ∗ Φ∗ o − 1 8 w 2 ¯w 2 − γ0 16 Φ Φ∗ w ¯w w ¯w + 1 128 γ0Φ(4) Φ∗ Φ 2 Φ∗2 w2 ¯w2 + ηB 16 w2 ¯w ¯w (4.13) 30 CHAPTER 4. ABERACE V OPTICE NABITÝCH ČÁSTIC Figure 4.2: Efekt sférické aberace Po přechodu do rotačních souřadnic, dosazením do (4.22) a relativně dlouhém a pracném výpočtu dostane aberační polynom ve tvaru w(3) = M(C3w 2 o ¯wo + 2K3wo ¯wowo + ¯K3w 2 o ¯wo + F3wowo ¯wo + Af3 ¯wow2 o + D3wo ¯wo) (4.14) kde C3 je koeficient sférické aberace, K3 je koma, F3 křivost pole, Af3 astigmatizmus (field astigmatism) a D3 je distorze. Význam jednotlivých vad je podrobně diskutován v [2], my se zde omezíme na popis koeficientu sférické aberace. Koeficient sférické aberace lze psát ve tvaru C3 = 1 Φ∗ 1 2 zi zo − 1 32Φ∗ 1 2 Φ Φ∗ − γΦ(4) + 2γ0Φ η2 B2 Φ∗ + η4 B4 Φ∗ − 4η2 BB u4 α + (4.15) + 1 4Φ∗ 1 2 (γΦ + η2 B2 )u2 αu 2 α + 1 2 Φ∗ 1 2 u 4 α dz (4.16) Díky tomu, že aberační koeficienty se vyjadřují pomoci aberačních integrálů existuje velké množství vzorců, které jdou jeden do druhého transformovat pomoci integrace po částech. Dají se tak například nalézt tvary, ve kterých se nevyskytují třetí a čtveré derivace osových polí, postup je podrobně rozepsán v [2]. Pokud podobně jako v případě chromatické aberace vypočítáme trajektorii částice, která je v předmětu na ose (wo = 0) a startuje po úhlem wo = α, dostaneme w = m(z − zi)α + MC3α2 ¯α (4.17) z čehož je parné, že bod ve kterém trajektorie protínají osu je funkcí velikosti úhlu v předmětu z = zi − M m C3α¯α (4.18) Pro design elektronově optických systémů je velmi podstatné, že sférická aberace osově symetrických systémů se statickým polem, ve kterých nedochází ke změně směru paprsku (vylučuje zrcadla) je kladná. Koeficient sférické aberace se totiž dá, podobně jako koeficient chromatické aberace, rozepsat do tvaru součtu několika kvadrátů. Této vlastnosti sférické aberace se říká Scherzerův teorém. Chapter 5 Vlnově optický popis a rozlišení v optice nabitých částic 5.1 Vlnově optický popis Při odvozování tvaru vlnové rovnice vyjdeme ze vztahu pro Hamiltonián (1.7) ze kterého po odstranění odmocniny dostaneme 1 2m (p + eA(r))2 = eϕ∗ (r) (5.1) Dále postupujeme standardním způsobem, hybnost nahradíme operátorem p = −i¯h čímž dostaneme skalární vlnovou rovnici ve tvaru 1 2m (−i¯h + eA(r))2 ψ = eϕ∗ (r)ψ (5.2) kde ψ je hledaná vlnová funkce. Ve většině aplikací v elektronové optice si vystačíme s kvazi-klasickou aproximací. Předpokládejme, že vlnová funkce je ve tvaru ψ(r) = F(r) exp i ¯h S(r) (5.3) Po dosazení do vlnové rovnice dostaneme soustavu dvou diferenciálních rovnic 1 2m ( S + eA(r))2 − ¯h2 2m ∆F F = eϕ∗ (r) (5.4a) F2 ( S + eA(r)) = 0 (5.4b) Pokud platí, že ¯h2 2m ∆F F eϕ∗ (r) , (5.5) můžeme druhý člen v první rovnici zanedbat, čímž se redukuje na Hamilton – Jacobiho rovnici 1 2m ( S + eA(r))2 = eϕ∗ (r) (5.6) funkce S tedy odpovídá bodovému eikonálu S(r0, r). Rovnice (5.4b) lze užitím (5.6) psát ve tvaru (F2 (r)g(r)) = 0 (5.7) 31 32CHAPTER 5. VLNOVĚ OPTICKÝ POPIS A ROZLIŠENÍ V OPTICE NABITÝCH ČÁSTIC Užitím definice vektoru proudové hustoty dostaneme j(r) = ¯h 2mi (ψ∗ ψ − ψ ψ∗ ) + e|ψ|2 m A = F2 m g (5.8) a rovnice (5.4b) má tedy význam rovnice kontinuity j = 0. Užitím Gaussovy věty pak můžeme psát 0 = jdσ = 1 m F2 gdσ (5.9) Platnost eikonálové aproximace 5.3 je omezená na situace, kdy se amplituda výrazně nemění v oblasti o velikosti několika vlnových délek. To ovšem vylučuje několik základních situací: • Zrcadlo • Blízkost fokusu • Pohyb za hranou • Rozptyl v poli atomu Tyto komplikace však neznamenají, že nelze použít ekikonálovou aproximaci pro tyto případy, řešení však nelze vyjádřit ve formě jedné vlny (5.3), ale je nutné vzít superpozici takovýchto vln. 5.2 Elektronová difrakce Teorie je velmi obdobná jako v případě světelné optiky, jen je komplikovanější v důsledku přítomnosti elektromagnetického pole. Z intuitivního hlediska lze difrakci vysvětlit tak, že každý bod vlnoplochy se stává sekundárním zdrojem vlnění a výsledná vlna je pak daná superpozicí těchto vln. Pro rigorózní popis difrakce nám ale tento přístup stačit nebude a budeme muset vyjít z řešení skalární vlnové rovnice (5.2) pomoci Greenovy funkce. Nejprve přepíšeme skalární vlnovou rovnici (5.2) do tvaru ( + ie ¯h A)2 ψ(r) + k2 (r)ψ(r) = 0 (5.10) kde k(r) = g(r)/¯h je vlnový vektor. Zaveďme diferenciální operátor ˆD = ( + ie ¯h A(r))2 + k2 (r) . (5.11) a k němu sdružený operátor ˆD† = ( − ie ¯h A(r))2 + k2 (r) . (5.12) Vlnovou rovnici pak pomoci něho můžeme psát ˆDψ = 0. Pro libovolné dvě funkce u a v můžeme psát v ˆDu − u ˆD† v = v 2 u − u 2 v + 2ie ¯h {A(v u + u v) + uv A} = (5.13) = v u − u v + 2ie ¯h Auv (5.14) a užitím Gaussovy věty pak dostaneme D (v ˆDu − u ˆD† v) d3 r = ∂D n v u − u v + 2ie ¯h Auv d2 r (5.15) 5.2. ELEKTRONOVÁ DIFRAKCE 33 Dále zavedeme Greenovu funkci G(r, r ) která splňuje rovnici ˆD† G(r, r ) = −δ(r − r ) (5.16) kde δ označuje třírozměrnou delta-funkci. Pokud do (5.15) dosadíme za u hledané řešení ψ a za v Greenovu funkci dostaneme výraz pro hledanou vlnovou funkci ve formě okrajového integrálu ψ(r ) = ∂D n G(r, r ) rψ(r) − ψ(r) rG(r, r ) + 2ie ¯h G(r, r )ψ(r)A(r) d2 r (5.17) = ∂D n G(r, r ) rψ(r) + ie ¯h ψ(r)A(r) − ψ(r) rG(r, r ) − ie ¯h G(r, r )A(r) d2 r Tento vztah je stále obecný, nyní ale provedeme několik základních zjednodušení. Předpokládejme, že na okrajích oblasti D platí kvaziklasická aproximace, tento předpoklad je v praxi velmi dobře splněn. Pak můžeme pro gradient vlnové funkce psát rψ(r) = F F + i ¯h rS(r0, r) ψ(r) ≈ i ¯h pψ(r) (5.18) kde jsme použili rS(r0, r) = p a modifikovaný předpoklad kvaziklasické aproximace F F p ¯h . Užitím vztahu mezi kanonickým a kinematickým impulzem pak můžeme psát rψ(r) + ie ¯h ψ(r )A(r) = i ¯h g0(r0) = k0(r0) (5.19) kde jsme označily k0(r0) vlnový vektor příchozí vlny. Doposud jsme nijak nespecifikovali Greenovu funkci. Rigorózní odvození jejího tvaru přesahuje možnosti této přednášky, lze ho však nalézt v [3]. My zde uvedeme pouze konečný tvar G(r, r ) = a(r, r ) exp i ¯h S(r, r ) (5.20) kde amplituda a je daná vztahem a(r, r ) = (16π2 g(r)g(r ) cos ϑ cos ϑ )− 1 2 ∂2 S/∂x∂x ∂2 S/∂y∂x ∂2 S/∂x∂y ∂2 S/∂y∂y 1 2 (5.21) g(r) je kinetický impulz rozptýlené vlny vycházející z bodu r a šířící se k bodu r v bodě r. Obdobně g(r ) je velikost tohoto impulzu v konečném bodě r . Úhly ϑ a ϑ jsou pak úhly které svírají odpovídající paprsky v normálou na difraktující plochu, či na rovinu pozorování. Pro gradient Greenovy funkce pak můžeme psát rG(r, r ) = ra(r, r ) a(r, r ) + i ¯h rS(r, r ) G (5.22) první člen v závorce můžeme opět v kvaziklasické aproximaci zanedbat. Gradient bodového eikonálu v druhém členu je vzhledem k počáteční poloze. Můžeme použít podobný postup jako v kapitole 1 pří odvozování vztahu (1.17), který popisuje gradient vzhledem ke konečnému bodu. Dostaneme pak vztah ∂S ∂r − eA = −g (5.23) a pro poslední závorku v integrandu ve vzorci (5.17) pak můžeme psát rG(r, r ) − ie ¯h G(r, r )A(r) = ik(r) (5.24) 34CHAPTER 5. VLNOVĚ OPTICKÝ POPIS A ROZLIŠENÍ V OPTICE NABITÝCH ČÁSTIC Figure 5.1: Difrakce na apertuře čímž se zelý vzorec redukuje na ψ(r ) = ∂D nG(r, r )ψ(r)(k0(r) + k(r))d2 r (5.25) Pokud tento postup aplikujeme na situaci, kdy k difrakci dochází na malé apertuře v rovině z (apertura je na ose) a uvažujeme velkou vzdálenost bodu měření r od apertury ve srovnání s její velikostí, lze pro vlnovou funkci v bodě r psát v relativně jednoduchém tvaru ψ(r ) = −ib(z ) A ψ(x, y)exp i ¯h S(r, r ) dxdy (5.26) kde b(z ) = 1 ¯h J(z, z ) Φ∗ (z) Φ∗(z ) 1 2 (5.27) Použili jsme označení J(z, z ) pro osovou hodnotu Jakobiánu J(z, z ) = ∂2 S/∂x∂x ∂2 S/∂y∂x ∂2 S/∂x∂y ∂2 S/∂y∂y (5.28) Poznamenejme ještě, že člen b(z ) není ve většině případů podstatný, protože výsledná vlnová funkce se normuje. 5.3 Rozptylová fuknkce Předpokládejme obecný elektronově optický zobrazovací systém. Hlavní charakteristikou systému je takzvaná rozptylová funkce (point-spread-function), která udává, jak systém zobrazí jeden bod k jak velkému rozmazání dojde. Na tomto se podílejí aberace systému (geometrické, chromatické, parazitické) a difrakce na aperturách. Uvažujme bod qo = (xo, yo) v rovině objektu z = zo, který systém zobrazí do roviny obrazu paraxiálně do bodu qi. Uvažujme, že v systému je jedna apertura v rovině z = za. Vlnová funkce v rovině obrazu je pak dána pomoci difrakčního integrálu ψ(q) ∝ Ap. exp i ¯h (S(qo, qa) + S(qa, q) d2 qa (5.29) 5.3. ROZPTYLOVÁ FUKNKCE 35 V exponentu je součet dvou bodových eikonálů, první z bodu qo do bodu v apertuře qa, druhý ze stejného bodu v apertuře do bodu q v rovině obrazu. Tyto tři body obecně neleží na jedné trajektorii, trajektorie, která prochází body qo a qa protíná rovinu obrazu v nějakém bodě qf , který je obecně různý od bodu q, obrázek 5.1. Nicméně při výpočtu rozptylové funkce bude bod q velmi blízko bodu qf pro všechny body v apertuře, tj. q = qf + ˜d, kde ˜d je velmi malé. Pak můžeme pro součet eikonálů psát S(qo, qa) + S(qa, q) = S(qo, qa) + S(qa, qf + ˜d) = S(qo, qa) + S(qa, qf ) + pf ˜d + o( ˜d2 ) (5.30) ≈ S(qo, qf ) + pf ˜d Zanedbání vyšších členů rozvoje v ˜d je ekvivalentní Fresnellově difrakci. V tomto okamžiku je vhodné přejít od bodového eikonálu k eikonálu, který je určený počátečním bodem a konečnou směrnicí - smíšenému eikonálu. V tomto odstavci jen stručně shrneme základní teorii. Jedná se o jinou parametrizaci eikonálu, která se odvodí pomocí Legendrovy transformace. Variaci bodového eikonálu lze psát ve tvaru δS = pδq − poδqo = ∂S ∂q δq + ∂S ∂qo δqo (5.31) tj. ∂S ∂q = p , ∂S ∂qo = −p0 (5.32) pokud na obě strany rovnice přidáme člen −δ(pq) dostaneme δ(S − pq) = −qδp − poδqo (5.33) Zavedením smíšeného eikonálu V = S − pq pak můžeme psát δV = −qδp − poδqo = ∂V ∂p δp + ∂V ∂qo δqo (5.34) tj. ∂V ∂p = −q , ∂V ∂qo = −p0 (5.35) Podobně jako u bodového eikonálu platí, že v počáteční a konečné rovině se shodují reálné a paraxiální trajektorie ( pro S(qo, qa) platí q(zo) = q(1) (zo) = qo, q(za) = q(1) (za) = qa), tak pro smíšený eikonál V (qo, pf ) platí, že v počátečním bodě se hoduje paraxiální a reálná trajektorie a v konečné rovině se shoduje paraxiální a reálná hybnost p(zi) = p(1) (zi). Pro součet bodových eikonálů pak dostaneme výraz S(qo, qa) + S(qa, q) = V (qo, pf ) + pf qf + pf ˜d = V (qo, pf ) + pf q (5.36) Kvadratickou část smíšeného eikonálu snadno spočítáme z paraxiální aproximace qi = − ∂V (2) ∂pf ⇒ V (2) = −qipf (5.37) a rozdělením smíšeného eikonálu na část popisující aberace V (a) a paraxiální část dostaneme S(qo, qa) + S(qa, q) = V (a) (qo, pf ) + pf d (5.38) kde d = q − qi je odchylka od paraxiálního obrazu. 36CHAPTER 5. VLNOVĚ OPTICKÝ POPIS A ROZLIŠENÍ V OPTICE NABITÝCH ČÁSTIC Pokud budeme uvažovat pouze systémy, které mají na vzorku pouze osově symetrické pole (naprostá většina elektronově-optických systémů) lze najít jednoznačný vztah mezi hybností a paraxiální směrnicí. Kvadratickou část indexu lomu v rotačních souřadnicích lze psát ve tvaru n(2) = − 1 Φ∗ 1/2 (Φ + η2 B2 )q2 + 1 2 Φ∗ 1 2 q 2 (5.39) a pro hybnost pak platí pi = p (1) i = √ 2me ∂n(2) ∂q = gq (1) i (5.40) Zavedením funkce popisující deviaci vlnoplochy χ(qo, qi) = −V (a) /gf (5.41) dostaneme vlnovou funkci v rovině obrazu ve tvaru Fourierovy transformace ψ(q) ∝ Ap. ang. exp − i ¯h gf χ(qo, qi) e i ¯h gf qi d d2 qi (5.42) Aperturní úhly mohou být snadno spočítané z paraxiálních trajektorií a deviace vlnoplochy lze velmi snadno spočítat z aberačního polynomu ∆q = qf (qo, qi) − q = ∂χ(qo, qi) ∂qi (5.43) Z vlnové funkce ψ(q) můžeme snadno spočíst rozptylová funkce ρ(q) jako kvadrát její absolutní hodnoty, tj. ρ(q) = |ψ(q)|2 ∝ Ap. ang. exp − i ¯h gf χ(qo, qi) e i ¯h gf qi d d2 qi 2 (5.44) V dalším se vrátíme ke standardní komplexní notaci, w = x + iy and ω = xi + iyi. Vztah mezi deviací vlnoplochy a aberačním polynomem v rovině obrazu má v komplexní notaci tvar ∆wi = 2∂χ/∂¯ω. V případě osově symetrického systému má aberační polynom v parametrizaci pomoci paraxiálních poloh a směrnic v obraze tvar ∆wi =C1ω + C3ω2 ¯ω + K3ω¯ωwi + ¯K3ω2 ¯wi + F3ωwi ¯wi+ (5.45) A3f ¯ωω2 i + D3w2 i ¯wi kde jsme použili standardní značení pro aberace třetího řádu a wi = Mwo je paraxiální obraz bodu wo. Pro deviaci vlnoplochy pak můžeme psát χ = 1 2 C1ω¯ω + 1 4 C3(ω¯ω)2 + 1 2 K3ω¯ω2 wip + F3ω¯ωwip ¯wip+ (5.46) A3f ¯ω2 w2 ip + D3 ¯ωw2 ip ¯wip V případě osových aberací má aberační polynom tvar ∆wi =A0 + C1ω + A1 ¯ω + B2ω2 + 2 ¯B2ω¯ω + A2 ¯ω2 + (5.47) C3ω2 ¯ω + S3ω3 + 3 ¯S3ω¯ω2 + A3 ¯ω3 + 2B4ω3 ¯ω + 3 ¯B4ω2 ¯ω2 + D4ω4 + 4 ¯D4ω¯ω3 + A4 ¯ω4 + C5ω3 ¯ω2 + 2S5ω4 ¯ω + 4 ¯S5ω2 ¯ω3 + R5ω5 + 5 ¯R5ω¯ω4 + A5 ¯ω5 5.4. ROZLIŠENÍ V ELEKTRONOVÝCH MIKROSKOPECH 37 a pak deviace vlnoplochy vychází χ = A0 ¯ω + 1 2 C1ω¯ω + 1 2 A1 ¯ω2 + B2ω2 ¯ω + 1 3 A2 ¯ω3 (5.48) + 1 4 C3(ω¯ω)2 + S3ω3 ¯ω + 1 4 A3 ¯ω4 + B4ω3 ¯ω2 + D4ω4 ¯ω + 1 5 A4 ¯ω5 + 1 6 C5(ω¯ω)3 + S5ω4 ¯ω2 + R5ω5 ¯ω + 1 6 A5 ¯ω6 Pokud má svazek nenulovou šířku, rozptylová funkce je ovlivněna chromatickými aberacemi: ∆wi =A0 − CC0δE + (C1 − CC1δE − CC2δE2 )ω + A1 ¯ω+ (5.49) B2ω2 + 2B2ω¯ω + A2 ¯ω2 + (C3 − CC13δE)ω2 ¯ω + S3ω3 + 3S3ω¯ω2 + A3 ¯ω + · · · kde δE = ∆E/E je relativní deviace energie a použili jsme následující značení pro disperzi CC0 chromatickou aberaci prvního a druhého řádu (CC1 a CC2) a pro chromaticitu sférické aberace CC13. Deviace vlnoplochy pak bude mít stejný tvar jako (5.48), jen je nutné změnit následující koeficienty: A0 → A0 − CC0δE (5.50) C1 → C1 − CC1δE − CC2δE2 C3 → C3 − CC13δE Lze předpokládat, že dvě vlnové funkce o různých energiích jsou nekoherentní a výsledná vlnová funkce pak vznikne integrací přes energiové spektrum ρ(q) = E ρ(q, E)ρEdE (5.51) kde ρ(q, E) je rozptylová funkce pro monochromatický svazek s energií E a ρE je energiové spek- trum. 5.4 Rozlišení v elektronových mikroskopech V případě prozařovacích elektronových mikroskopů je vzorek osvětlen rovinou vlnou a rovina vzorku je pak zobrazena na detektor. Pokud bychom uvažovali ideální detektor, tak je rozlišení determinováno velikostí plošky na níž se zobrazí bodový zdroj v rovině objektu na detektor. To je determinováno pomoci rozptylové funkce. Užívá se několik kritérií, pomoci kterých rozhodujeme, jestli dva různé body rozlišíme. Zmíníme pouze kritéria vycházející z velikosti plochy, na níž se bod v předmětu zobrazí. Pokud se plochy dvou takových bodů neprotínají, považujeme body za rozlišitelné v opačném případě za nerozlišitelné. V praxi nejvíce používanou definicí velikosti plochy je průměr plochy, která obsahuje 50% proudu. Další možnost je definovat rozměr plochy jako vzdálenost od maxima, v níž velikost rozptylové funkce poklesne na 1/e maximální hodnoty. V případě rastrovacích elektronových mikroskopů je elektronový svazek emitovaný z nějakého elektronového zdroje fokusován na vzorek. Poloha fokusu na vzorku se mění pomoci vychylovacího systému. Pro každý bod (pixel) se pak zaznamenává signál za vzorku (signální elektrony, případně prošlé elektrony vzorkem). Je jasné, že nemá smysl mít pixel menší než je velikost zobrazeného zdroje, která tímto definuje mezní rozlišení. V případě bodového zdroje je pak rozlišení dáno rozptylovou funkcí. V praxi je ovšem zdroj elektronů nebodový a proto je nutné velikost rozmazání spočítat z funkce, která vznikne integrací příspěvků ze všech bodů zdroje ρ(q) = S ρP SF (q; qo)ρ(qo)dqo (5.52) 38CHAPTER 5. VLNOVĚ OPTICKÝ POPIS A ROZLIŠENÍ V OPTICE NABITÝCH ČÁSTIC Kromě rigorózního postupu určení rozlišení lze nalézt také zjednodušující postupy, které kombinují příspěvky jednotlivých vad do relativně jednoduchých vzorců. Postup je velmi přesně rozepsán v [1], my zde jen shrneme hlavní výsledky. Ve všech případech budeme uvádět efekt aberací na průměr oblasti která obsahuje 50% proudu. Sférická vada způsobí rozostření obrazu bodu na plošku o průměru dS50 = 1 2 5/2 C3α3 (5.53) kde α je aperturní úhel. Difrakce na apertuře způsobí zvětšení plošky na dA50 = 0.54 λ α (5.54) kde λ je vlnová délka elektronů. Efekt chromatické aberace pak lze vyjádřit vztahem dC50 = 0.34CC ∆E E α (5.55) Kombinací efektů všech těchto aberací pak dostaneme velikost obrazu zdroje d50 = d2 C50 + (Mds)1.3 + (d4 A50 + d4 S50)1.3/4 2/1.3 1/2 (5.56) kde ds je velikost zdroje elektronů a M je zvětšení systému. Z předchozího je patrné, že příspěvky jednotlivých aberací závisí na hodnotě aperturního úhlu. Zatímco příspěvek sférické a chromatické aberace s velikostí aperturního úhlu roste, příspěvek difrakce klesá. Existuje tedy nějaká optimální hodnota aperturního úhlu, pro kterou je hodnota d50 nejmenší - optimální apertura. Tato hodnota nám udává nejlepší možné rozlišení, které můžeme při dané energii dosáhnout. Chapter 6 Úkoly k zápočtu Z každé sekce proveďte jeden z úkolů Pole 1. Odvoďte Obecný rozvoj potencilálu v křivočarých souřadnicích, postupujte podle [6]. 2. Mějme obecný kvadrupól vzniklý rozřezáním válce na segmenty se stejným polárním úhlem (Elektroda 40 deg, mezera 5 deg. • Určete nastavení potenciálů pro regulární kvadrupól, jaké další pole se v takovém systému vyskytují • Určete nastavení potenciálů tak, aby prvek fungoval jako ”skew” dipól s potlačeným hexapólovým polem • Určete, jak by se muselo změnit buzení kvadrupólu, pokud bychom snížili velikost polárního úhlu každého segmentu na 30 deg (mezera 15 deg) Paraxiální aproximace - teorie 1. Odvoďte obecnou paraxialní rovnici trajektorie, jak je nastíněno v podkapitole 3.1 2. Odvoďte přechod do rotačních souřadnic a přechod do Pichtových souřadnic pro obecné stigmatické systémy 3. Odvoďte výraz pro disperzi magnetického systému s mid-section symmetry. Diskutujte její závislost na poloměru zakřivení centrální trajektorie Paraxiální aproximace - aplikace . Dodaná osová pole jsou v ascii formátu, import do libovolných numerických programů (Matlab, Maple, Mathematica) by měl být triviální. 1. Magnetická čočka • Energie elektronů je 10 keV • Spočítejte polohu ohnisek, polohu hlavních rovin a ohniskové dálky čočky pomoci numerického řešení paraxiální rovnice trajektorie. Velikost ohniskových dálek srovnejte s výsledkem aproximace tenkou čočkou • Určete škálovací faktor magnetického pole čočky pro zobrazení zo = −250 mm do zi = 5 mm • Určete astigmatizmus při elipticitě 1.5µm a nutné napětí na elektrodách kvadrupólu tak, aby se astigmatizmus v obrazové rovině korigoval (A1(zi) = 0, a1(zi) = 0). 39 40 CHAPTER 6. ÚKOLY K ZÁPOČTU Popis dodaných souborů: Btol.txt: Soubor obsahující magnetické pole a pole elipticity. První sloupec - souřadnice z [m], druhý sloupec - osové magnetické pole B(z) [T], třetí sloupec - osový kvadrupolový koeficient při elipticitě 1 mm (předpokládáme lineární závislost parazitního pole na velikosti elipticity) Ψ2(z)[T/m2 ] Es.txt: Soubor obsahující kvadrupólové pole stigmátorů při napětí na elektrodách ±1V . První sloupec - souřadnice z, druhý sloupec - osový kvadrupolový koeficient prvního stigmátoru Φ2(z) [V/m2 ], třetí sloupec osový kvadrupolový koeficient 2. stigmatoru Φ2(z)[V/m2 ]. 2. Elektrostatická čočka • Spočítejte polohu ohnisek, polohu hlavních rovin a ohniskové dálky čočky pomoci numerického řešení paraxiální rovnice trajektorie. Napětí mezi vnějšími elektrodami a prostřední fokusační elektrodou je 20 kV a energie elektronů před a za čočkou je 30 keV. Velikost ohniskových dálek srovnejte s výsledkem aproximace tenkou čočkou • Určete napětí na fokusační elektrodě pro zobrazení zo = −45 mm do zi = 5 mm • Určete astigmatizmus při elipticitě 1.5µm a nutné napětí na elektrodách kvadrupólu tak, aby se astigmatizmus v obrazové rovině korigoval. Popis dodaných souborů: El.txt: Soubor obsahující elektrické pole. První sloupec - souřadnice z [m], druhý sloupec - osový elektrostatický potenciál Φ(z) [V] při nulovém potenciálu na vnějších elektrodách a potenciálu 1 V na prostřední (fokusační) elektrodě třetí sloupec - osový elektrostatický potenciál při potenciálu 1 V na vnějších elektrodách a potenciálu 0 V na prostřední (fokusační) elektrodě. Etol.txt Soubor obsahující kvadrupólové parazitické pole dané elipticitou čoček. První sloupec - souřadnice z [m], druhý sloupec - kvadrupolový osový koeficient Φ2(z)[V/m2 ] při elipticitě 1 mm (předpokládáme lineární závislost parazitního pole na velikosti elipticity) pro nulový potenciál na vnějších elektrodách a potenciálu 1 V na prostřední (fokusační) elektrodě. Třetí sloupec je stejný jako druhý sloupec jen pro potenciál 1V na vnějších elektrodách a potenciálu 0 V na prostřední (fokusační) elektrodě Es.txt: Soubor obsahující kvadrupólové pole stigmátorů při napětí na elektrodách ±1V . První sloupec - souřadnice z, druhý sloupec - osový kvadrupolový koeficient prvního stigmátoru Φ2(z) [V/m2 ], třetí sloupec osový kvadrupolový koeficient 2. stigmatoru Φ2(z)[V/m2 ]. Paraxiální aproximace - periodické systémy 1. Odvoďte výraz pro centrální trajektorii částice s mírně odlišnou energií od centrální energie (??) viz., [5] 2. Popište longitudiální stabilitu svazku pro vyšší výchylky, kdy nelze oscilace popsat pomoci lineární diferenciální rovnice. Užijte analýzy rovnice (??) a chování nelineárního oscilátoru, diskutujte obrázek 18 z [7]. Odvoďte rovnici separatrix. Aberace 1. Vykreslete vliv sférické aberace (C3 = 2.5 mm) a chromatické aberace (CC = 2 mm) na trajektorie v blízkosti fokusu pro svazek vycházející v předmětu z osy o energii 20 keV. Pro jednoduchost předpokládejme zvětšení M = 1, m = 1. Aperturní úhel zvolte 0.016 rad. Vliv chromatické vady ukažte pomoci vykreslení svazku s energiemi E − 1 eV, E a E + 1 eV. 2. Vykreslete vliv Komy, Astigmatizmu, sklenutí pole a distorze na svazek v rovině obrazu (viz. [3]) 41 Vlnová elektronová optika 1. Odvoďte vztah pro vlnovou funkci pro systém s nenulovým defokusem C1 a sférickou aberací C3 ve formě jednorozměrného integrálu (přechod do polárních souřadnic a integrace přes polární úhel) [3], str. 1292. 2. Najděte optimální aperturní úhel a rozlišení (aperturní úhel, který zaručuje nejlepší rozlišení) pro systém s sférickou vadou C3 = 2.8 mm, chromatickou vadou CC = 1.5 mm, energií svazku 30 keV, energiovou šířkou zdroje ∆E = 0.6 eV a nulovou velikostí zdroje. Použijte postup z [1]. 42 CHAPTER 6. ÚKOLY K ZÁPOČTU Bibliography [1] Je E Barth and P Kruit. Addition of different contributions to the charged particle probe size. Optik, 101(3):101–109, 1996. [2] P W Hawkes and E Kasper. Principles of Electron Optics: Basic Geometrical Optics. Elsevier Science, 1996. [3] P W Hawkes and E Kasper. Principles of Electron Optics: Wave Optics. Principles of electron optics. Elsevier Science, 2012. [4] John David Jackson. Jackson - Classical Electrodynamics (3rd Ed.).pdf. American Journal of Physics, page 641, 1962. [5] M Martini. AN INTRODUCTION TO TRANSVERSE BEAM DYNAMICS IN ACCELERATORS Contents 1 PARTICLE MOTION IN MAGNETIC FIELDS THE THIRD-INTEGER RESONANCE APPENDIX A : HILL ’ S EQUATION. 11(March), 1996. [6] H.H. Harald Rose. Geometrical Charged-Particle Optics, volume 142. 2009. [7] Helmut Wiedemann. Longitudinal Beam Dynamics. pages 191–236, 2007. [8] Wikipedia. Frenet–Serret formulas — Wikipedia{,} The Free Encyclopedia, 2016. 43