Světlovody Pavel Dvořák Verze z 15.1. 2016. 1 Úvod 1.1 Některé kroky ve vývoji světlovodů Kdybychom si přáli uvěznit světlo, posloužil by nám jako návod Snellův zákon. Z něj mimo jiné vyplývá známá skutečnost o totálním odrazu – pokud světlo šířící se prostředím s indexem lomu n1 dopadá na rozhraní s opticky řidším prostředím s indexem lomu n2 pod úhlem větším než arcsin (n2/n1), odrazí se se stejnou intenzitou zpět a do opticky řidšího prostředí neprojde. Na tomto principu založený světlovod ukázal už John Tyndall (publikováno v r. 1870), který zavedl světlo do proudu kapaliny vytékající bočním otvorem z nádoby. Světlo bylo vedeno uvnitř proudu, přestože byl zakřivený. Analogickou strukturu mají i současná optická vlákna. Jsou tvořena dielektrickým jádrem, které je obklopeno pláštěm vyrobeným z dielektrika s indexem lomu menším než je index lomu jádra. Velký zájem o světlovody se objevil až v šedesátých letech 20. století v souvislosti s objevem laseru. Zdroj koherentního optického záření nabízel možnost obrovsky rychlého přenosu dat, která ale narážela na vysoký útlum světla v tehdy dostupných optických materiálech. Za zlomový se považuje rok 1970, kdy se podařilo vyrobit optické vlákno s útlumem pod 20 dB/km (V takovémto vlákně došlo k útlumu na polovinu původní intenzity na vzdálenosti 150 m.) I další vývoj optické komunikace byl doprovázen prudkým poklesem útlumu v optických vláknech spojeným s posunem vlnové délky používaného záření k vyšším hodnotám (1550 nm), kde dochází k menšímu rozptylu záření. Dnešní křemenná vlákna dosahují útlumu menšího než 0,2 dB/km a s pomocí zesilovačů překlenují i tisícikilometrové vzdálenosti mezi kontinenty. Dalším problémem, který je při optickém přenosu dat potřeba řešit, je disperze. Tvar optického signálu je ve světlovodu deformován, při použití pulzů dochází k jejich rozšiřování, případně i překryvu sousedních pulzů. Základním krokem v tomto směru bylo využití jednomodových vláken. Následoval posun vlnové délky z oblasti pod 900 nm k hodnotě 1300 nm, na které běžná křemenná vlákna vykazují minimální disperzi. Protože ale na vlnových délkách okolo 1550 nm lze dosáhnout menšího útlumu, byla vytvořena tzv. vlákna s posunutou disperzí. Ta mají profil indexu lomu jádra upravený tak, aby se oblast minimální disperze posunula právě do okolí vlnové délky 1550 nm. Nejdůslednějším potlačením disperze je její kompenzace pomocí nelineárních optických jevů. Vzniknou tak pulzy nazývané solitony, které se vláknem pohybují bez změny svého tvaru. Už v roce 1994 se tak podařilo přenést na vzdálenost 180 miliónů kilometrů signály rychlostí 1010 pulzů za sekundu. Velkého urychlení přenosu dat optickými vlákny bylo dosaženo současným posíláním signálů na různých vlnových délkách. Pro rozvoj této technologie na dlouhých trasách mělo zásadní vliv vytvoření erbiem dotovaných vláknových zesilovačů. Jde o optická vlákna s příměsí erbia, která jsou čerpaná vhodným polovodičovým laserem a na základě stimulované emise zesilují procházející signál. Jejich výhodou je, že zesilují dostatečně 2 širokou oblast záření s vlnovými délkami v okolí 1550 nm, která se používá pro opickou komunikaci. Kromě optických vláken se k přenosu světla využívají také rovinné světlovody. Jsou základem pro integrovanou optiku. Podobně jako integrované obvody minimalizují rozměry v elektronice, integrovaná optika se snaží umístit množství optických zařízení (sloužících např. pro rozbočování, slučování, modulaci, přepínání, spínání, polarizaci, fokusaci, generování a detekci) na jedinou desku (čip). 1.2 Využití světlovodů • Přenos dat. • Přenos osvětlení a obrazu, přenos záření. Optickými vlákny je možné nejenom osvítit těžko přístupná místa, ale také přenést obraz těchto míst – typickým příkladem je endoskop. Přenos záření ve spektroskopii, v ICCD kamerách . . . • Vláknové zesilovače záření a lasery. • Měření různých fyzikálních veličin pomocí optických vláknových senzorů. Vhodně vyrobené vlákno může být citlivé na požadovanou veličinu, což lze využít k jejímu měření. • Galvanické oddělení obvodů. 1.3 Výhody a nevýhody použití světlovodů Výhody: ◦ Velká šířka přenosového pásma. Dnes jsou běžná optická vlákna přenášející 10 – 40 Gb/s na jediné vlnové délce na vzdálenosti přes 100 km. Možnosti tím ale zdaleka nejsou vyčerpány. Například pomocí solitonů je možné stejnou rychlostí posílat pulzy stovky milionů kilometrů daleko. ◦ Možnost posílat signály na několika vlnových délkách současně, tzv. vlnový multiplex (wavelength division multiplex, WDM). Dnes je vlákny běžně posíláno několik desítek vlnových délek zaráz, čímž se samozřejmě rychlost přenosu dat mnohonásobně zvyšuje. Ovšem jen samotná využitelná spektrální oblast v okolí 1550 nm má frekvenční rozsah 1012 - 1013 Hz, což je přibližně o tři řády víc než v celé radiofrekvenční a mikrovlnné oblasti. Počet kanálů tedy ještě bude možné podstatně zvýšit. ◦ Nízká latence, tedy rychlé šíření jednotlivých pulzů vláknem. ◦ Dobrá izolace signálu od okolního prostředí, data proto nejsou ohrožena rušením a jejich odposlouchávání je relativně obtížné. ◦ Bezpečnost – optický světlovod nemůže být zdrojem zkratů ani jisker. Může proto být bez problémů použit i v hořlavém a výbušném prostředí. 3 ◦ Malý útlum v optických vláknech. ◦ Energetická nenáročnost – ve srovnání s elektickým přenosem signálu vyžadují opt. vlákna podstatně méně energie. ◦ Malé rozměry a hmotnost, dobrá pevnost optických kabelů. ◦ Galvanické oddělení vstupu a výstupu. Při nevodivém spojení vstupu a výstupu optického kabelu také odpadá problém s tzv. zemními smyčkami způsobenými rozdílným potenciálem spojovaných míst. Nevýhody: • Obtížné spojování optických prvků. • Možnost křehnutí optických vláken za nízkých teplot. 1.4 Přenos světla atmosférou Ve volném prostoru mimo atmosféru Země je možné vysílat světlo na obrovské vzdálenosti. Přenos světla atmosférou se ale v optoelektronice příliš neujal, zejména kvůli útlumu přenášeného záření. Za útlum zodpovídají: • Molekulární absorpce (H2O, CO2, . . . ) a absorpce na částicích aerosolů. • Rozptyl na pevných a kapalných částicích přítomných v atmosféře. Ve srovnání s ním má rozptyl na molekulách nezanedbatelný vliv jen za jasných dnů a ve vyšších vrstvách atmosféry. Naopak za hustého sněžení je dohlednost v atmosféře mizerná. • Ohyb a rozptyl na teplotních nehomogenitách atmosféry. Index lomu vzduchu je závislý na teplotě, která v atmosféře zdaleka není konstantní. Protože tyto nehomogenity svými rozměry přesahují průměr světelného svazku, dochází spíš než k rozptylu k odklonění celého svazku. Další nevýhodou je, že bez použití zrcadel umožňuje atmosféra přenos informace pouze mezi místy s přímou viditelností. Turbulentní atmosféra a jas pozadí jsou dále zdroji šumu v detektorech. To vše vedlo k velkému využití optických vláken, které pro přenos dat eliminují většinu problémů, se kterými by bylo nutné počítat při přenosu světla atom- sférou. 4 a n n1 n2 r Obr. 1: Příklad profilu indexu lomu optického vlákna. 2 Optická vlákna 2.1 Elektrické a magnetické pole v opt. vláknech 2.1.1 Obecné rovnice pro optická vlákna Typické optické vlákno se skládá z jádra, které má maximální index lomu n1, a pláště s indexem lomu n2 < n1 (viz. obr. 1). Ke zjištění vlastností elektromagnetického pole ve vlákně použijeme Maxwellovy rovnice pro téměř homogenní dielektrikum bez volných nábojů ∇.E ≈ 0 ∇.B = 0 ∇ × E = −B,t ∇ × B = µεE,t ze kterých vyplývá △ψ = n2 c2 ψ,tt (1) kde ψ může označovat libovolnou složku vektoru E nebo B a kde n/c = √ εµ. Při přesnějším přístupu je potřeba uvážit, že v nehomogenním prostředí neplatí ∇.E = 0, ale ∇.D = ∇.(εE) = 0, což způsobí, že při odvozování (1) nelze v rovnici ∇(∇.E) − △E = −µεE,tt vynechat první člen. Po využití ∇.(εE) = E.∇ε+ε∇.E a εr = n2 tak dostaneme poněkud odlišnou vlnovou rovnici △E + ∇(E. ∇n2 n2 ) = n2 c2 E,tt (2) Druhý člen této rovnice je ale v mnoha případech zanedbatelný. Řešení obou rovnic (1) i (2) lze hledat ve tvaru ψ = ψ0 (r, ϕ) eiωt−γz γ = iβ + α ≈ iβ 5 kde ω reprezentuje (kruhovou) frekvenci, β složku vlnového vektoru ve směru osy z a α útlum vlnění. Z uvedeného předpokladu vyplývají úpravy ψ,t = iω ψ ψ,z = −γ ψ ψ,tt = −ω2 ψ ψ,zz = γ2 ψ které můžeme dosadit do rovnice (1) vyjádřené v cylindrických souřadnicích (viz kpt. 5.1, vztah (107)): ψ,rr + 1 r ψ,r + 1 r2 ψ,ϕϕ + γ2 ψ = −ω2 n2 c2 ψ Dále označím H2 ≡ (nω/c)2 + γ2 = k2 0n2 + γ2 , použijeme separaci proměnných ψ0 = R(r) Φ(ϕ) a skutečnost, že funkce Φ je periodická s periodou 2π: r2 R,rr R + r R,r R + Φ,ϕϕ Φ + r2 H2 = 0 Φ,ϕϕ Φ = −l2 l ∈ Z r2 R,rr + rR,r + (r2 H2 − l2 )R = 0 (3) Řešení, zatím neúplné, tedy dostává tvar ψ = R(r) ei(lϕ+ωt)−γz l ∈ Z (4) kde funkce R(r) je řešením rovnice (3). Veličina H2 závisí na indexu lomu, je tedy v obecném případě také funkcí r, což rovnici (3) komplikuje. Je vhodné poznamenat, že rovnice (3) platí přesně pouze v oblastech s konstantním indexem lomu, protože zanedbává ∇n2 . Důležitou skutečností je spojitost tečných složek intenzity elektrického a magnetického pole v celém vlákně, tedy i na hranici jádra a pláště. Předpokládejme, že známe řešení rovnice (3) pro veličiny Ez a Bz. Pro výpočet ostatních složek vektorů E a B je možné použít pár Maxwellových rovnic obsahující rotace: 1 r Ez,ϕ + γEϕ = −iωBr 1 r Bz,ϕ + γBϕ = i ωn2 c2 Er γEr + Ez,r = iωBϕ γBr + Bz,r = −i ωn2 c2 Eϕ Eϕ,r + 1 r Eϕ − 1 r Er,ϕ = −iωBz Bϕ,r + 1 r Bϕ − 1 r Br,ϕ = i ωn2 c2 Ez Tyto rovnice mimo jiné ukazují, že Ez i Bz musí mít stejný řád l. Při výpočtu Er lze postupovat: i ωn2 c2 Er = 1 r Bz,ϕ + γ iω (γEr + Ez,r) iEr ωn2 c2 + γ2 ω = 1 r Bz,ϕ − i γ ω Ez,r 6 Er k2 0n2 + γ2 = − iω r Bz,ϕ − γEz,r Er = − iω rH2 Bz,ϕ − γ H2 Ez,r Er = ωl rH2 Bz − γ H2 Ez,r (5) Analogicky se odvodí: Eϕ = iω H2 Bz,r − ilγ rH2 Ez (6) Br = − ωln2 rH2c2 Ez − γ H2 Bz,r (7) Bϕ = − iωn2 H2c2 Ez,r − ilγ rH2 Bz (8) Všimněme si teď veličiny H2 , která vyjadřuje druhou mocninu velikosti průmětu vlnového vektoru do roviny kolmé k ose z. Označím h2 ≡ k2 0n2 1 + γ2 ≈ k2 0n2 1 − β2 , h2 2 ≡ k2 0n2 2 + γ2 ≈ k2 0n2 2 − β2 . Pro světlo šířící se vláknem mohou nastat dvě situace: 1. h2 2 > 0, tj. β2 < n2 2k2 0. V této situaci se světlo může v plášti šířit i ve směru kolmém na osu z, dochází tedy ke ztrátám intenzity vyzařováním ven z vlákna. Tyto případy se nazývají zářivé módy. Mají spojité spektrum (vlnové číslo β zářivých módů může nabývat libovolné velikosti), velký útlum a pro vedení světla na větší vzdálenosti nejsou zajímavé. 2. h2 2 < 0 ∧ h2 > 0, tj. n2 1k2 0 > β2 > n2 2k2 0. Nyní se světlo může šířit jádrem vlákna, ale do pláště může pronikat jen jako evanescentní vlna. Tyto případy se nazývají vedené módy a budou předmětem dalšího výkladu. 2.1.2 Vlákna se skokovou změnou indexu lomu Nejjednodušším případem je vlákno se skokovou změnou indexu lomu (step-index fiber, SI vlákno), které má jádro s konstantním indexem lomu n1 a plášť s konstantním indexem lomu n2. Když označíme h2 = k2 0n2 1 + γ2 ≈ k2 0n2 1 − β2 (9) q2 = −(k2 0n2 2 + γ2 ) ≈ β2 − k2 0n2 2 (10) a poloměr jádra a, rozpadne se vztah (3) na dvě samostatné rovnice, z nichž jedna platí v jádře a druhá v plášti: r2 R,rr + rR,r + (r2 h2 − l2 )R = 0 r ≤ a (11) r2 R,rr + rR,r − (r2 q2 + l2 )R = 0 r ≥ a (12) Rovnice (11) je Besselovou diferenciální rovnicí, jejímž řešením jsou tzv. Besselovy funkce prvního a druhého druhu řádu l (viz kpt. 5.2). (Pro puntičkáře – přesný tvar Besselovy rovnice dostaneme po substituci s = hr.) Protože Besselovy funkce druhého 7 druhu divergují pro r → 0, mohou reálné situaci v jádru optického vlákna odpovídat pouze Besselovy funkce prvního druhu. Podobně rovnice (12) je tzv. modifikovanou Besselovou diferenciální rovnicí, jejíž řešení se nazývají modifikované Besselovy funkce. Zatímco modifikované Besselovy funkce prvního druhu divergují pro r → ∞, modifikované Besselovy funkce druhého druhu klesají v této limitě k nule rychleji než exponenciála. Reálné elektromagnetické pole v plášti proto popisují pouze modifikované Besselovy funkce druhého druhu příslušného řádu l. Použijeme-li nyní rovnice (5) – (8) a označení τ = ei(lϕ+ωt)−γz J′ l(x) = d Jl(x) dx K′ l(x) = d Kl(x) dx kde Jl(x) značí Besselovu funkci prvního druhu řádu l a Kl(x) modifikovanou Besselovu funkci druhého druhu řádu l, dostaneme pro výsledné elektromagnetické pole vztahy (13): r ≤ a r ≥ a τ−1 Ez = A Jl(hr) τ−1 Ez = C Kl(qr) τ−1 Er = B ωl h2 1 r Jl(hr) − A γ h J′ l(hr) τ−1 Er = −D ωl q2 1 r Kl(qr) + C γ q K′ l(qr) τ−1 Eϕ = −A ilγ h2 1 r Jl(hr) + B iω h J′ l(hr) τ−1 Eϕ = C ilγ q2 1 r Kl(qr) − D iω q K′ l(qr) τ−1 Bz = B Jl(hr) τ−1 Bz = D Kl(qr) τ−1 Br = −A ωl h2 n2 1 c2 1 r Jl(hr) − B γ h J′ l(hr) τ−1 Br = C ωl q2 n2 2 c2 1 r Kl(qr) + D γ q K′ l(qr) τ−1 Bϕ = −B ilγ h2 1 r Jl(hr) − A iω h n2 1 c2 J′ l(hr) τ−1 Bϕ = D ilγ q2 1 r Kl(qr) + C iω q n2 2 c2 K′ l(qr) (13) Ze spojitosti tečných složek (Ez, Eϕ, Bz a Bϕ) na rozhraní vyplývá soustava rovnic A Jl(ha) = C Kl(qa) (14) B Jl(ha) = D Kl(qa) (15) A lγ (ha)2 Jl(ha) − B ω ha J′ l(ha) = −C lγ (qa)2 Kl(qa) + D ω qa K′ l(qa) (16) A ω ha n2 1 c2 J′ l(ha) + B lγ (ha)2 Jl(ha) = −C ω qa n2 2 c2 K′ l(qa) − D lγ (qa)2 Kl(qa) (17) která má v triviálním případě řešení A = B = C = D = 0. Nás ovšem bude zajímat netriviální případ, ve kterém z rovnic (14) – (16) spočítáme poměry mezi konstantami A, 8 B, C a D: C A = Jl(ha) Kl(qa) (18) B A = lγ ω 1 (ha)2 + 1 (qa)2 J′ l(ha) ha Jl(ha) + K′ l(qa) qa Kl(qa) −1 (19) D A = Jl(ha) Kl(qa) B A (20) Výrazné místo má rovnice (19), která vyjadřuje poměr mezi složkami magnetického a elektrického pole ve směru osy z. Protože γ ≈ iβ, jsou veličiny Ez a Bz fázově posunuty o π/2. Aby soustava rovnic (14) – (17) mohla mít netriviální řešení, musí být determinant této soustavy nulový. Tato skutečnost vede k rovnici J′ l(ha) ha Jl(ha) + K′ l(qa) qa Kl(qa) n2 1 J′ l(ha) ha Jl(ha) + n2 2 K′ l(qa) qa Kl(qa) = − lγc ω 1 (ha)2 + 1 (qa)2 2 (21) Řešení pole v SI vláknech pro l = 0 Nejdřív budeme řešit jednodušší případ pro l = 0, kdy se rovnice (14) – (17) redukují na A J0(ha) = C K0(qa) (22) B J0(ha) = D K0(qa) (23) −B 1 ha J′ 0(ha) = D 1 qa K′ 0(qa) (24) A n2 1 ha J′ 0(ha) = −C n2 2 qa K′ 0(qa) (25) Podělením rovnic (22) a (23) a rovnic (25) a (24) získáme vztahy A/B = C/D a An2 1/B = Cn2 2/D, které mohou v nehomogenním prostředí (n1 = n2) být zároveň splněny pouze dvěma způsoby: 1. A = C = 0. Tyto případy se nazývají transverzálně elektrické (TE) módy, protože jde o elektromagnetickou vlnu splňující Ez = 0. Doplníme-li podmínku A = C = 0 do soustavy rovnic (13), zjistíme, že v TE módech jsou složky Ez, Er a Bϕ nulové, zatímco složky Eϕ, Bz a Br jsou všechny nenulové. Protože rovnice (22) a (25) jsou v TE módech splněny automaticky, stačí už zaručit jen současnou platnost rovnic (23) a (24), což v netriviálním případě vede k J′ 0(ha) ha J0(ha) = − K′ 0(qa) qa K0(qa) (26) Platnost rovnice (26) umožňuje, aby poměr B/A vypočítaný pomocí (19) dosáhl nekonečně velké hodnoty. 2. B = D = 0. Jde o tzv. transverzálně magnetické (TM) módy. Složky Eϕ, Bz a Br zde jsou nulové narozdíl od složek Ez, Er a Bϕ. 9 Tentokrát jsou automaticky splněny rovnice (23) a (24). Ze vztahů (22) a (25) vyplývá n2 1 J′ 0(ha) ha J0(ha) = − n2 2 K′ 0(qa) qa K0(qa) (27) Podmínky (26) a (27) ovšem vyplývají také z rovnice (21), jejíž pravá strana je nyní díky l = 0 nulová. Jak je vidět ze soustavy rovnic (13), optickým vláknem se nemůže šířit vlna, která by měla Ez = 0 i Bz = 0. Díky (112) a (121) můžeme zlomky s Besselovými funkcemi vyjádřit bez jejich derivací: J′ l(ha) ha Jl(ha) = ± l (ha)2 ∓ Jl±1(ha) ha Jl(ha) (28) J′ 0(ha) ha J0(ha) = − J1(ha) ha J0(ha) K′ l(qa) qa Kl(qa) = ± l (qa)2 − Kl±1(qa) qa Kl(qa) (29) K′ 0(qa) qa K0(qa) = − K1(qa) qa K0(qa) Výrazy (28) a (29) a výrazy Jl±1(ha) ha Jl(ha) pro řády l = 0, 1, 2, 3 jsou vyneseny v grafech 2 až 5. Je vidět, že zlomek (28) nabývá nekonečných hodnot v kořenech příslušné Besselovy funkce. Aby bylo možné vyřešit rovnice (26) a (27), je nutné vyjádřit vztah mezi argumenty ha a qa. Z definice těchto veličin (9) a (10) vyplývá (ha)2 + (qa)2 = k2 0a2 (n2 1 − n2 2) Odmocninu pravé strany uvedené rovnice označím V . Tato bezrozměrná veličina V = k0 a n2 1 − n2 2 (30) je přímo úměrná frekvenci vedeného světla, nazývá se normovaná frekvence a hraje důležitou roli v následujícím výkladu. Výraz n2 1 − n2 2 se nazývá numerická apertura a jeho význam bude vysvětlen v kpt. 2.3.1. Pro součin qa tak získáváme vztah qa = V 2 − (ha)2 (31) V následujícím kroku už můžeme řešit upravenou rovnici (26) J1(ha) ha J0(ha) = − K1(qa) qa K0(qa) (32) pro TE módy, resp. téměř totožnou rovnici J1(ha) ha J0(ha) = − n2 n1 2 K1(qa) qa K0(qa) (33) pro TM módy. Grafické řešení je ukázáno na obr. 6, kde jsou modrou křivkou vyneseny levá a červenou křivkou pravá strana rovnice (32) pro zvolenou hodnotu V = 8 v závislosti 10 -2 -1 0 1 2 0 1 2 3 4 5 6 7 8 9 10 J ha l=0 1 2 3 Obr. 2: Výraz (28) pro řády l = 0 − 3. Tenkými svislými čarami jsou znázorněny asymptoty v místech, kde výraz (28) diver- guje. -10 -8 -6 -4 -2 0 0 1 2 3 4 5 K qa l=0 3 Obr. 3: Výraz (29) pro řády l = 0 (černě), 1 (červeně), 2 (modře) a 3 (zeleně). 0 2 4 6 8 10 −2 −1 0 1 2 l=0 1 2 3 ha Jl+1 (ha)/haJl (ha) Obr. 4: Výraz Jl+1(ha) ha Jl(ha) pro řády l = 0 − 3. Přerušovanými čarami jsou znázorněny asymptoty v místech, kde tento výraz diver- guje. 0 2 4 6 8 10 −2 −1 0 1 2 l=0 1 2 3 ha Jl−1 (ha)/haJl (ha) Obr. 5: Výraz Jl−1(ha) ha Jl(ha) pro řády l = 0 (černě), 1 (červeně), 2 (modře) a 3 (ze- leně). na parametru ha. V pravé straně rovnice byl za výraz qa dosazen vztah (31). Průsečíky modré a červené křivky odpovídají různým řešením rovnice (32). Je vidět, že počet řešení je závislý na velikosti normované frekvence V . Pokud normovaná frekvence bude menší než první kořen Besselovy funkce řádu 0 (přibližně 2,405), nebude existovat žádné řešení a vláknem se nebude šířit žádný mód odpovídající l = 0. Budeme-li zvyšovat hodnotu normované frekvence, pak kdykoliv V překročí kořen Besselovy funkce nultého řádu, objeví se nové řešení (nový mód). Protože jde o transverzálně elektrické módy, označují se TE0m, kde index 0 udává hodnotu l, zatímco druhý index m říká, o kolikáté řešení rovnice (32) jde. V našem případě, kdy bylo zvoleno V = 8, by se vláknem šířily dva 11 TE módy s označením TE01 (odpovídající prvnímu – levému – průsečíku modré a červené křivky) a TE02 (odpovídající druhému průsečíku). Téměř shodné výsledky bychom získali při řešení rovnice (33) pro TM módy. -2 -1 0 1 2 0 1 2 3 4 5 6 7 8 9 10 ha TE TE01 02 V Obr. 6: Levá (kreslená modře) a pravá (červeně) strana rovnice (32) pro V = 8. Hodnota normované frekvence, při které se objeví nový mód, se označuje cut-off. Při této hodnotě platí pro nejvyšší mód ha = V a tedy qa = 0, z čehož podle (10) vyplývá β = n2k0. Takovýto mód má proto fázovou rychlost shodnou s vlněním, které by se šířilo pouze materiálem pláště vlákna. Při zvyšování normované frekvence vlnové číslo β daného módu v souladu s (10) poroste a v limitě V → ∞ dosáhne hodnoty β = n1k0. V této limitě naopak fázová rychlost sledovaného módu není ovlivněna materiálem pláště a odpovídá indexu lomu jádra vlákna. Řešení pole v SI vláknech pro l = 0 Pro zjednodušení dalšího zápisu zavedeme označení výrazů (28), (29) a pravé strany rovnice (21): Jl ≡ J′ l(ha) ha Jl(ha) Kl ≡ K′ l(qa) qa Kl(qa) L ≡ − lγc ω 1 (ha)2 + 1 (qa)2 2 (Protože γ je imaginární číslo, je L ve skutečnosti kladné.) Rovnice (21) s tímto označením získává tvar (Jl + Kl) . (n2 1Jl + n2 2Kl) = L 12 Protože l = 0 a pravá strana této rovnice už není nulová, vychází i poměr B/A ve výrazu (19) nenulový a konečný. Pro l = 0 proto neexistují transverzálně elektrické ani transverzálně magnetické módy, ale obě složky Ez a Bz mají nenulovou amplitudu. Vzhledem k Jl je (21) kvadratickou rovnicí se dvěma větvemi řešení Jl = − n2 1 + n2 2 2n2 1 Kl ± n2 1 − n2 2 2n2 1 Kl 2 + L n2 1 (34) Když odmocninu v rovnici (34) přičteme, získáme řešení označovaná EH módy, naopak řešení s odečtením odmocniny vedou k tzv. HE módům. Ve srovnání s HE módy mají EH módy slabší složku Bz a silnější Ez. Tomu odpovídá i skutečnost, že kdybychom do rovnice (34) dosadili l = 0, získali bychom pro EH módy rovnici (33), zatímco pro HE módy rovnici (32). Pro označení jednotlivých módů se symbol EH nebo HE opět doplňuje dvěma indexy, z nichž první udává hodnotu l a druhý o kolikáté řešení příslušné větve rovnice (34) pro dané l se jedná. Abychom získali názorná grafická řešení, je vhodné rovnici (34) upravit • pro EH módy na tvar Jl+1(ha) ha Jl(ha) = n2 1 + n2 2 2n2 1 Kl + l (ha)2 − n2 1 − n2 2 2n2 1 Kl 2 + L n2 1 (35) • a pro HE módy: Jl−1(ha) ha Jl(ha) = − n2 1 + n2 2 2n2 1 Kl + l (ha)2 − n2 1 − n2 2 2n2 1 Kl 2 + L n2 1 (36) Slíbená grafická řešení jsou pro l = 1 vynesena v grafech 7 a 8. Levé strany rovnic (35) a (36) jsou zde vykresleny modře, pravé strany červeně. Za veličinu qa bylo opět dosazeno ze vztahu (31). Důležitá je skutečnost, že mód HE11 je jediným módem, který se může šířit vláknem při libovolné hodnotě normované frekvence V (viz obr. 8). Pokud je tedy V < 2, 405 (2,405 je přibližná hodnota prvního kořene Besselovy funkce nultého řádu, jde proto o cut-off módů TE01 a TM01), bude se vláknem šířit jen jediný vedený mód HE11. Takové vlákno se nazývá jednomodové a v některých směrech má velice výhodné vlastnosti. Při jeho výrobě se dostatečně nízké hodnoty normované frekvence pro danou vlnovou délku dosahuje malým rozdílem indexů lomu n1 − n2 a malým poloměrem jádra vlákna. Grafická řešení rovnic (35) a (36) pro ostatní řády l nebo podmínky vedoucí k jiné normované frekvenci si můžete vykreslit např. pomocí funkce sestavené v programu matlab, kterou lze pod jménem JKl2.m najít na ISu v adresáři učební materiály předmětu Optoelektronika (http://www.is.muni.cz/el/1431/podzim2007/F7450/). Kompletní řešení elektromagnetického pole v SI vlákně je superpozicí polí odpovídajících jednotlivým vedeným módům i módům zářivým. Příspěvek zářivých módů ale můžeme v mnoha případech díky jejich velkému útlumu zanedbat. 13 -2 -1 0 1 2 0 1 2 3 4 5 6 7 8 9 10 ha EH EH11 12 Obr. 7: Grafické řešení rovnice (35) pro l = 1 a V = 8. Za zvolených podmínek se levá (kreslená modře) a pravá (kreslená červeně) strana rovnice protínají ve dvou bodech odpovídajících dvěma EH1 módům. -2 -1 0 1 2 0 1 2 3 4 5 6 7 8 9 10 ha HE11 HE12 HE13 Obr. 8: Grafické řešení rovnice (36) pro l = 1. Zvolená podmínka V = 8 vede ke třem HE1 módům. Průsečík odpovídající módu HE11 existuje pro libovolnou hodnotu V . Disperzní relace v SI vláknech Z pozic průsečíků levé a pravé strany rovnice (35) nebo (36) můžeme pro jednotlivé módy určit veličinu h a pomocí (9) spočítat vlnové číslo β. Tímto postupem lze získat závislost β(V ), která je vzhledem k přímé úměrnosti mezi V a ω disperzní relací optického vlákna se skokovou změnou indexu lomu. Graf disperzní relace je na obr. 9. Na uvedeném grafu je názorně vidět některé vlastnosti optických vláken: • Pro nízké hodnoty normované frekvence je vláknem veden jediný mód HE11. Roste-li normovaná frekvence, roste i počet vedených módů vlákna. • Fázová rychlost (ω/β) jednotlivých módů s rostoucí hodnotou normované frekvence klesá od hodnoty c/n2 (cut-off) k hodnotě c/n1 (pro V → ∞). • Grupová rychlost (dω/dβ) naopak ve většině případů roste. Výjimkou je např. základní mód HE11, jehož grupová rychlost při zvyšování V nejprve klesá a teprve později roste. Módy vyšších řádů mají většinou menší grupovou rychlost než módy nižších řádů. 2.1.3 Lineárně polarizované módy v SI vláknech. V některých vláknech, zejména jednomodových, je rozdíl mezi indexy lomu jádra a pláště malý, tedy n1 − n2 n1 ≪ 1 (37) Takové prostředí se podobá homogennímu, ve kterém se mohou šířit jednoduché lineárně polarizované elektromagnetické vlny. Následující kapitola se proto za předpokladu (37) 14 0 2 4 6 8 10 1.46 1.461 1.462 1.463 1.464 1.465 1.466 1.467 1.468 1.469 1.47 TE 01 HE 11 HE12 HE13 HE 21 HE71 TM 01 EH22 EH31 , EH41 , EH51 , HE42 HE61 HE51 EH21 , HE41 EH 11 , HE 31 TM 02 , TE 02 , HE 22 EH 12 , HE 32 TM03 , TE03 , HE23 β/k0 V Obr. 9: Disperzní relace SI vlákna počítané pro n2 = 1.46 a n1 = 1.47. pokusí optickému vláknu vnutit lineárně polarizované řešení Maxwellových rovnic, což povede ke dvěma výhodám. Řešení by mělo být relativně snadné a umožní jednoduché zacházení s polarizovaným světlem. V kpt. 2.1.2 jsme zjistili, že závislost složek elektrického a magnetického pole na vzdálenosti od osy vlákna popisují Besselovy funkce. Předpokládejme tedy, že vlna polarizovaná ve směru osy y má tvar Ex = 0 Ey =    A Jl(hr) ei(lϕ+ωt−βz) r ≤ a C Kl(qr) ei(lϕ+ωt−βz) r ≥ a (38) Tento předpoklad dosadíme do druhého páru Maxwellových rovnic: iβEy + Ez,y = −iωBx iβBy + Bz,y = 0 Ez,x = iωBy Bz,x + iβBx = −i ωn2 c2 Ey Ey,x = −iωBz By,x − Bx,y = i ωn2 c2 Ez Vzhledem k (37) má normovaná frekvence malou hodnotu a platí β ≫ h, q a Ez ≪ Ey. Členy Ez,y a Ez,x se proto dají zanedbat, což vede k By ≈ 0. 15 V následujícím kroku je třeba derivovat do Maxwellových rovnic dosazený vztah (38) podle x a y. Derivace podle x a y se převedou na derivace podle r a ϕ pomocí definic r2 = x2 + y2 a ϕ = arctg (y/x), ze kterých vyplývají rovnice ∂r ∂x = x r = cos ϕ ∂ϕ ∂x = − y r2 ∂r ∂y = y r = sin ϕ ∂ϕ ∂y = x r2 Dále se využijí vztahy pro Besselovy funkce J′ l = 1 2 (Jl−1 − Jl+1) K′ l = − 1 2 (Kl−1 + Kl+1) l x Jl(x) = 1 2 [Jl−1(x) + Jl+1(x)] l x Kl(x) = 1 2 [−Kl−1(x) + Kl+1(x)] a aproximace ω/β ≈ c/n. Uvedeným postupem získáme řešení (39): r ≤ a r ≥ a Ex = 0 Ex = 0 Ey = A Jl(hr) ei(lϕ+ωt−βz) Ey = C Kl(qr) ei(lϕ+ωt−βz) Ez = hA 2β Jl+1(hr) ei(l+1)ϕ + Ez = qC 2β Kl+1(qr) ei(l+1)ϕ − + Jl−1(hr) ei(l−1)ϕ ei(ωt−βz) − Kl−1(qr) ei(l−1)ϕ ei(ωt−βz) Bx = − Aβ ω Jl(hr) ei(lϕ+ωt−βz) Bx = − Cβ ω Kl(qr) ei(lϕ+ωt−βz) By ≈ 0 By ≈ 0 Bz = − ihA 2ω Jl+1(hr) ei(l+1)ϕ − Bz = − iqC 2ω Kl+1(qr) ei(l+1)ϕ + − Jl−1(hr) ei(l−1)ϕ ei(ωt−βz) + Kl−1(qr) ei(l−1)ϕ ei(ωt−βz) (39) Několik průběhů intenzity elektrického pole Ey počítaných pro V = 8 podle (39) a splňujících podmínku (41) je ukázáno na obr. 10. Stejným postupem dostaneme pro vlnu polarizovanou ve směru osy x řešení (40): 16 0 0.5 1 1.5 −0.5 0 0.5 1 LP 01LP 02 LP 03 LP11 LP12 LP 21 LP 31 r / a E y Obr. 10: Radiální průběh intenzity elektrického pole pro několik lineárně polarizovaných modů. r ≤ a r ≥ a Ex = A Jl(hr) ei(lϕ+ωt−βz) Ex = C Kl(qr) ei(lϕ+ωt−βz) Ey = 0 Ey = 0 Ez = ihA 2β Jl+1(hr) ei(l+1)ϕ − Ez = iqC 2β Kl+1(qr) ei(l+1)ϕ + − Jl−1(hr) ei(l−1)ϕ ei(ωt−βz) + Kl−1(qr) ei(l−1)ϕ ei(ωt−βz) Bx ≈ 0 Bx ≈ 0 By = Aβ ω Jl(hr) ei(lϕ+ωt−βz) By = Cβ ω Kl(qr) ei(lϕ+ωt−βz) Bz = hA 2ω Jl+1(hr) ei(l+1)ϕ + Bz = qC 2ω Kl+1(qr) ei(l+1)ϕ − + Jl−1(hr) ei(l−1)ϕ ei(ωt−βz) − Kl−1(qr) ei(l−1)ϕ ei(ωt−βz) (40) Stejně jako v předchozí kapitole musí i nyní řešení splňovat podmínku spojitosti tečných složek intenzit na rozhraní jádra a pláště vlákna, což vede k rovnicím 17 -10 -5 0 5 10 0 1 2 3 4 5 6 7 8 9 10 ha l=0 1 2 3 Obr. 11: Levá strana rovnice (43) pro řády l = 0 (černě), 1 (červeně), 2 (modře) a 3 (zeleně). -10 -8 -6 -4 -2 0 0 1 2 3 4 5 6 7 8 9 10 qa l=0 1 2 3 Obr. 12: Pravá strana rovnice (43) pro řády l = 0 − 3. A Jl(ha) = C Kl(qa) (41) ha Jl+1(ha) Jl(ha) = qa Kl+1(qa) Kl(qa) (42) ha Jl−1(ha) Jl(ha) = −qa Kl−1(qa) Kl(qa) (43) S pomocí rovnic (112) a (121) lze snadno dokázat, že vztahy (42) a (43) jsou v případě platnosti 41 ekvivalentní a také že z nich spolu s rovnicí (41) vyplývá Ah J′ l(ha) = Cq K′ l(qa), tedy hladkost řešení na hranici jádra a pláště. Hladkost řešení je v souladu s předpokladem (37). Rovnici (43) lze jednoduše řešit graficky. Na obr. 11 je vynesena levá strana této rovnice pro řády 0 – 3 a na obr. 12 její pravá strana. Vzledem k (113) lze lehce ukázat, že levá strana rovnice (43) jde pro ha → 0 k hodnotě 2l. Pomocí (31) je opět možné vynést obě strany rovnice (43) do jednoho grafu, najít průsečíky odpovídající jednotlivým řešením a z jejich pozic určit vlnové číslo β. Ukázka grafického řešení pro l = 0 a normovanou frekvenci V = 8 je zobrazena v grafu 13. Jednotlivá řešení se označují symbolem LPlm, kde m udává, o kolikáté řešení rovnice (43) příslušné danému l jde. Je zřejmé, že řešení odpovídající módu LP01 existuje pro libovolnou hodnotu normované frekvence, zatímco ostatní módy se ve vlákně mohou vyskytnout jen po překročení příslušného cut-off daného vztahem Jl−1(V ) = 0 (44) Vyřešením Maxwellových rovnic v optickém vlákně jsme mimo jiné získali prostorové rozložení intenzity světla ve vlákně. Příklady těchto rozložení, spočítané pro V = 8, jsou pro několik LP módů vyobrazeny na obr. 14 – 19. Prostorová souřadnice [0;0] na obrázcích odpovídá ose vlákna, v jednotkové vzdálenosti od ní se nachází rozhraní jádra a pláště. 18 -10 -5 0 5 10 0 1 2 3 4 5 6 7 8 9 10 ha LP 01 LP 02 LP03 V Obr. 13: Levá (kreslená modře) a pravá (červeně) strana rovnice (43) pro l = 0 a V = 8. Z obrázků je vidět, že zatímco LP módy s l = 0 mají alespoň lokální maximum na ose vlákna, je intenzita záření LP módů s l = 0 na ose vlákna nulová. Kdybychom se chtěli omezit na zjednodušenou představu paprskové optiky, názorně vysvětlíme existenci módů s nulovou intenzitou záření na ose vlákna pomocí tzv. kosých paprsků, viz kpt. 2.3.2. Dále je vidět, že hodnota l úzce souvisí se symetrií řešení vůči úhlu ϕ, zatímco z hodnoty druhého indexu konkrétního LP módu je možné vyčíst počet maxim intenzity na cestě mezi osou vlákna a jeho okrajem. Z řešení získáme také závislost β(V ), tedy disperzní relaci jednotlivých LP módů. Ta je vynesena na obr. 20. Stejně jako v kpt. 2.1.2 lze z grafu disperzní relace vyčíst informace o počtu módů a o jejich grupové i fázové rychlosti. Na první pohled není vidět jasný vztah mezi přesným řešením vlnové rovnice v optickém vlákně, tedy EH a HE módy, a přibližným řešením ve formě LP módů. Počet módů souhlasí, neboť dvě větve rovnice (34) nahradí v případě LP módů dvě možné polarizace. Je nápadné, že disperzní relace módů EHl−1,m a HEl+1,m téměř splývají (zcela splývají v limitě n1 → n2) a že jsou podobné disperzní relaci módu LPl,m. Skutečně lze ukázat, že LPl,m módy jsou lineární kombinací módů EHl−1,m a HEl+1,m. Počet vedených módů v SI vlákně Pro nízké hodnoty normované frekvence V < 2, 405 (tj. menší než první kořen Besselovy rovnice nultého řádu) se vláknem může šířit pouze mód LP01. Vždy když normovaná frekvence překročí nějaký kořen Besselovy funkce, tedy cut-off daný rovnicí (44), může být ve vlákně vybuzen nový vedený mód. Pro malé hodnoty normované frekvence lze počet módů přesně spočítat např. pohledem na graf disperzních relací, pro velké hodnoty V lze použít následující aproximace. Pro velké hodnoty normované frekvence lze využít limity (114), rovnici (44) přepsat 19 Obr. 14: Rozložení intenzity světla v optickém vlákně odpovídající modu LP01. Obr. 15: Rozložení intenzity světla v optickém vlákně odpovídající modu LP03. Obr. 16: Mód LP11. Obr. 17: Mód LP12. Obr. 18: Mód LP22. Obr. 19: Mód LP41. 20 0 2 4 6 8 10 1.46 1.461 1.462 1.463 1.464 1.465 1.466 1.467 1.468 1.469 1.47 LP01 LP02 LP03 LP11 LP12 LP13 LP 21 LP22 LP 31 LP32 LP41 LP51 LP 61 β/k0 V Obr. 20: Disperzní relace lineárně polarizovaných módů v SI vlánkě (počítáno pro n2 = 1.46 a n1 = 1.47). na Vlm − (l − 1)π 2 − π 4 = mπ + π 2 m ∈ Z a po zanedbání π/4 získat podmínku pro cut-off Vlm ≈ lπ 2 + mπ (45) Pro danou normovanou frekvenci V se tedy vláknem mohou šířit všechny módy splňující Vlm ≤ V , tedy módy ležící uvnitř plochy trojúhelníku nakresleného na obr. 21. Protože každému bodu odpovídají dvě řešení pro kladnou a zápornou hodnotu l a dvě různé polarizace, je výsledný počet možných módů přibližně dán výrazem N(V ) ≈ 4 V π 2 (46) Výkon přenášený pláštěm a jádrem Intenzitu světla přenášeného vláknem získáme výpočtem z-ové složky Poyntingova vektoru Sz = 1 2 Re(ExH∗ y − EyH∗ x) (47) což s použitím (39) nebo (40) vede k Sz =    β 2ωµ |A|2 J2 l (hr) r ≤ a β 2ωµ |B|2 K2 l (qr) r ≥ a (48) 21 1 2 3 1 2 3 4 0 m l 2V V π π Obr. 21: Vedené módy splňují podmínku V ≥ lπ/2 + mπ a leží proto uvnitř plochy znázorněného trojúhelníku. Každému bodu odpovídají čtyři módy lišící se polarizací a znaménkem l. Pomocí vztahů pro integraci Besselových funkcí a podmínek (41) – (43) dostaneme pro výkon přenášený jádrem (Pcore), pláštěm (Pclad) a celým vláknem (P) Pcore = 2π 0 dϕ a 0 dr rSz = βa2 π 2ωµ |A|2 J2 l (ha) − Jl−1(ha) Jl+1(ha) (49) Pclad = 2π 0 dϕ ∞ a dr rSz = − βa2 π 2ωµ |A|2 J2 l (ha) + h q 2 Jl−1(ha) Jl+1(ha) (50) P = Pcore + Pclad = − βa2 π 2ωµ |A|2 1 + h2 q2 Jl−1(ha) Jl+1(ha) (51) Názorný je podíl výkonu přenášeného pláštěm Pclad P = 1 V 2 (ha)2 + (qa)2 J2 l (ha) Jl−1(ha) Jl+1(ha) , (52) který je pro množství LP módů vynesen v grafu 22. Je vidět, že se zvyšující se normovanou frekvencí se jednotlivé módy stahují do jádra a že mód nejlépe uzavřený v jádře je LP01. Průběh křivek v grafu 22 souhlasí s výše popsaným chováním fázové rychlosti. Když normovaná frekvence odpovídá cut-off nějakého módu, je tento mód nejvíce veden pláštěm vlákna, a proto jeho fázová rychlost odpovídá materiálu pláště. S růstem normované frekvence se záření daného módu soustřeďuje do jádra, takže i jeho fázová rychlost je stále více ovlivněna materiálem jádra (které má vyšší index lomu než plášť) až v limitě V → ∞ je záření sledovaného módu zcela uzavřeno v jádře a fázová rychlost je určena pouze materiálem jádra. 22 0 2 4 6 8 10 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 LP 01 LP 02 LP 03 LP 11 LP 12 LP 13 LP 21 LP 22 LP 31 LP 32 LP 41 LP 42 LP 51 LP 61 Pclad /P V Obr. 22: Poměr výkonu přenášeného pláštěm a celkového přenášeného výkonu. V praxi se u jednomodových vláken jako měřítko uzavření záření do blízkého okolí osy jádra často uvádí tzv. parametr MFD (mode field diameter, průměr vidového pole). Jedná se o průměr oblasti, ve které je intenzita záření větší nebo rovna 0,135-násobku (tj. 1/e2 ) maximální intenzity záření (na ose vlákna). 2.2 Útlum záření v optických vláknech Tato kapitola se zabývá útlumem záření v křemenných vláknech, protože pouze ta jsou dnes používána při dálkové optické komunikaci. Spektrální závislost útlumu v křemenném vlákně ukazuje obr. 23. Útlum je způsoben absorpcí a rozptylem. 2.2.1 Absorpční ztráty K pohlcování záření vedeného optickým vláknem dochází díky absorpci v křemenném skle i vlivem příměsí. Protože na dálkových přenosech se používá především infračervené záření, nemá ultrafialový absorpční pás SiO2 na přenos záření prakticky žádný vliv. Výrazným omezujícím faktorem je ale absorpce křemenem v infračervené oblasti, která se začíná výrazně projevovat při vlnových délkách nad 1,6 µm. Důvodem, proč do r. 1970 nebylo prakticky možné optická vlákna používat, je výrazná absorpce příměsemi. Např. jen 1 ppm iontů Fe2+ způsobuje na vlnové délce svého absorpčního píku 1,1 µm útlum 0,68 dB/km nebo 1 ppm iontů Cu2+ na 850 nm útlum 1,1 dB/km. Při výrobě opt. vláken je proto nutné vyloučit kontaminaci materiálu vlákna absorbujícími příměsemi. 23 λ [µ1 1.5 1 10 0.1 útlum[dB/km] RS UV IR m] Obr. 23: Náčrtek spektrální závislosti útlumu záření v křemenném vlákně. RS označuje Rayleigho rozptyl, UV ultrafialový absorpční pás, IR infračervený absorpční pás. Další problematickou látkou je voda, které je poměrně obtížné zabránit ve vniknutí do vláken, ať už při výrobě nebo během používání vlákna. Voda vždy obsahuje aniont OH− , který má absorpční píky m.j. na vlnových délkách 1,38 µm a 1,24 µm, které jsou při koncentraci 1 ppm zodpovědné za útlum 4,0 dB/km a 2,0 dB/km, respectively. Pro vlnové délky v blízkosti IČ absorpčního pásu tak zůstávají v křemenných vláknech pouze dvě vysoce propustná spektrální okna, a to kolem vlnových délek 1,55 a 1,3 µm. Na vlnové délce 1,55 µm se dosahuje útlumu pod 0,2 dB/km, který je způsoben zejména rozptylem záření. 2.2.2 Zářivé ztráty Za rozptyl záření v optických vláknech je zodpovědný zejména Rayleigho rozptyl, tedy rozptyl na nehomogenitách s rozměry menšími než je vlnová délka světla. Tentýž jev způsobuje např. modré zbarvení oblohy. Útlum daný Rayleigho rozptylem (αR) klesá se čtvrtou mocninou vlnové délky αR(λ) = αR(λ0) λ0 λ 4 , (53) pro křemenná vlákna dosahuje na 1,55 µm hodnoty 0,15 dB/km a v druhém absorpčním okně na 1,3 µm hodnoty 0,31 dB/km. Kvůli Rayleigho rozptylu je snaha vyvinout optická vlákna z materiálů, které by měly hranu IČ absorpčního pásu posunutou do vyšších vlnových délek. Jsou proto zkoumána fluoridová skla, která absorbují až kolem 50 µm. Posun vlnové délky procházejícího záření nad 2 µm by totiž potlačením Rayleighova rozptylu snížil útlum ve vláknech na hodnoty pod 0,01 dB/km a umožnil tak konstruovat optické 24 trasy se zesilovači po více než 1000 km. K rozptylu přispívají i příměsi používané k nastavení správného indexu lomu skla (např. GeO2, P2O5). Jednomodová vlákna tak mají menší útlum než vlákna mnohomodová nejenom díky nejkratší dráze, kterou v nich paprsek musí projít, ale také díky nízkému dopování jádra příměsemi. (Index lomu jádra jednomodového vlákna totiž nesmí být o mnoho větší než index lomu pláště, aby normovaná frekvence byla dostatečně nízká a vláknem se mohl šířit pouze jeden mód.) Stojí za zmínku, že jednotlivé módy ve vícemodovém vlákně se liší i svojí hodnotou útlumu. K vyzařování z vlákna dochází také vlivem nedokonalostí vlákna, např. geometrickými nepřesnostmi rozhraní jádra a pláště, ať už pocházejícími z výroby nebo vyvolanými vnějším tlakem. Zdrojem ztrát jsou dále spoje vláken a ohyby vláken. 2.2.3 Zesilovače záření Při přenosu záření optickými vlákny na vzdálenosti větší než přibližně 100 km je nutné utlumené záření zesílit. Nejstarší možností je použít tzv. opakovač – přeměnit optický signál na elektrický a do navazujícího úseku optického kabelu poslat nový, zesílený optický signál. Výhodou opakovačů je, že jednoduše umožňují opravit tvar pulzů a odstranit tak vliv disperze. Mezi jejich zásadní nevýhody patří např. nemožnost zesilovat jedním opakovačem více kanálů WDM (vlnových délek) zároveň. Elegantnější řešení útlumu nabízejí zesilovače, při kterých signál nemusí být vůbec vyvázán z optického vlákna. Takovými zesilovači jsou v první řadě vlákna dopovaná prvky vzácných zemin, zejména erbiem (EDFA, erbium-doped fiber amplifiers), které umožňuje zesilovat záření s vlnovýmí délkami blízkými 1550 nm, příp. ytterbiem, praseodymem, thuliem nebo jinými prvky. Princip EDFA spočívá ve stimulované emisi excitovaných iontů Er3+ vyvolané procházejícím signálem. Ionty Er3+ jsou do excitovaného stavu vybuzené absorpcí záření s vlnovou délkou 980 nm nebo 1480 nm. To je do vlákna ze zdroje (laserové diody) přivedeno pomocí vhodného vazebního členu, který naváže čerpací záření do vlákna, jímž prochází zesilovaný signál, ale nevyváže z něj signály na vlnové délce kolem 1550 nm. EDFA zesilují záření mezi 1525 a 1570 nm s maximálním ziskem na vlnové délce blízké 1530 nm. Druhou možností, jak optický signál zesílit přímo ve vlákně, je využít stimulovaného Ramanova rozptylu. Do vlákna je opět navázáno čerpací záření s vlnovou délkou menší než je vlnová délka zesilovaného signálu. Při stimulovaném Ramanově rozptylu odevzdá foton čerpacího záření část své energie materiálu vlákna ve formě fononu a zbytek energie si odnáší nový foton, jenž je ve stejném stavu jako záření zesilovaného signálu, které stimulovaný rozptyl podnítilo. K zesílení optického signálu lze použít také stimulovanou emisi záření v polovodičové diodě, podobně jako v polovodičových laserech. Polovodiče běžně zesilují záření ve spektrálním rozsahu 850 až 1600 nm, ale kvůli množství šumu, malému zisku a značné nelinearitě se na dálkových datových linkách nepoužívají. 25 n2 n1 1< n φ α jádro plášt’ Obr. 24: Trajektorie meridiánových paprsků v SI vlákně. Zeleně označený paprsek se na rozhraní jádra a pláště láme a je rychle vyzářen ven z vlákna, červeně označený paprsek se totálně odráží a je vláknem veden. sin φ se nazývá numerická apertura vlákna. 2.3 Paprsková optika 2.3.1 Numerická apertura Zobrazením dráhy paprsků v optickém vlákně získáme důležitou veličinu nazývanou numerická apertura vlákna, běžně označovanou NA. Jde o sinus maximálního úhlu, pod kterým mohou paprsky dopadnout na vstup vlákna, aby ještě došlo na rozhraní jádra a pláště k totálnímu odrazu (viz obr. 24) a aby tedy paprsky byly vláknem vedeny. Numerická apertura proto označuje, z jak velké oblasti je vlákno schopné přijímat záření. Hodnotu numerické aperture lze jednoduše spočítat. Maximální úhel dopadu paprsku na rozhraní jádra a pláště, pro který ještě dojde k totálnímu odrazu, je α = arcsin n2 n1 (54) Odpovídající vstupní úhel φ spočítáme ze Snellova zákona sin φ = n1 sin π 2 − α = n1 cos α a s pomocí n1 sin α = n2 dostáváme pro hodnotu numerické apertury NA = sin φ = n2 1 − n2 2, (55) tedy výraz, který už vystupoval v definici normované frekvence (30) a na kterém mimo jiné závisí počet vedených módů. 2.3.2 Klasifikace paprsků Paprsky v optickém vlákně můžeme rozdělit na ty, které se na rozhraní jádro – plášť lámou a jsou z vlákna rychle vyzářeny, a na vedené paprsky. Třetí speciální kapitolu představuje záření, které z jádra uniká tunelováním, jež je umožněno buď přítomností blízkého prostředí s indexem lomu větším než je index lomu pláště (např. blízký světlovod), nebo ohybem vlákna. Dráha, kterou tunelující se záření urazí uvnitř vlákna než je vyvázáno ven, může nabývat velmi různých hodnot, pouze několik milimetrů nebo i kilometrové vzdálenosti. Další dělení paprsků je založeno na tom, zda paprsek prochází osou vlákna: 26 Obr. 25: Průmět trajektorie meridiánového (červeně) a kosého (modře) paprsku v SI vlákně do roviny xy. Černý kruh označuje hranici jádra a pláště. min rmax r Obr. 26: Průmět trajektorie kosých paprsků v obecném gradientním (modrá křivka) a parabolickém (zelená elipsa) vlákně do roviny xy. 1. Meridiánové paprsky jsou ty, které během letu vláknem pravidelně protínají jeho osu. Jde-li o vedené paprsky, pak v cylindricky symetrickém vlákně je průmětem jejich dráhy do roviny xy úsečka. Tato úsečka končí v SI vláknech na rozhraní jádra a pláště. V gradientních vláknech, kde index lomu vlákna není konstantní (obr. 1), končí uvnitř jádra ve vzdálenosti od osy dané hodnotou invariantu I1 (kpt. 2.3.3). Speciálním případem gradientních vláken jsou tzv. parabolická vlákna (kpt. 2.4.1). Lze ukázat, že trajektorie meridiánového paprsku je v nich popsaná rovnicí r(z) ∝ cos NA aI1 (z − z1) 2. Kosé (mimoosé) paprsky naopak nikde osu vlákna neprotínají, jejich vzdálenost od osy osciluje mezi danou minimální a maximální hodnotou. Narozdíl od meridiánových paprsků je invariant I2 (kpt. 2.3.3) kosých paprsků nenulový. Průmět trajektorie kosých paprsků do roviny xy je nakreslen na obr. 25 a 26. Kosé paprsky názorně zdůvodňují existenci modů s nulovou intenzitou na ose vlákna. V parabolických vláknech má průmět trajektorie do roviny xy tvar elipsy. Speciálními případy elipsy jsou úsečka protínající osu jádra, která odpovídá meridiánovému paprsku, a kružnice odpovídající paprsku pohybujícímu se po šroubovici s konstantním poloměrem. Závislost r(z) popisující trajektorii paprsku v parabolickém vlákně má tvar r2 = C1 + C2 cos 2 NA aI1 (z − z1) C2 ≤ C1 (56) Případ C1 = C2 odpovídá meridiánovému paprsku, případ C2 = 0 popisuje zmíněnou šroubovici s konstantním poloměrem. 27 2.3.3 Invarianty šíření paprsku v optickém vlákně Z válcové symetrie optického vlákna vyplývá existence dvou invariantů, tedy veličin, které se během letu paprsku vláknem zachovávají. První invariant I1 lze jednoduše odvodit z paprskové rovnice ve tvaru (127). Protože index lomu se ve směru osy z nemění, platí d ds n dz ds = 0 n dz ds = konst. Označíme-li úhel mezi vlnovým vektorem a osou vlákna ϑ, získáme tvar prvního invariantu I1 = n cos ϑ (57) Je logické, že mezi invariantem I1 a vlnovým číslem β je úzký vztah β = k0I1, (58) neboť vlnové číslo je také invariantem řešení Maxwellových rovnic ve vlákně (4). Druhý invariant I2 můžeme odvodit podobným způsobem, jakým je v kpt. 5.3 odvozena paprsková rovnice. Vyjádříme veličinu L definovanou výrazem (125) v cylindrických souřadnicích L = n 1 + ˙r2 + (r ˙ϕ)2, kde ˙r = dr dz a ˙ϕ = dϕ dz , a v rovnici analogické vztahu (126) využijeme válcové symetrie vlákna (∂n/∂ϕ = 0): d dz ∂L ∂ ˙ϕ = 0 nr2 ˙ϕ 1 + ˙r2 + (r ˙ϕ)2 = konst. Protože ds/dz = 1 + ˙r2 + (r ˙ϕ)2, upravíme na I1r2 ˙ϕ = konst. (59) a aby i druhý invariant byl bezrozměrný, definujeme v souladu s literaturou I2 = I1 r2 a dϕ dz . (60) Pro meridiánové paprsky je I2 = 0. Existence invariantních výrazů pomůže spočítat trajektorii paprsku v optickém vlákně. Protože I1 = n(r) 1 + ˙r2 + (r ˙ϕ)2 28 Obr. 27: Trajektorie paprsků v SI vlákně. Zeleně označený paprsek musí překonat delší dráhu než červeně označený paprsek. Obr. 28: Trajektorie paprsků v gradientním vlákně. Zeleně označený paprsek se pohybuje v prostředí s nižším indexem lomu. získáme diferenciální rovnici ˙r = ± √ f I1 (61) f ≡ n2 (r) − I2 1 − I2 2 a r 2 jejímž řešením je kýžená závislost r(z). V následujícím kroku je možné řešením diferenciální rovnice ˙ϕ = aI2 r2I1 (62) získat závislost ϕ na r nebo z. Trpěliví matematikofilové mohou uvedené rovnice aplikovat na parabolické vlákno a odvodit závěry popsané v kpt. 2.3.2. 2.4 Disperze v optických vláknech Disperze, neboli rozšiřování pulzů posílaných optickým vláknem, má spolu s útlumem zásadní omezující vliv na rychlost přenosu dat. Disperze má v optických vláknech několik příčin: modová disperze (která je nejvýraznější), materiálová, vlnovodová, polarizační a nelineární disperze. 2.4.1 Modová disperze, gradientní vlákna Šíří-li se světelný pulz vícemodovým vláknem, rozdělí se jeho energie do několika modů, z nichž každý má svoji grupovou rychlost. Na výstupu vlákna délky L tak dojde k rozšíření krátkého pulzu na dobu L/vmin − L/vmax, kde vmin je grupová rychlost nejpomalejšího a vmax nejrychlejšího módu. Rozdílná grupová rychlost je přirozená, protože módy se liší hodnotou vlnového čísla β, tj. i úhlem, který jejich paprsky svírají s osou z a paprsky různých módů tak musí ve vlákně překonat odlišné vzdálenosti (viz obr. 27). Důmyslný způsob jak minimalizovat modovou disperzi představují tzv. gradientní vlákna, tedy vlákna ve kterých dochází ke spojitému poklesu indexu lomu n(r) v jádře. Příklad profilu indexu lomu gradientního vlákna je na obr. 1. I v gradientních vláknech sice paprsky s nižší hodnotou vlnového čísla β (tj. svírající s osou vlákna větší úhel ϑ) musí překonat delší dráhu, zato ale pronikají do oblasti s menším indexem lomu a pohybují se 29 proto větší rychlostí. Optimální profil indexu lomu proto minimalizuje modovou disperzi mnohomodvých vláken. Spočítat hodnotu modové disperze ve vláknech s velkou hodnotou normované frekvence lze pomocí paprskové optiky. Čas, který paprsek potřebuje k uražení vzdálenosti dz je dt = n dz c cos ϑ = n2 dz cI1 (63) Většinu běžných profilů indexu lomu jádra lze přibližně popsat výrazem n2 = n2 1 1 − 2∆n r a q pro r ≤ a (64) ∆n = n2 1 − n2 2 2n2 1 ≈ n1 − n2 n1 (65) kde n1 je maximální index lomu na ose vlákna, n2 index lomu pláště a q parametr popisující tvar profilu. Hodnota q = ∞ odpovídá profilu SI vlákna, vlákno s q = 2 se nazývá parabolické. Po dosazení (64) do (63) získáme t = n2 1 cI1 L − 2∆nn2 1 cI1 L 0 r a q dz Výraz n2 1L/(cI1) označuje čas, za který by paprsek proletěl vlákno s konstantním indexem lomu n1. Jak je spočítáno v dodatku 5.4, platí pro integrál L 0 r a q dz = n2 1 − I2 1 n2 1∆n(q + 2) L Pro čas, který paprsek charakterizovaný invariantem I1 potřebuje k překonání délky L gradientního vlákna s profilem popsaným parametrem q, dostáváme t = n2 1 cI1 − 2(n2 1 − I2 1 ) c (q + 2)I1 L = n2 1q c (q + 2) 1 I1 + 2 c (q + 2) I1 L (66) Tento výsledek je nezávislý na hodnotě invariantu I2. Závislost (66) je pro několik hodnot q nakreslena na obr. 29. Pro vedené paprsky I1 ∈ 0, disperzní koeficient je zde proto 32 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 −30 −20 −10 0 10 20 30 40 λ [µm] D[ps/km.nm] mat. vlnov. chrom. Obr. 32: Koeficient materiálové (zeleně), vlnovodové (modře) a výsledné chromatické (červeně) disperze pro SI vlákno používané na 1,3 µm (n1 = 1.4508, n2 = 1.4469, a = 4.1 µm). 1.1 1.2 1.3 1.4 1.5 1.6 1.7 −70 −60 −50 −40 −30 −20 −10 0 10 20 30 λ [µm] D[ps/km.nm] CSF DSF DCF DFF Obr. 33: Závislost koeficientu disperze na vlnové délce pro vlákna CSF (červeně), DSF (modře), DCF (černě) a DFF (ze- leně). záporný. (Na obr. 9 je na ose y vynesen poměr β/k0, tedy ne samotné vlnové číslo β, což může vést k dojmu, že disperzní koeficient je záporný jen pro velmi malé hodnoty V . Ve skutečnosti je koeficient vlnovodové disperze modu HE11 záporný přibližně až do hodnoty V = 3.) Disperzní relace optického vlákna a tím i jeho vlnovodová disperze závisí na profilu indexu lomu vlákna. Jak bude ukázáno v následující kapitolce, lze změnou závislosti n(r) výhodně měnit velikost vlnovodové disperze. 2.4.4 Chromatická disperze – společný vliv materiálové a vlnovodové dis- perze Protože materiálová i vlnovodová disperze závisí na spektrální šířce optického pulzu, nazývá se jejich společný vliv chromatická disperze. Její koeficient v SI vlákně je vynesen do grafu 32. Je vidět, že pro vlnovou délku přibližně 1,3 µm je materiálová disperze kompenzována vlnovodovou a celkový koeficient chromatické disperze je nulový. Na této vlnové délce optická vlákna vykazují zároveň velmi malý útlum, což vysvětluje velkou oblibu jednomodových SI vláken v minulosti. Později bylo změnou velikosti a profilu indexu lomu (obr. 34) dosaženo takového zvětšení vlnovodové disperze, že se vlnová délka nulového koeficientu chromatické disperze posunula na 1,55 µm, tedy do nejhlubšího minima útlumu křemenných vláken. Takováto vlákna se označují vlákna s posunutou disperzí nebo DSF (dispersion-shifted fibers) a jsou používána v současnosti. V době, kdy se zavedla DSF a s nimi zdroje i detektory pracující na vlnové délce 33 Obr. 34: Schémata profilů indexu lomu pro SI vlákno, vlákno s posunutou disperzí, disperzi kompenzující vlákno a vlákno s vyhlazenou disperzí. 1,55 µm, fungovaly po světě desítky milionů kilometrů „konvenčních“ jednomodových SI vláken (CSF, conventional single-mode fibers) optimalizovaných pro 1,3 µm, která ovšem na 1,55 µm vykazovala velkou disperzi. Extrémním zvýšením vlnovodové disperze byla proto vyvinuta tzv. disperzi kompenzující vlákna (DCF, dispersion compensating fibers) s velkou zápornou hodnotou koeficientu chromatické disperze pro vlnovou délku 1,55 µm. Zapojením relativně krátkého (stovky metrů až kilometry) úseku DCF za optickou trasu tvořenou jednomodovým SI vláknem, jehož koeficient chromatické disperze je na 1,55 µm kladný, bylo možné kompenzovat disperzi ve stávající trase bez drahého vyměňování původního vlákna a používat ji na vlnové délce 1,55 µm. Zbývá zmínit tzv. vlákna s vyhlazenou disperzí (DFF, dispersion flattened fibers), která dosahují téměř nulové chromatické disperze na obou používaných vlnových délkách, 1,3 i 1,55 µm. Závislost koeficientu chromatické disperze pro CSF, DSF, DCF i DFF je ukázaná v grafu 33, profily indexu lomu těchto vláken jsou schematicky zobrazeny na obr. 34. 2.4.5 Polarizační disperze V jednomodových vláknech se při přenosu na velké vzdálenosti může projevit i rozdílná rychlost záření s opačnou polarizací způsobená nedokonalou kruhovou symetrií vlákna. 2.4.6 Nelineární disperze Velká intenzita světla ve vlákně může vést k nelineárním jevům, při kterých např. index lomu je funkcí intenzity světla. Nelineární jevy opět vedou k disperzi a v případě WDM k nežádoucím jevům jako je čtyřvlnné směšování. Na druhé straně ale mohou být využity ke kompenzaci chromatické disperze. Vzniknou tak solitony šířící se vláknem prakticky beze změny svého tvaru (např. i na vzdálenosti stovky Gm). 2.4.7 Šířka pásma a další veličiny popisující disperzi Funkce impulzové odezvy je odezvou optického vlákna na vstupní pulz ve tvaru delta funkce (viz obr. 35). Šířku funkce impulzové odezvy můžeme nazývat časová odezva vlákna. Ta udává nejkratší možný časový rozestup mezi dvěma pulzy, které se po průletu vláknem nepřekryjí. Fourierovou transformací funkce impulzové odezvy je přenosová funkce. Její absolutní hodnota má názorný význam: Pokud frekvencí fM modulujeme intenzitu světla 34 t I I(t) časová odezva funkce impulzové odezvy I t δ(t) Obr. 35: Funkce impulzové odezvy je časový průběh intenzity světla na výstupu vlákna, do kterého vstoupil pulz ve tvaru delta funkce. I M1 M2I I I t t fM M2I IM1 Přenosová funkce Šířka pásma Obr. 36: Přenosová funkce. vstupujícího do optického vlákna, dojde ve vlákně k poklesu amplitudy této modulace z hodnoty IM1 na hodnotu IM2. Závislost poměru IM2/IM1 na fM je absolutní hodnotou přenosové funkce (obr. 36). Hodnota přenosové funkce pro fM = 0 udává útlum (nemodulovaného) záření s konstantní intenzitou. Šířka přenášeného frekvenčního pásma je maximální frekvence, kterou je možné modulovat intenzitu vstupního signálu aniž by ve vlákně došlo k výraznému snížení amplitudy modulace. Šířka pásma je tedy hodnotou modulační frekvence, při které dojde k výraznému poklesu přenosové funkce (obr. 36). Šířka pásma je nepřímo úměrná časové odezvě. Když se neuplatní mezimodová vazba, je také nepřímo úměrná délce vlákna. Běžně se proto udává šířka pásma vlákna dlouhého 1 km v jednotkách Hz.km. 2.5 Typy optických vláken 2.5.1 Jednomodová (jednovidová) křemenná vlákna Protože pro danou vlnovou délku musí mít normovanou frekvenci menší než je cut-off druhého nejnižšího módu, mají malý průměr jádra (4 – 10 µm) a malý rozdíl indexu lomu jádra a pláště. Typický průměr pláště jednovidového vlákna je 125 µm, průměr primární ochrany (kpt. 2.6) 250 µm, běžná hodnota numerické apertury je např. 0,13. Šířka pásma jednomodových vláken mívá hodnotu stovky GHz.km. Jednomodová vlákna mají nejmenší disperzi, nejmenší útlum (lze dosáhnout 0,16 dB/km) a nedochází v nich k modovému šumu. Jejich nevýhody pramení z malé numerické apertury, díky které se 35 záření do jednomodového vlákna navazuje relativně obtížně, což např. komplikuje výrobu konektorů. Zdroje světla pro aplikace s jednomodovými vlákny většinou musí být lasery. Pod mezní vlnovou délkou se z nich stávají vlákna vícemodová. Většinu jednomodových vláken můžeme dělit podle závislosti disperzního koeficientu na vlnové délce (kpt. 2.4.4) na • konvenční vlákna (označovaná CSF nebo NDSF) se skokovou změnou indexu lomu a minimální disperzí na vlnové délce přibližně 1,31 µm • vlákna s posunutou disperzí (DSF), ve kterých je díky vhodnému gradientu indexu lomu jádra minimum disperze posunuto na 1,55 µm • disperzi kompenzující vlákna (DCF) s extrémní vlnovodovou disperzí. Protože na vlnové délce 1,55 µm mají velký záporný disperzní koeficient, používají se na této vlnové délce ke kompenzaci disperze v CSF. • vlákna s vyhlazenou disperzí (DFF) s nízkou disperzí na obou častých vlnových délkách, 1,3 i 1,55 µm. Jednomodová vlákna dále můžeme dělit podle profilu indexu lomu pláště na • vlákna s přizpůsobeným indexem lomu (matched clad), která mají konstantní index lomu v celém plášti (např. první vlákno na obr. 34) • vlákna s vnořeným indexem lomu (depressed clad). Index lomu pláště je těsně u jádra snížený, což m. j. snižuje útlum způsobený mikroohyby a pod. (např. druhé vlákno na obr. 34). Zvláštním typem jsou vlákna udržující polarizaci (polarization maintaining fibers, PM). V běžném kruhově symetrickém vlákně dochází vlivem nedokonalostí (např. dvojlom způsobený vnějším tlakem) k přenosu energie mezi oběma možnými polarizacemi záření. Protože některé aplikace vyžadují lineárně polarizované světlo, byla vytvořena PM vlákna, kde je změně polarizace záření zabráněno dostatečně velkým rozdílem mezi rychlostmi, kterými se opačně polarizované módy šíří. Rozdílných rychlostí různě polarizovaného záření je dosaženo buď eliptickým profilem jádra nebo dvojlomem způsobeným tlakem ve vlákně. Např. ve vlákně označovaném „panda“ je tlak způsoben oblastmi s B2O3 vnořenými do pláště. 2.5.2 Mnohomodová (mnohovidová) vlákna Díky většímu průměru jádra a větší numerické apertuře mohou přenášet větší výkony a je jednodušší do nich světlo navázat. Jejich podstatnou nevýhodou je např. velká disperze. 1. Gradientní křemenná vlákna. Díky parabolickému profilu indexu lomu je v nich minimalizován vliv modové disperze (kpt. 2.4.1). Běžné hodnoty parametrů gradientních vláken se pohybují kolem následujících hodnot: průměr jádra 50 µm, šířka 36 pásma 1 GHz.km, numerická apertura 0,2, útlum 0,8 – 5 dB/km. Pro počet módů v parabolickém vlákně platí N(V ) ≈ V 2 4 (76) tedy méně než v SI vláknech. Všechna následující mnohomodová vlákna patří mezi SI vlákna. 2. Křemenná vlákna se skokovou změnou indexu lomu. Průměr jádra se pohybuje od 50 µm do 2 mm, šířka pásma v desítkách MHz.km, numerická apertura okolo hodnoty 0,25, útlum mezi 5 a 10 dB/km. 3. Vlákna s křemenným jádrem a pláštěm z jiného materiálu. Patří sem vlákna HCPS (hard plastic clad silica označovaná také HCS – hard clad silica) s pláštěm z tvrdého polymeru a vlákna PCS (plastic clad silica) s pláštěm ze silikonové pryskyřice. Útlum těchto vláken záleží na materiálu pláště, obsahu vody a vlnové délce procházejícího světla, dosahuje hodnot i pod 10 dB/km. Průměr jádra bývá mezi 200 µm a 2 mm, plášť je většinou ve srovnání s jádrem tenký. 4. Polymerová vlákna POF (plastic optical fiber) s jádrem i pláštěm z plastu, která mají útlum ve stovkách dB/km s minimem na 500 – 650 nm. Průměr jádra se pohybuje okolo milimetru. 5. Vlákna z halogenidů stříbra (AgCl, AgBr) pro vlnové délky 4 – 18 µm. Označují se PIR (polycrystalline infrared) a jejich minimální útlum jsou stovky dB/km. Do jejich spektrální oblasti spadá záření CO a CO2 laseru, pyrometrické a další IR aplikace. 6. Spektrální mezeru mezi křemennými a PIR vlákny přemosťují vlákna z chalkogenidových skel (zejména As2S3) označovaná CIR (chalcogenide infrared). Přenášejí záření vlnových délek 2 – 6 µm s útlumem stovky dB/km. Do této oblasti spektra spadá např. záření Er:YAG laseru a, podobně jako v případě PIR vláken, množství aplikací IČ. 7. Kapilární vlákna, kde jádro vlákna může být tvořeno kapalinou, příp. plynem nebo i kapalným krystalem. Patří sem i vlákna, kde dutina uvnitř vlákna má menší index lomu než plášť a jako prostředí s vysokým indexem lomu slouží vnitřní vrstva kapiláry. 8. Pro úplnost opustíme oblast optických vláken a zmíníme vlnovody, kde k odrazu elektromagnetického záření dochází na vodivém prostředí stěny vlnovodu. Ty ovšem mívají centimetrové až decimetrové rozměry a slouží především k vedení mikrovln. Narozdíl od optických vláken zde např. nad kritickou vlnovou délkou neexistuje žádný vedený mód. Také světlovody užívané ve stavebnictví jsou roury s vysoce odrazivým vnitřním povrchem, to už je ale úlet do zcela jiného oboru. 37 2.6 Optické kabely Aby bylo optické vlákno chráněno před vnějšími vlivy, umísťuje se do různých typů opt. kabelů. Vlákno se už při výrobě pokrývá polymerní (lakovou) vrstvou tzv. primární ochrany s vnějším průměrem např. 250 µm. Takto kryté vlákno se většinou umísťuje do další „sekundární ochrany“, která může mít tři podoby: • Těsná – jde o vrstvu nanesenou přímo na primární ochranu • Volná – je tvořená dutou trubičkou, ve které se vlákno může volně pohybovat. Volná sekundární ochrana způsobuje méně mikroohybů vlákna než těsná. • Plněná – jde v podstatě o volnou sekundární ochranu, ale trubička je vyplněna speciálním gelem nebo olejem, který vlákno chrání před pronikáním vlhkosti. Kromě optických vláken s primární a sekundární ochranou může optický kabel obsahovat zejména • tahové a vyztužovací prvky (ocel, kevlar . . . ) • vnější plášť (z polyetylénu vysoké hustoty, PVC, příp. z jiných materiálů) • gel – tvoří ochranu proti vlhkosti, omezuje tření při výrobě kabelů, rozkládá namáhání vlákna na větší plochu • navinutou pásku chránící kabel proti pronikání vlhkosti • ocelový plášť proti hlodavcům Optické kabely se mohou dělit podle typu vláken (jednomodové, mnohomodové, hybridní), typu sekundární ochrany (těsná, volná, plněná), počtu vláken a jejich geometrického uspořádání (simplex, duplex, vícevláknový kabel s kruhovou geometrií, vícevláknový páskový kabel), určení kabelu (venkovní, vnitřní, univerzální, podmořský . . . ), umístění tahového prvku (uprostřed kabelu, vně vláken) a pod. 2.7 Spojování optických vláken Spoje optických vláken můžeme dělit na trvalé, podmínečně rozebíratelné a konektory. Mezi trvalé spojování vláken patří především svařování, které je nejdokonalejším druhem spoje a umožňuje nejmenší ztráty (0,01 dB). Svařuje se elektrickým obloukem, příp. speciálním mikrohořákem nebo laserem a je nutná vysoká přesnost (µm). Mezi trvalé spoje patří také lepené spoje a zalepení vláken do společné kalibrované trubičky. K podmínečně rozebíratelným spojům počítáme takové mechanické spojky, které sice nejsou určeny k rozpojování, lze je ale rozebrat bez poškození. Jde zejména o tzv. Vdrážku, dalším příkladem je kalibrovaná kapilára, ve které jsou konce obou vláken vratně upevněny. Ztráty (odrazy) ve spoji se sníží, když se mezera mezi vlákny vyplní látkou s vhodným indexem lomu, např. silikonovou kapalinou nebo u lepených trvalých spojů epoxidovým lepidlem. 38 Rozebíratelných spojů, tedy konektorů optických vláken, existuje řada typů. Hledí se nejenom na to, aby konektor vnášel do optické trasy co nejmenší útlum, ale také aby se útlum opakovaným rozebíráním a spojováním konektoru nezvyšoval a aby útlum zpětného odrazu byl co nejvyšší (což lze zajistit např. zkosením čelních stran obou vláken). Čela vláken se ovšem nesmí dotýkat, protože by se při rozpojování a spojování mohla poškrábat. Trubičky, které v mnoha konektorech drží zasunuté vlákno ve správné poloze, se nazývají ferule. Do některých ferulí jsou vloženy spojky, z nichž první přemění rozbíhavý svazek paprsků z vlákna na rovnoběžný a druhá jej soustřeďuje do navazujícího vlákna. Spoje, zejména konektory, vnášejí do optické trasy útlum záření. Ten může být způsoben rozdílnými parametry vláken (průměr jádra, numerická apertura, profil indexu lomu), odrazem na čelních plochách vláken a špatnou vzájemnou polohou vláken. Může se totiž stát, že osy vláken ve spoji jsou vzájemně posunuté, svírají nenulový úhel nebo že jsou čela vláken od sebe vzdálena a část světla unikne do mezery mezi vlákny. Nerovnosti čelních ploch jsou také zdrojem útlumu ve spoji. 2.8 Výroba optických vláken Výroba křemenného optického vlákna je složena ze dvou základních kroků: vytvoření několik centimetrů až několik decimetrů široké válcové preformy a jejího tažení do tenkého optického vlákna. Preforma je vytvořena z velmi čistého oxidu křemičitého dopovaného dalšími látkami (např. GeO2), které upravují index lomu křemenného skla. Křemík a žádoucí příměsi se do výrobního procesu většinou dodávají ve formě plynných chloridů (SiCl4, GeCl4. . . ), které za vysoké teploty (např. 1600 ◦ C) vytvářené vodíkovým plamenem reagují s kyslíkem na oxidové saze. Z těchto sazí po jejich usazení a následném stavení do kompaktního skla roste vyráběné preforma. Nejběžnější jsou tři varianty depozice preformy: Při první se sklo deponuje zevnitř křemenné trubice, kterou postupně vyplňuje. V druhém případě se sklo deponuje z vnějšku na kovovou tyč, která se pak při ochlazení hotové preformy od skla oddělí (díky větší tepelné roztažnosti) a vytáhne. Třetí možností je zajistit růst preformy depozicí oxidů na jejím konci. Při tažení optického vlákna se konec preformy zahřeje na téměř 2000 ◦ C (kyslíkovodíkovým plamenem nebo indukční pecí). Za takovéto teploty je křemen vysoce viskózní kapalinou a může být tažen gravitací – vlastní vahou taženého vlákna. Takovéto tažení většinou probíhá v místnosti vysoké několik pater. Blízko pod preformou bývá laserový měřič tloušťky vlákna, který řídí rychlost tažení. Hned ve věži je na tažené vlákno nanesena a UV zářením vytvrzena primární ochrana. Vlákno se pak přes tažné kladky navíjí na cívku. 39 nB nA n (x)1 Obr. 37: Možný profil indexu lomu rovinného dielektrického světlovodu. x y z L L 2 2 Obr. 38: Volba souřadnicové soustavy v rovinném světlovodu. 3 Rovinné světlovody 3.1 Úvod Pomocí totálního odrazu je možné světlo uzavřít také do tenké rovinné destičky nebo pravoúhlého kanálku, tzv. rovinných světlovodů, s indexem lomu vyšším než je index lomu jejich okolí. Světlovodná vrstva je lehce přístupná a tak lze na jednom rovinném světlovodu realizovat velké množství optických operací, jako jsou generování a detekce světla, jeho modulace a zesilování, spínání a přepínání, rozbočování a slučování, (de)multiplexování, polarizace nebo otáčení polarizace, filtrování určité vlnové délky atd. Podložka s takovým světlovodem se v analogii s mikroelektronikou nazývá čip a obor zabývající se touto částí optoelektroniky se označuje integrovaná optika. Počet optických zařízení na určité ploše čipu je ovšem omezen relativně velkou vlnovou délkou světla. Prvky integrované optiky bývají tvořeny v různých materiálech. Křemenné sklo nabízí nízký útlum a snadné napojení na optická vlákna, LiNbO3 je výhodný díky svým elektrooptickým a akustooptickým vlastnostem, přímé polovodiče z prvků skupin III A a V A (např. GaAs, InP) lze dobře využít pro generování a detekci světla a křemík se svým vysokým indexem lomu (okolo 3,5) a propustností pro IČ záření (nad 1,1 µm) je vhodný pro spojení integrované optiky a elektroniky. 3.2 Elektromagnetické pole v rovinném světlovodu Tloušťka světlovodné vrstvy bývá v mnoha případech mnohem menší než zbývající dva rozměry vrstvy. V takových případech můžeme řešení Maxwellových rovnic zjednodušit a počítat případ, kdy se záření šíří nekonečně velkou rovinnou vrstvou s indexem lomu n1 a tloušťkou L umístěnou mezi podložkou s indexem lomu nA a horní vrstvou s indexem lomu nB. Osu z umístíme rovnoběžně se směrem šíření světla a osu x kolmo na rozhraní vrstev (viz obr. 38), takže řešení vlnové rovnice (1) můžeme hledat ve tvaru ψ = ψ0 (x) ei(ωt−βz) (77) 40 Tím dostáváme diferenciální rovnici ψ0 ,xx = ψ0 β2 − ω2 n(x)2 c2 (78) která podle velikosti výrazu β2 −ω2 n2 /c2 vede na harmonické funkce nebo na exponenciální řešení. Tato skutečnost je schematicky znázorněna na obr. 42. Je zjevné, že vedená vlna musí splňovat nA, nB < β k0 < n1 (79) (k0 je velikost vlnového vektoru záření ve vakuu), aby rovnice (78) vedla na stojatou vlnu ve světlovodné vrstvě a na evanescentní vlny v sousedních materiálech. Pro výpočet vzájemných vztahů mezi jednotlivými složkami intenzity elektrického pole a magnetické indukce použijeme opět dvě z Maxwellových rovnic ∇ × E = −B,t a ∇ × B = n2 E,t/c2 . Použijeme předpoklad (77) vedoucí k ψ,t = iωψ ψ,z = −iβψ ψ,y = 0 a dostáváme šest rovnic, které můžeme rozdělit do dvou trojic. První trojice obsahuje pouze složky Ey, Bx a Bz: βEy = −ωBx Ey,x = −iωBz (80) −βBx + iBz,x = ω n2 c2 Ey zatímco druhá trojice složky Ex, Ez a By: βEx − iEz,x = ωBy βBy = ω n2 c2 Ex (81) By,x = iω n2 c2 Ez Je tedy vidět, že nekonečným rovinným světlovodem se mohou nezávisle šířit dvě různé kategorie vln. Řešení soustavy (80) mohou mít nulové složky Ex, Ez a By a nazývají se transverzálně elektrické (TE) módy, protože jejich intenzita elektrického pole je kolmá na směr šíření vln. Pro druhou množinu řešení, odpovídajících rovnicím (81), platí Ey, Bx, Bz = 0 a tato řešení se nazývají transverzálně magnetické (TM) módy. Dosavadní text platil pro libovolný průběh indexu lomu n(x). V následujícím textu se pro jednoduchost omezíme na symetrický světlovod se skokovými změnami indexu lomu. Uvnitř světlovodné vrstvy bude tedy index lomu konstantní s hodnotou n1 a oba materiály pod i nad světlovodnou vrstvou budou mít konstantní index lomu nA = nB. Označíme h2 = ω n1 c 2 − β2 q2 = β2 − ω nB c 2 41 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 9 10 11 12 hL m=0 m=1 m=2 V=8 Obr. 39: Grafické řešení rovnice (85) pro normovanou frekvenci 8. Levá strana rovnice je vynesena modře, pravá strana červeně. 0 1 2 3 4 0 1 2 3 4 5 6 7 hL/π V/π m=0 m=1 m=2 m=3 Obr. 40: Řešení rovnice (85) pro 4 TE módy v symetrickém rovinném světlovodu. a pro TE módy dostáváme řešením (78) Ey ei(ωt−βz) =    Be−qx x ≥ L/2 C1 sin hx + C2 cos hx x ∈ <−L/2; L/2> Aeqx x ≤ −L/2 (82) Dosazením do (80) lze spočítat průběh složek Bx a Bz. Protože tečné složky elektrické i magnetické intenzity musí být na rozhraní vrstev spojité, je pro následující postup kromě průběhu Ey důležitý i průběh veličiny Bz: Bz ei(ωt−βz) =    − iq ω B e−qx x ≥ L/2 ih ω (C1 cos hx − C2 sin hx) x ∈ <−L/2; L/2> iq ω A eqx x ≤ −L/2 (83) Podmínky spojitosti Ey a Bz na rozhraních můžeme napsat B e− qL 2 = C1 sin hL 2 + C2 cos hL 2 A e− qL 2 = −C1 sin hL 2 + C2 cos hL 2 −qB e− qL 2 = hC1 cos hL 2 − hC2 sin hL 2 qA e− qL 2 = hC1 cos hL 2 + hC2 sin hL 2 42 k =hx n k0B n k1 0 k =z β k m=0 m=1 m=4 m=3 m=2 Obr. 41: Směr vlnových vektorů pro světlovod s pěti vedenými módy. Vlnové vektory vedených módů mají takový směr, že jejich průmět do osy z leží mezi hodnotami nBk0 a n1k0. Netriviální řešení této soustavy bychom mohli hledat tak, že její diskriminant položíme rovný nule. Zde použiji analogický postup, kdy z předchozích čtyř rovnic nejprve vyloučím konstanty A a B: −C1 sin hL 2 + C2 cos hL 2 = h q C1 cos hL 2 + h q C2 sin hL 2 C1 sin hL 2 + C2 cos hL 2 = − h q C1 cos hL 2 + h q C2 sin hL 2 Součtem a rozdílem těchto dvou rovnic získám dvě různá řešení. První rovnice tg hL 2 = q h zajistí platnost předchozích dvou rovnic pro libovolné C2, vyžaduje ale C1 = 0. Druhá rovnice −cotg hL 2 = q h naopak vyžaduje C2 = 0. Obě dvě rovnice je možné přepsat do jedné tg hL 2 − m π 2 = q h pro m ∈ Z (84) kde pro sudá m platí C1 = 0 a tím pádem i B = A, zatímco pro lichá m platí C2 = 0 a B = −A. Při řešení rovnice (84) zavedeme normovanou frekvenci V = L h2 + q2 = ω c L n2 1 − n2 B kde n2 1 − n2 B je numerická apertura (viz kpt. 2.3.1), a dostáváme hL tg hL 2 − m π 2 = V 2 − (hL)2 (85) 43 β 0n k1 m=0 nB nA h n k1 0 β n1 h β n k −q 0B β n k n kn kB 0 0 0A 1 B m=1 m=2 Obr. 42: Náčrtky řešení vlnové rovnice v rovinném světlovodu s indexy lomu nB < nA < n1 pro tři vedené a dva zářivé módy. Grafické řešení rovnice (85) je pro V = 8 ukázané v grafu 39. Je vidět, že počet možných řešení závisí na hodnotě normované frekvence. Pro V < π se světlovodem může šířit jediný vedený TE mód, který v symetrickém světlovodu může existovat vždy. V případě vyneseném do grafu 39 je V > 2π, a proto se světlovodem mohou šířit tři TE módy, z nichž každý má jiné vlnové číslo β. Jednotlivé módy se označují příslušnou hodnotou m. Přibližný počet TE módů, které se světlovodem mohou šířit, je V π = 2L λ0 n2 1 − n2 B Výsledek numerického řešení rovnice (85) je vynesený do obr. 40. Stejným způsobem lze pomocí rovnic (81) dostat pro TM módy rovnici tg hL 2 − m π 2 = n2 1 n2 B q h (86) s analogickými výsledky. Skutečnost, že jednotlivé módy mají navzdory stejně velkému vlnovému vektoru (n1k0) různé hodnoty vlnového čísla β, ukazuje, že se módy liší směrem vlnového vektoru a tedy i směrem svých paprsků. Tuto skutečnost demonstruje obr. 41. Průběh pole v závislosti na souřadnici x pro tři nejnižší vedené módy ukazuje obr. 42. Z rovnice (78) vyplývá harmonická závislost uvnitř světlovodné vrstvy a evanescentní tvar řešení mimo vrstvu. Na velikosti x-ové složky vlnového vektoru (h) je vidět, že ve směru kolmém na vrstvu se průběh dvou sousedních módů liší přibližně o jednu půlvlnu. Módy se sudým m jsou symetrické, zatímco módy s lichým m antisymetrické. 44 ω β c β c β m=3 2 1 0 1n nB Obr. 43: Náčrtek disperzní relace v symetrickém světlovodu pro 4 vedené módy. 3.45 3.46 3.47 3.48 3.49 3.5 0 0.2 0.4 0.6 0.8 1 β/k0 ω [(fs) -1 ] m=0 1 2 3 Obr. 44: Disperzní relace několika módů v 10 µm širokém rovinném světlovodu s n1 =3,5 a nB =3.45 (AlxGa1−xAs). 3.3 Disperzní relace v symetrickém světlovodu Rovnici (84) lze přepsat na tg2 L 2 ωn1 c 2 − β2 − m π 2 = β2 − ωn2 c 2 ωn1 c 2 − β2 (87) která je implicitní disperzní relací TE modů symetrického rovinného světlovodu. Její řešení je znázorněno na obr. (43) a (44). Druhý z těchto grafů ukazuje na příkladu konkrétního světlovodu hodnoty β/k0, tj. index lomu odpovídající fázové rychlosti každého z módů. Je vidět, že fázové rychlosti leží mezi hodnotami c/nB a c/n1. Pro cut-off m-tého modu (v tomto případě V = mπ) je fázová rychlost modu nejvyšší (c/nB), protože záření je nejméně soustředěno do světlovodné vrstvy a prochází hlavně prostředím s nižším indexem lomu. S růstem normované frekvence roste efektivní index lomu sledovaného módu, jeho fázová rychlost klesá a limitně se blíží hodnotě c/n1. Vyšší mody mají vyšší fázovou rychlost než nižší módy, protože jsou méně uzavřeny do světlovodné vrstvy, která má vyšší index lomu. Disperzní relace TE a TM módů téměř splývají, křivky popisující TM mody leží mírně pod křivkami TE modů, jak je vidět na obr. 45. Grupové rychlosti lze spočítat derivací vg = dω dβ a odpovídají proto sklonu křivek na grafech s disperzní relací. Grupové rychlosti několika modů jsou ukázané v grafu 46. Grupová rychlost módů je při cut-off rovna c/nB. S růstem normované frekvence nejprve rychle klesá, protože se mód stahuje do prostředí s vyšším 45 3.45 3.46 3.47 0 0.05 0.1 β/k0 ω [(fs) -1 ] TE TM Obr. 45: Disperzní relace TE a TM módů pro m=0 ve světlovodu z obr. 44. 8.5 8.55 8.6 8.65 8.7 0 0.2 0.4 0.6 0.8 1 vg[10 7 m/s] ω [(fs) -1 ] Obr. 46: Grupová rychlost několika modů pro světlovod z obr. 44. Vodorovné čáry označují rychlosti c/n1 a c/nB. indexem lomu. Kromě změny efektivního indexu lomu se ale projevuje i zmenšování úhlu mezi vlnovým vektorem a osou z, které naopak grupovou rychlost zvyšuje, což vede k nemonotónní závislosti grupové rychlosti na normované frekvenci. V limitě V → ∞ se grupová rychlost modu blíží hodnotě c/n1. 3.4 Vazba mezi blízkými světlovody Tato kapitolka bude sledovat přelévání světelného výkonu mezi dvěma světlovody, které jsou si dostatečně blízko na to, aby se záření mohlo mezi nimi tunelovat. Předvedený postup má ale mnohem širší uplatnění v situacích, kdy se v materiálu objeví nějaká „nadbytečná“ polarizace, např. na periodicky vytvořených vrypech do světlovodu nebo na selektivně odrážejícím úseku optického vlákna s periodicky upraveným indexem lomu, v mnoha vazebných a přepínacích optických členech, při vysvětlování nelineárních optických jevů, odrazu světla na akustických vlnách, nebo v některých typech laserů. Pro jednoduchost budeme počítat vazbu mezi jednomodovými světlovody a budeme předpokládat, že světlovody jsou od sebe dostatečně vzdáleny na to, aby přítomnost jednoho světlovodu neovlivňovala příliš silně charakter módů druhého světlovodu. Příklad profilu permitivity (nebo indexu lomu) takovýchto dvou vlnovodů je schematicky načrtnutý na obr. 47(a). Kdyby v prostředí neexistoval světlovod 2 a profil permitivity by tedy odpovídal obr. 47(b), pak by se prvním světlovodem mohla šířit vlna popsaná vztahem E1 = E10 u1(x, z, t) = E10 ξ1(x) ei(ωt−β1z) (88) kde u1(x, z, t) a ξ1(x) splňují vlnovou rovnici prostředí načrtnutého na obr. 47(b) △u1 − εr 1 c2 ∂2 u1 ∂t2 = 0 ∂2 u1 ∂x2 − β2 1u1 + εr ω2 c2 u1 = 0 (89) 46 ε1 n, 1 nε2, 2 n1 nB nB n2 εB nB, (a) (b) (c) x Obr. 47: Profil indexu lomu (nebo permitivity) dvou blízkých světlovodů řešených v kpt. 3.4. 0 0.2 0.4 0.6 0.8 1 0 1 2 3 4 5 6 7 8 9 10 P(z)/P1(0) γ z P1 P2 Obr. 48: Výkon záření přenášený dvěma blízkými světlovody se slabou vazbou. a ξ1(x) bylo zvoleno tak, aby ∞ −∞ ξ1(x).ξ1(x) dx = 1 Analogicky by se samotným světlovodem 2, tj. prostředím s permitivitou odpovídající obr. 47(c), mohla šířit vlna popsaná E2 = E20 u2(x, z, t) = E20 ξ2(x) ei(ωt−β2z) (90) ∂2 u2 ∂x2 − β2 2u2 + εr ω2 c2 u2 = 0 (91) s analogickými vlastnostmi veličin u2(x, z, t) a ξ2(x). Nyní budeme vyšetřovat chování světelné vlny v prvním světlovodu s vědomím, že prostředí tohoto světlovodu může být polarizované nejenom vlnou (88), ale také evanescentní vlnou pronikající sem z druhého světlovodu. Tuto „nadbytečnou“ polarizaci způsobenou přítomností světla letícího druhým světlovodem označíme Pp. Z Maxwellových rovnic dostaneme pro takové případy vlnovou rovnici △E = µ0 ∂2 D ∂t2 D = ε0εrE + Pp a po dosazení △E − εr 1 c2 ∂2 E ∂t2 = µ0 ∂2 Pp ∂t2 (92) Řešení rovnice (92) můžeme hledat tak, že veličinu E10 budeme považovat za funkci souřadnice z: E1 = E10(z) u1(x, z, t) = E10(z) ξ1(x) ei(ωt−β1z) (93) 47 Po výpočtu △E1 = E10 ∂2 u1 ∂x2 + E10,zzu1 − i2β1E10,zu1 − E10β2 1u1 dosazení předpokladu (93) do (92) a uvážení, že veličina E10(z) se mění pomalu (E10,zz ≪ β1E10,z) vychází −i2β1E10,zξ1(x) ei(ωt−β1z) ≈ µ0 ∂2 Pp ∂t2 (94) Vlna šířící se druhým světlovodem je ovšem včetně své polarizace popsaná svou vlnovou rovnicí (91) a tuto polarizaci tedy nelze považovat za nadbytečnou. Nadbytečná polarizace Pp, tj. polarizace nepopsaná rovnicí (91) ani (89), ale nastává v prvním světlovodu, protože jeho prostředí je polarizovatelnější než jeho okolí. Po dosazení výrazu (90) vychází uvnitř první světlovodné vrstvy Pp = ε0(εr1 − εrB)E20 ξ2(x) ei(ωt−β2z) (95) a Pp = 0 jinde. Po dosazení vztahu (95) do (94) −i2β1E10,z ξ1(x) = − ω2 c2 (εr1 − εrB) E20 ξ2(x) ei(β1−β2)z následuje vynásobení rovnice ξ1 a její integrace v mezích od −∞ do ∞ E10,z = −i k2 0 2β1 (n2 1 − n2 B)E20 ei(β1−β2)z 1 ξ1.ξ2 dx kde 1 označuje integraci přes oblast první světlovodné vrstvy. Protože zcela stejný postup může být využit k výpočtu změny záření v druhém světlovodu, dostáváme pro vývoj záření ve dvou blízkých světlovodech dvě svázané rovnice E10,z = −iA12E20 ei(β1−β2)z A12 = k2 0 2β1 (n2 1 − n2 B) 1 ξ1.ξ2 dx (96) E20,z = −iA21E10 ei(β2−β1)z A21 = k2 0 2β2 (n2 2 − n2 B) 2 ξ1.ξ2 dx (97) Příklad řešení rovnic (96) a (97) Spočítáme případ, kdy světlo vstupuje pouze do prvního ze dvou svázaných světlovodů, takže E20(0) = 0. Z rovnic (96) a (97) vyplývá rovnice E20,zz + i(β1 − β2)E20,z + A2 E20 = 0 A = A12A21 jejíž řešení lze hledat ve tvaru E20 ∝ eαz , což vede k úpravám 0 = α2 + i(β1 − β2)α + A2 α = −i β1 − β2 2 ± − β1 − β2 2 2 − A2 E20 = e−i β1−β2 2 z C1eiγz + C2e−iγz γ = β1 − β2 2 2 + A2 48 0 0.2 0.4 0.6 0.8 1 0 1 2 3 4 5 6 7 P(z)/P1(0) γ z P1 P2 Obr. 49: Výkon záření přenášený dvěma identickými blízkými světlovody. 0 0.2 0.4 0.6 0.8 1 0 1 2 3 4 5 6 7 P2(L0)/P1(0) (β1 - β2) L0 / π Obr. 50: Přenos výkonu záření mezi dvěma původně identickými světlovody na vazebné délce L0 v závislosti na rozladění obou světlovodů (β1 − β2). Qůli počáteční podmínce E20(0) = 0 musí platit C1 = −C2 a po označení C = 2C1 vychází E20(z) = Ce−i β1−β2 2 z sin γz S využitím rovnice (97) dostaneme E10 = C A21 ei β1−β2 2 z β1 − β2 2 sin γz + iγ cos γz a pomocí počáteční podmínky určíme integrační konstantu C = −i A21 γ E10(0) což vede k řešení E10(z) = E10(0) ei β1−β2 2 z cos γz − i β1 − β2 2γ sin γz (98) E20(z) = −i A21 γ E10(0) e−i β1−β2 2 z sin γz (99) Výkon přenášený každým ze světlovodů je přímo úměrný druhé mocnině velikosti intenzity elektrického pole P2 ∝ E20E∗ 20 = E2 10(0) A2 21 γ2 sin2 γz (100) P1 ∝ E10E∗ 10 = E2 10(0) cos2 γz + β1 − β2 2γ 2 sin2 γz (101) Je vidět, že světelný výkon se periodicky přelévá mezi oběma světlovody (viz obr. 48). V případě, že oba světlovody budou identické, tj. β1 − β2 = 0 a A21 = A12 = A = γ, 49 dostáváme jednoduché rovnice P1(z) = P1(0) cos2 γz P2(z) = P1(0) sin2 γz Vazba mezi identickými světlovody tedy vede k přenesení celého výkonu do druhého světlovodu na vzdálenosti L0 = π 2A Pokračuje-li vazba mezi světlovody i za tímto bodem, začne se výkon vracet zpět do prvního světlovodu a proces se periodicky opakuje (obr. 49). Přenos záření je tedy účinný pouze pokud β1 ≈ β2, jinak řečeno pokud módy v obou světlovodech mají stejnou rychlost. Podmínku β1 ≈ β2 lze lehce pochopit i z hlediska kvantové mechaniky, protože β1 a β2 jsou hybnosti fotonů v obou světlovodech a uvedená podmínka tedy vyjadřuje zákon zachování hybnosti při přenosu fotonu mezi světlovody. Získaný výsledek umožňuje vyrábět praktické optoelektronické přepínače. Index lomu některých materiálů je totiž možné měnit elektrickým polem. Pokud máme dva identické světlovody, které jsou na vzdálenosti L0 vedené blízko sebe, pak záření vstupující do jednoho ze světlovodů se plně přenáší do druhého světlovodu. Změna indexu lomu světlovodných vrstev způsobená vnějším elektrickým polem ale vazbu mezi světlovody rozlaďuje, takže pomocí elektrického pole je možné snížit množství výkonu přeneseného do druhého světlovodu podle vztahu P2(L0) P1(0) = A2 21 γ2 sin2 γ π 2A ≈ 1 1 + β1−β2 2A 2 sin2  π 2 1 + β1 − β2 2A 2   = = π 2 2 sinc2  π 2 1 + β1 − β2 π L0 2   a při rozladění (β1 − β2)L0 = √ 3π zůstane všechno záření v původním světlovodu (viz obr. 50). 50 4 Stručná zmínka o optronech Pro úplnost zmíním v těchto naprosto neúplných skriptech optrony, tj. optoelektrické součástky, které elektrický signál na svém vstupu přenášejí ve formě optického signálu na výstup, kde jej mění zpět na elektrický. Optrony tedy slouží ke galvanickému oddělení elektronických obvodů, případně, pokud záření prochází vnějším prostředím, mohou tvořit součást optoelektronických senzorů. Zdrojem světla ve vstupní části optronu je zpravidla LED, jako detektor ve výstupní části sloužívá fototranzistor, fotodioda, fotoodpor nebo fototyristor. Optrony můžeme dělit do dvou kategorií, na optrony určené pro analogové a pro logické obvody. U analogových optronů se klade velký důraz na jejich linearitu. Nelinearitu jednotlivých součástí analogového optronu je možné kompenzovat pomocí dvou identických diod na výstupní straně optronu. Zatímco jedna z diod je vyvedena na výstup optronu, je signál detekovaný druhou diodou přiveden na zesilovač umístěný na vstupní straně odporu a jeho velikost je použita ke kompenzaci nelinearit a teplotní závislosti optronu. Naopak u optronů určených pro logické obvody postačuje, aby optron spínal mezi dvěma vhodnými hodnotami. 51 5 Dodatky 5.1 Diferenciální operátory ve válcových souřadnicích Válcové (cylindrické) souřadnice (r, ϕ, z): x = r cos ϕ y = r sin ϕ (102) z = z Jednotkové vektory           r0 ϕ0 z0           =           cos ϕ sin ϕ 0 − sin ϕ cos ϕ 0 0 0 1                     x0 y0 z0           (103) f – skalární pole F = Fr r0 + Fϕ ϕ0 + Fz z0 – vektorové pole ∇f = ∂f ∂r r0 + 1 r ∂f ∂ϕ ϕ0 + ∂f ∂z z0 (104) ∇.F = ∂Fr ∂r + 1 r Fr + 1 r ∂Fϕ ∂ϕ + ∂Fz ∂z (105) ∇ × F = 1 r ∂Fz ∂ϕ − ∂Fϕ ∂z r0 + ∂Fr ∂z − ∂Fz ∂r ϕ0 + ∂Fϕ ∂r + 1 r Fϕ − 1 r ∂Fr ∂ϕ z0(106) ∆f = ∂2 f ∂r2 + 1 r ∂f ∂r + 1 r2 ∂2 f ∂ϕ2 + ∂2 f ∂z2 (107) ∆F = ∆Fr − 1 r2 Fr − 2 r2 ∂Fϕ ∂ϕ r0 + ∆Fϕ − 1 r2 Fϕ + 2 r2 ∂Fr ∂ϕ ϕ0 + ∆Fz z0 (108) 5.2 Besselovy funkce Řešení diferenciální rovnice x2 y′′ + xy′ + (x2 − n2 )y = 0 (109) se hledá ve tvaru y(x) = xρ ∞ j=0 aj xj což vede k rovnici a0(ρ2 − n2 ) + a1[(ρ + 1)2 − n2 ] + ∞ j=2 {aj−2 + aj[(ρ + j)2 − n2 ]} = 0 52 -0.5 0 0.5 1 -10 -5 0 5 10 Jn(x) x n=0 1 2 3 4 Obr. 51: Besselovy funkce prvního druhu celočíselných řádů 0 až 4. -1 -0.5 0 0.5 1 -10 -5 0 5 10 Yn(x) x n=0 1 2 3 4 Obr. 52: Besselovy funkce druhého druhu celočíselných řádů 0 až 4. a výsledkům ρ = ± n a1 = 0 aj = − aj−2 j(j ± 2n) Řešením rovnice (109) jsou tedy tzv. Besselovy funkce 1. druhu řádu n (obr. 51): Jn(x) = ∞ j=0 (−1)j x 2 2j+n j! Γ(n + j + 1) (110) s vlastnostmi J−n(x) = (−1)n Jn(x) pro n ∈ Z (111) J′ n(x) = ± n x Jn(x) − Jn±1(x) (112) a limitním chováním Jl(x) −→ x→0 1 l! x 2 l (113) Jl(x) −→ x→∞ 2 πx cos x − lπ 2 − π 4 (114) Tabulka nejnižších kořenů Besselových funkcí 1. druhu: řád: 0 1 2 3 4 5 2.4048 3.8317 5.1356 6.3802 7.5883 8.7715 5.5201 7.0156 8.4172 9.7610 11.0647 12.3386 8.6537 10.1735 11.6198 13.0152 14.3725 15.7002 53 0 5 10 15 20 25 30 0 1 2 3 4 5 In(x) x n=0 1 2 3 4 Obr. 53: Modifikované Besselovy funkce prvního druhu celočíselných řádů 0 až 4. 0 2 4 6 8 10 0 1 2 3 4 5 Kn(x) x 0 1 2 3 n=4 Obr. 54: Modifikované Besselovy funkce druhého druhu celočíselných řádů 0 až 4. Dalším řešením rovnice (109) jsou tzv. Besselovy funkce 2. druhu řádu n (obr. 52): Yn(x) = lim ν→n Jν(x) cos(νπ) − J−ν(x) sin(νπ) (115) Kombinací Jn(x) a Yn(x) vznikají Besselovy funkce třetího druhu (Hankelovy funkce): H(1) n = Jn(x) + iYn(x) (116) H(2) n = Jn(x) − iYn(x) (117) Jejich význam spočívá v limitním chování pro komplexní argument z: lim |z|→∞ H(1) n (z) = 0 pro Im (z) > 0 lim |z|→∞ H(2) n (z) = 0 pro Im (z) < 0 Výrazy in+1 H (1) n (ix) a i−(n+1) H (2) n (−ix) jsou reálné pro reálná kladná x. Modifikované Besselovy funkce prvního druhu (In, obr. 53) a druhého druhu (Kn, obr. 54) jsou řešením diferenciální rovnice x2 y′′ + xy′ − (x2 + n2 )y = 0 (118) Pro reálná x > 0 platí In = i−n Jn(ix) (119) Kn(x) = π 2 in+1 H(1) n (ix) (120) 54 Limitní chování In a Kn popisují vztahy In(x) −→ x→∞ 1 √ 2πx ex Kn(x) −→ x→∞ π 2x e−x V optoelektronice mají význam rovnice K′ n(x) = ± n x Kn(x) − Kn±1(x) (121) K−n(x) = Kn(x) (122) 5.3 Paprsková rovnice Pro výpočet trajektorie paprsku nebo stanovení invariantů na této dráze je užitečná tzv. paprsková rovnice. V této kapitolce je uvedeno její odvození pomocí Fermatova principu. Doba, kterou paprsek potřebuje k průletu prostředím s obecně proměnným indexem lomu n(r) se rovná integrálu n ds c , kde ds je infinitezimální úsek dráhy paprsku. Podle Fermatova principu platí δ n ds = 0, (123) což můžeme přepsat na δ n 1 + ˙x2 + ˙y2 dz = 0, (124) kde ds = 1 + ˙x2 + ˙y2 dz ˙x = dx dz ˙y = dy dz a kde dále označíme L = n 1 + ˙x2 + ˙y2 (125) Pro funkce splňující δ Lds = 0 platí d dz ∂L ∂ ˙x = ∂L ∂x (126) tedy d dz n ˙x 1 + ˙x2 + ˙y2 = ∂n ∂x 1 + ˙x2 + ˙y2 d ds n dx ds = ∂n ∂x 55 Protože analogický postup můžeme použít i pro souřadnice y a z, dostáváme vektorovou rovnici d ds n dr ds = ∇n, (127) která se nazývá paprsková rovnice. 5.4 Výpočet výrazu I = 1 I1 Z 0 r a q dz v gradientním vlákně Při výpočtu použijeme následující předpoklady či označení: n2 = n2 1 1 − K r a q pro r ≤ a I1 ≡ n cos ϑ = n 1 + ˙r2 + (r ˙ϕ)2 I2 ≡ I1 r2 a ˙ϕ ˙r = dr dz ˙ϕ = dϕ dz I1 a I2 jsou konstanty, které se během letu paprsku vláknem nemění (viz kpt. 2.3.3). Při výpočtu se nejprve přechází na integrál přes r. Praktické je počítat v mezích od nejmenšího do největšího r: I = 1 I1 Z 0 r a q dz = 1 I1 rmax rmin 1 ˙r r a q dr = rmax rmin 1 √ f r a q dr = rmax rmin 1 √ g r a q+1 dr Na předchozím řádku byly použity následující pomocné výpočty a označení: n2 I2 1 = 1 + ˙r2 + I2 I1 a r 2 ˙r = ± 1 I1 n2 − I2 a r 2 − I2 1 f ≡ (I1 ˙r)2 = n2 1 − I2 1 − n2 1K r a q − I2 2 a r 2 g ≡ f r a 2 = n2 1 − I2 1 r a 2 − n2 1K r a q+2 − I2 2 V dalším postupu se využije výpočet dg dr = 2(n2 1 − I2 1 ) a r a − n2 1K q + 2 a r a q+1 r a q+1 = a n2 1K(q + 2) 2(n2 1 − I2 1 ) a r a − dg dr Dosazením za r a q+1 a využitím 0 0 dg √ g = 0, protože g(rmin) = g(rmax) = 0, dostáváme I = 2(n2 1 − I2 1 ) n2 1K(q + 2) rmax rmin 1 √ g r a dr − konst. 0 0 dg √ g = 2(n2 1 − I2 1 ) n2 1K(q + 2) rmax rmin dr √ f = 2(n2 1 − I2 1 ) n2 1K(q + 2) 1 I1 Z 56 Doporučená literatura [1] A. Yariv: Optical Electronics in Modern Communications, Oxford University Press 1997. [2] A. Ghatak, K. Thyagarajan: Introduction to Fiber Optics, Cambridge University Press 1998. [3] B.E.A. Saleh, M.C. Teich: Základy fotoniky. Svazky 2 – 4, Matfyzpress 1994 – 6, originál: Fundamentals of photonics. [4] L. Maršálek: Optická vlákna, goro.czweb.org/download/interest/vlakna.pdf 2006. 57