PB165 – Grafy a sítě
Hledání nejkratších cest
PB165 – Grafy a sítě 1/34
Obsah přednášky
Úvod
Nejkratší cesty z jednoho vrcholu
Dijkstrův algoritmus (opakování)
A* algoritmus
Bellman-Ford algoritmus
Cesty mezi všemi vrcholy
Floyd-Warshallův algoritmus
Distribuovaný Floyd-Warshallův algoritmus
PB165 – Grafy a sítě 2/34
Vzdálenost v neohodnoceném grafu
Pro připomenutí:
Délka cesty v neohodnoceném grafu je rovna počtu hran na této cestě.
Vzdálenost δ(u, v) vrcholů u, v v grafu
je délka nejkratší cesty z u do v.
Vzdálenost mezi dvěma vrcholy nemusí být v případě orientovaného
grafu symetrická.
Vzdálenosti z u do v a naopak se liší.
PB165 – Grafy a sítě 3/34
Vzdálenost v ohodnoceném grafu
V reálných aplikacích hledání nejkratších cest jsou hrany grafu obvykle
nějakým způsobem ohodnoceny - např. vzdálenosti mezi městy silniční sítě,
latence síťových spojů.
Deﬁnice
Délka cesty v ohodnoceném grafu je rovna součtu ohodnocení hran na této
cestě.
Vzdálenost vrcholů je opět rovna délce nejkratší cesty.
Aby měl pojem vzdálenosti smysl, v grafu nemůže existovat cyklus
záporné délky.
PB165 – Grafy a sítě 4/34
Nejkratší cesty a cykly
Věta
Pokud v grafu neexistuje cyklus záporné nebo nulové délky, je nejkratší sled
v grafu (nejkratší) cestou.
Důkaz.
Nechť je součástí sledu s cyklus c. Tento cyklus má zřejmě kladnou délku. Potom
existuje sled, který je „podsledem“ s a cyklus c je z něj „vystřižen“. Jelikož c má
kladnou délku, je tento sled kratší než sled c obsahující. Takto lze pokračovat
a sled zkracovat, dokud obsahuje nějaké cykly. Výsledný sled, který neobsahuje
žádný cyklus, je cestou.
Nejkratší sled je vyznačen červeně. Delší sledy vedou i po modrých a zelených
hranách a tvoří cykly.
PB165 – Grafy a sítě 5/34
Trojúhelníková nerovnost
Graf G splňuje trojúhelníkovou nerovnost, pokud pro libovolnou trojici jeho
vrcholů u, v, w platí:
δ(u, w) ≤ δ(u, v) + δ(v, w)
u w
v
d(u,w)
d(u,v) d(v,w)
Obecný graf tuto nerovnost nesplňuje:
d(u,v)=1, d(v,w)=1, d(u,w)=3
Příkladem, pro který trojúhelníková nerovnost platí, je např.
graf nejkratších silničních vzdáleností mezi městy.
PB165 – Grafy a sítě 6/34
Dijkstrův algoritmus
„Klasický“ algoritmus hledání nejkratší cesty.
Najde nejkratší cesty z jednoho vrcholu do všech ostatních.
Pracuje pro orientovaný i neorientovaný graf.
Vyžaduje nezáporné ohodnocení všech hran (nejen cyklů).
Lineární paměťová složitost.
Časová složitost záleží na použité datové struktuře.
PB165 – Grafy a sítě 7/34
Dijkstrův algoritmus – popis
Počáteční vrchol označíme s.
Pro každý vrchol v grafu je udržována
hodnota d[v] – délka nejkratší doposud nalezené cesty z s do v.
Na počátku d[s]= 0 pro počáteční vrchol a
d[v]= ∞ pro ostatní vrcholy.
Po skončení výpočtu obsahuje d[v] délku nejkratší cesty v grafu,
pokud taková existuje, nebo ∞ v opačném případě.
Dále v proměnné p[v] ukládáme předchůdce vrcholu v na doposud
nalezené nejkratší cestě z s.
Před výpočtem nastavíme hodnotu p[v] jako nedeﬁnovanou pro
všechny vrcholy.
Po skončení výpočtu je nejkratší cesta posloupnost vrcholů
PB165 – Grafy a sítě 8/34
Dijkstrův algoritmus – popis
Počáteční vrchol označíme s.
Pro každý vrchol v grafu je udržována
hodnota d[v] – délka nejkratší doposud nalezené cesty z s do v.
Na počátku d[s]= 0 pro počáteční vrchol a
d[v]= ∞ pro ostatní vrcholy.
Po skončení výpočtu obsahuje d[v] délku nejkratší cesty v grafu,
pokud taková existuje, nebo ∞ v opačném případě.
Dále v proměnné p[v] ukládáme předchůdce vrcholu v na doposud
nalezené nejkratší cestě z s.
Před výpočtem nastavíme hodnotu p[v] jako nedeﬁnovanou pro
všechny vrcholy.
Po skončení výpočtu je nejkratší cesta posloupnost vrcholů
s, p[...p[v]...], ... p[p[v]], p[v], v.
PB165 – Grafy a sítě 9/34
Dijkstrův algoritmus – popis
Všechny vrcholy jsou rozděleny do dvou vzájemně disjunktních
množin:
S obsahuje právě ty vrcholy, pro něž je v d[v] uložena deﬁnitivní
nejkratší cesta z s do v v grafu.
Q obsahuje všechny ostatní vrcholy.
Vrcholy množiny Q jsou ukládány v prioritní frontě.
Nejvyšší prioritu má vrchol u s nejnižší hodnotou d[u] – nelze do něj
již nalézt kratší cestu než která je aktuální.
V každé iteraci jsou provedeny následující kroky:
Odstraň vrchol u z počátku fronty.
Přesuň vrchol u z množiny Q do S.
Relaxuj všechny hrany (u, v):
Pokud d[v] > d[u] +w(u, v), uprav d[v].
w(u, v) značíme ohodnocení (weight) hrany (u, v).
PB165 – Grafy a sítě 10/34
Dijkstrův algoritmus – pseudokód
Vycházíme z počátečního vrcholu s.
Vlož všechny vrcholy do Q
d[s] ← 0; p[s] ← undef
for all u ∈ V \{s} do
d[u] ← ∞
p[u] ← undef
end for
while Q = ∅ do
Odstraň z Q vrchol u s nejvyšší prioritou
for all Hrany (u, v) do
if d[v] > d[u] + w(u, v) then
d[v] ← d[u] + w(u, v)
p[v] ← u
end if
end for
end while
PB165 – Grafy a sítě 11/34
Dijkstrův algoritmus – příklad
Vrcholy množiny S jsou vyznačeny modře. Napravo od grafu je znázorněn stav
prioritní fronty.
PB165 – Grafy a sítě 12/34
Dijkstrův algoritmus – animace/ilustrace výpočtu
animace výpočtu na ukázkovém grafu
http://www.unf.edu/~wkloster/foundations/DijkstraApplet/
DijkstraApplet.htm
komentovaný výpočet
http://www.youtube.com/watch?v=8Ls1RqHCOPw
výpočet s možností deﬁnice vlastního grafu
http://www.cse.yorku.ca/~aaw/HFHuang/DijkstraStart.html
PB165 – Grafy a sítě 13/34
Dijkstrův algoritmus – časová složitost
Označme n = |V |, m = |E|.
Inicializace je provedena v lineárním čase vzhledem k počtu vrcholů.
Každou hranou prochází algoritmus vždy právě jednou nebo dvakrát
(v případě neorientovaného grafu).
Hlavní cyklus je proveden vždy n-krát.
Je tudíž provedeno vždy právě n výběrů z prioritní fronty.
Složitost výběru z fronty záleží na její implementaci:
Pole, seznam vrcholů – výběr lze provést v lineárním čase, složitost
celého algoritmu je tedy O(n2
+ m).
Binární halda – výběr je proveden v čase O(log(n)). Při každé relaxaci
hrany může dojít k aktualizaci haldy (O(log(n)), celková složitost je
tak rovna O((n + m)log(n)).
Fibonacciho halda – složitost výběru stejná jako v případě binární
haldy, složitost úpravy haldy při relaxaci je ovšem konstantní – výsledná
složitost algoritmu O(m + nlog(n)).
http://en.wikipedia.org/wiki/Fibonacci_heap
PB165 – Grafy a sítě 14/34
Dijkstrův algoritmus – využití
Dijkstrův algoritmus je používán v link-state směrovacích protokolech. Ty
pracují na principu zasílání sousedních „vrcholů“ aktivními síťovými prvky,
které se směrování zúčastní.
Každý aktivní prvek periodicky rozesílá seznam sousedních vrcholů.
Ten je propagován skrze síť ke všem aktivním prvkům.
Každý aktivní prvek nezávisle na ostatních vypočítá strom nejkratších
cest do všech ostatních aktivních prvků.
Riziko vzniků smyček v směrovacích tabulkách.
Nejpoužívanější link-state protokoly jsou OSPF a IS-IS. Oba používají
Dijkstrův algoritmus.
PB165 – Grafy a sítě 15/34
A* algoritmus
Upravený Dijkstrův algoritmus.
Používá se zejména k nalezení cesty do jednoho vrcholu – např.
navigace.
Kromě délky nejkratší cesty do každého vrcholu bere při vyhledávání
v úvahu i heuristický odhad jeho vzdálenosti od cíle H.
Každé cestě je přiřazen heuristický odhad délky F jako
součet ohodnocení jejích hran G a heuristické ohodnocení koncového
vrcholu H. F=G+H
Do prioritní fronty nejsou ukládány vrcholy grafu, ale cesty.
Nejvyšší prioritu má cesta s nejnižším heuristickým ohodnocením.
PB165 – Grafy a sítě 16/34
Příklad – A* algoritmus
Mapa silničního spojení měst
Hledání nejkratší cesty po silnici z města S do města C
Heuristický odhad z města X do cíle C =
přímá vzdálenost z vrcholu do cíle
S
C
A
B
D
E
F
G
H
I
1
2
3
1
2
1
1
1
3
2
1
2
2
PB165 – Grafy a sítě 17/34
Příklad – A* algoritmus
Mapa silničního spojení měst
Hledání nejkratší cesty po silnici z města S do města C
Heuristický odhad z města X do cíle C =
přímá vzdálenost z vrcholu do cíle
S
C
A
B
D
E
F
G
H
I
1
2
3
1
2
1
1
1
3
2
1
2
2
z S přes E přes H do C
PB165 – Grafy a sítě 18/34
A* algoritmus
Pro každý vrchol je uloženo, je-li již „uzavřen“ či nikoliv, tzn., byl-li již
navštíven, prozkoumán odebráním z fronty některé cesty v tomto
vrcholu končící.
Dijkstrův algoritmus lze použít také k nalezení cesty do jednoho vrcholu
grafu. Obvykle ale projde mnoho neperspektivních vrcholů – např. při
vyhledávání trasy v mapě jde i opačným směrem stejně daleko, jak
správným.
A* tyto vrcholy eliminuje pomocí heuristiky, je-li vhodně zvolena.
Časová složitost záleží na kvalitě zvolené heuristiky – nejhůře může být
exponenciální, nejlépe polynomiální, a to vůči délce optimální cesty.
Paměťová složitost může být v nejhorším případě také exponenciální –
existuje několik zlepšujících variant algoritmu.
Více informací v přednášce doc. Hliněného:
http://www.video.muni.cz/public/ITI/ITI2.avi
PB165 – Grafy a sítě 19/34
A* algoritmus – pseudokód
Označme počáteční vrchol s, koncový c.
Označ všechny vrcholy jako neuzavřené
Inicializuj prioritní frontu Q vrcholem (cestou) s
while Q = ∅ do
Odstraň cestu p z Q. Nechť x je její koncový vrchol
if x je uzavřený then
pokračuj další iterací
end if
if x = c then
Vrať cestu p jako výsledek
end if
Uzavři x
for all hrany (x, y) začínající v x do
Vlož do fronty cestu p + (x, y)
end for
end while
Vrať zprávu o neexistenci cesty
PB165 – Grafy a sítě 20/34
Bellman-Ford algoritmus
Stejně jako Dijkstrův algoritmus vypočítá vzdálenosti všech vrcholů
grafu z jednoho zdroje.
Základní strukturou podobný Dijkstrovu algoritmu.
Graf smí obsahovat i záporně ohodnocené hrany.
Cykly s celkovým záporným ohodnocením jsou algoritmem detekovány.
Namísto výběru hrany k relaxaci v každé iteraci relaxuje všechny hrany.
Vyšší časová složitost než Dijkstrův algoritmus – O(mn).
PB165 – Grafy a sítě 21/34
Bellman-Ford – příklad
Relaxované hrany v každém kroku jsou vyznačeny modře. Napravo od grafu je
vypsána délka nejkratších cest do vrcholů. V poslední (nezobrazené) iteraci již
nedojde k žádným změnám.
s
a
b
c
d
e
9
3
4 52
1
6
20
3
9
?
20
?
a
b
c
d
e
s
a
b
c
d
e
9
3
4 52
1
6
20
3
7
11
20
14
a
b
c
d
e
s
a
b
c
d
e
9
3
4 52
1
6
20
3
7
9
20
12
a
b
c
d
e
s
a
b
c
d
e
9
3
4 52
1
6
20
3
7
9
18
10
a
b
c
d
e
s
a
b
c
d
e
9
3
4 52
1
6
20
3
7
9
16
10
a
b
c
d
e
PB165 – Grafy a sítě 22/34
Bellman-Ford – animace/ilustrace výpočtu
komentovaná animace výpočtu (česky)
http://www.youtube.com/watch?v=LrYL6akqpHU
komentovaná animace výpočtu (anglicky)
http://www.csanimated.com/animation.php?t=Bellman-Ford_
algorithm
PB165 – Grafy a sítě 23/34
Bellman-Ford – pseudokód
Proměnné d[v] a p[v] mají stejný význam jako u Dijkstrova algoritmu. Počet
vrcholů grafu označme n.
d[s] ← 0; p[s] ← undef
for all vrcholy v grafu vyjma počátečního do
d[u] = ∞; p[u] =nedef.
end for
for i = 1 → n do
for all hrany (u, v) do
if d[v] > d[u] + w(u, v) then
d[v] ← d[u] + w(u, v), p[v] ← u
end if
end for
end for
for all hrany (u, v) do
if d[v] > d[u] + w(u, v) then
Chyba: graf obsahuje cyklus neg. váhy
end if
end for
PB165 – Grafy a sítě 24/34
Bellman-Ford – aplikace
Bellman-Ford algoritmus je používán v druhé třídě směrovacích
protokolů – distance-vector.
Namísto struktury celého grafu jsou mezi aktivními prvky přenášeny
jim známé vzdálenosti do ostatních aktivních prvků.
Každý aktivní prvek periodicky rozesílá tyto sobě známé vzdálenosti
k ostatním.
Obdrží-li aktivní prvek tabulku vzdáleností, provede relaxaci hran,
případně aktualizuje svoji směrovací tabulku a rozešle svým sousedům.
Distance-vector protokoly mají nižší výpočetní složitost než link-state
protokoly.
Nejznámějšími distance-vector protokoly jsou RIP, BGP, EGP.
PB165 – Grafy a sítě 25/34
Floyd-Warshallův algoritmus
Vypočítává nejkratší vzdálenost mezi všemi dvojicemi vrcholů v grafu.
Graf může obsahovat záporně ohodnocené hrany, cykly s celkovým
záporným ohodnocením vedou k chybnému řešení.
Mezi každými dvěma dvojicemi vrcholů postupně vylepšuje nejkratší
známou vzdálenost.
V každém kroku algoritmu je deﬁnována množina vrcholů, kterými je
možno nejkratší cesty vést.
Každou iterací je do této množiny přidán jeden vrchol.
V každé z n iterací jsou aktualizovány cesty mezi všemi n2 dvojicemi
vrcholů. Časová složitost algoritmu je tedy O(n3).
Paměťová složitost algoritmu je O(n2).
PB165 – Grafy a sítě 26/34
Floyd-Warshallův algoritmus – bližší popis
Nechť jsou vrcholy grafu očíslovány 1 . . . n.
Nejprve algoritmus uvažuje pouze hrany grafu. Následně prohledává
cesty procházející pouze vrcholem 1. Poté cesty procházející pouze
vrcholy 1, 2, atd.
Mezi každými dvěma vrcholy u, v je v (k + 1)-ní iteraci algoritmu
známa cesta využívající vrcholů 1 . . . k.
Pro nejkratší cestu mezi těmito vrcholy využívající vrcholů 1 . . . k + 1
jsou dvě možnosti:
Vede opět pouze po vrcholech 1 . . . k.
Vede po vrcholech 1 . . . k z u do vrcholu k + 1 a z něj poté do v.
Na konci výpočtu jsou známy nejkratší cesty využívající všech vrcholů
grafu.
PB165 – Grafy a sítě 27/34
Floyd-Warshallův algoritmus – pseudokód
V matici d na pozici d[i, j] je uložena
vypočtená vzdálenost vrcholů i, j.
Vstupem je graf v podobě matice sousednosti, kde jednotlivé prvky
značí ohodnocení hrany nebo ∞
for all k = 1 → n do
for all i = 1 → n do
for all j = 1 → n do
d[i, j] ← min(d[i, j], d[i, k] + d[k, j])
end for
end for
end for
PB165 – Grafy a sítě 28/34
Floyd-Warshallův algoritmus – příklad
Vrcholy, kterými mohou vést cesty, jsou vyznačeny. Matice udává nejkratší
nalezené vzdálenosti mezi dvojicemi vrcholů.
PB165 – Grafy a sítě 29/34
Distribuovaný Floyd-Warshall
Výhodou Floyd-Warshallova algoritmu je jeho snadná aplikace
v distribuovaném prostředí – mezi autonomními jednotkami, které si mohou
informace předávat jen pomocí zasílání zpráv po síti.
Každý vrchol grafu vypočítává nejkratší cesty do všech ostatních
vrcholů grafu.
Na začátku zná každý vrchol jen cestu do svých sousedů.
Stejně jako v sekvenční variantě algoritmu, každá iterace algoritmu
přidává jeden vrchol, kterým mohou procházet hledané nejkratší cesty.
Přidaný vrchol v každé iteraci rozešle svoji tabulku vzdáleností
ostatním vrcholům grafu.
Ostatní vrcholy pomocí své a přijaté tabulky aktualizují nejkratší cesty
do všech vrcholů.
PB165 – Grafy a sítě 30/34
Distribuovaný Floyd-Warshall – pseudokód
Algoritmus je spuštěn ve vrcholu u.
Inicializace:
d[u] ← 0; p[u] ← nedef
for all v ∈ V \{u} do
if Existuje hrana (u, v)
then
d[v] ← w(u, v);
p[v] ← u
else
d[v] ← ∞; p[v] ← nedef
end if
end for
Hlavní cyklus:
while nebyly vybrány všechny vrcholy do
Vyber doposud nevybraný vrchol v
if u = v then
Rozešli ostatním vrcholům pole d
else
Přijmi od vrcholu v jeho pole d
end if
for all w ∈ V do
d[w] ← min(d[w], d[v] + d [w])
uprav p[v]
end for
end while
PB165 – Grafy a sítě 31/34
Distribuovaný Floyd-Warshall
Pro správnost algoritmu je nutné, aby všechny výpočetní uzly (vrcholy
grafu) vybraly vždy stejný vrchol, který poté rozesílá svoji tabulku
vzdáleností.
Algoritmus je neefektivní z hlediska množství zasílaných dat. Pokud
v některém vrcholu platí d[v]= ∞ pro právě vybraný vrchol v, jeho
cesty se nijak neupraví a nemusí mu tedy být zasílána tabulka
vzdáleností tohoto vrcholu.
Před rozesláním tabulky vzdáleností se mohou vrcholy vzájemně
informovat, které mají obdržet tuto tabulku s výrazně nižšími nároky
na přenesená data ⇒ Touegův algoritmus.
Další informace:
Ajay D. Kshemkalyani, Mukesh Singhal. Distributed Computing:
Principles, Algorithms, and Systems. Cambridge University Press, 2008.
Str. 151-155
PB165 – Grafy a sítě 32/34
Cvičení
1 Na grafu níže vypočítejte nejkratší cesty použitím Dijkstrova,
Bellman-Fordova a Floyd-Warshallova algoritmu. V případě prvních
dvou použijte různé počáteční vrcholy.
2 Navrhněte způsob implementace nastíněného vylepšení
distribuovaného Floyd-Warshallova algoritmu. Uvažujte, že výpočetní
uzly mohou zasílat zprávy jen po hranách grafu (broadcasting je
implementován přeposíláním zpráv mezi uzly).
PB165 – Grafy a sítě 33/34
Cvičení
3 Proč nepracuje Dijkstrův algoritmus korektně na grafech obsahujících
záporně ohodnocené hrany? K jakým výsledkům může dojít, je-li na
takovém grafu spuštěn?
4 Nechť vstupem Bellman-Fordova algoritmu je graf, v němž každá
nejkratší cesta obsahuje nejvýše k hran. Navrhněte úpravu algoritmu
umožňující ukončit výpočet po k + 1 iteracích.
PB165 – Grafy a sítě 34/34