VÍTĚZSLAV ŠVEJDAR
LOGIKA
q
q
q
q
&b
¢¢
f
f

0
t
t
t
T T
q ¬q
¬q
q q
q q q q
q q q q q q q q
q q q q q q q q
q q q q
q q


}


}
&
&
&&b
&
&
&&b
¢
¢¢
¢
¢¢
¢
¢¢
¢
¢¢
¢
¢¢
¢
¢¢
f
ffw
f
ffw
f
ffw
f
ffw
f
ffw
f
ffw

0

0


0


0
t
tt
t
tt
t
t
t
t
t
t
T T T T T T T T
q q q q¬q ¬q ¬q ¬q
q q¬q ¬q
q ¬q
q
q
q ¬q

$$$$$$$$$$X
r
rrr
rr
 
 
 
¨¨¨¨¨¨B
d
d
ds
neúplnost, složitost a nutnost
Tento dokument ve formátu pdf pořídil a zpřístupnil autor knihy za podmínek,
které byly domluveny s nakladatelstvím Academia. Dokument nesmí být nijak
modiﬁkován a žádná jeho část nesmí být tisknuta.
Publikace vyšla s podporou Akademie věd České republiky
VitÏzslavävejdar
ACADEMIA
c Vítězslav Švejdar, 2002
ISBN 80-200-1005-X
Předmluva
V letech 1992–94 přednášel Petr Hájek logiku pro studenty informatiky na Matematicko-fyzikální
fakultě UK a já jsem vedl cvičení. K této výuce jsme napsali
učební text [32], který však byl velmi stručný a na desítkách míst se odvolával na
skripta P. Štěpánka [88]. Tehdy Petr nadhodil, že by bylo dobré všechny chybějící
důkazy vypracovat, a pořídit tak kompletní skripta či knihu. Protože jsem chtěl,
aby nějaký učební text doprovázel i kurs logiky, který učím na FF UK, rychle jsem
tuto myšlenku přijal za svou.
Tak vznikl projekt napsat společně knihu o logice, která je určena nikoliv čtenářům,
kteří se chtějí naučit logicky myslet, nýbrž čtenářům, kteří logicky myslet
už dávno umějí, a to zpravidla proto, že udělali nějakou zkušenost s univerzitní
matematikou. Zejména by měli mít určitou představu o teorii množin a o programování.
Rozumělo se přitom, že kniha položí důraz na ty části logiky, jejichž
výzkum má v pražském či středoevropském prostředí dobrou tradici, zejména na
problematiku Gödelových vět o neúplnosti a obecně metamatematiky teorií obsahujících
aritmetiku, na souvislosti logiky a teoretické informatiky a na (některé)
neklasické logiky.
Po více než pěti letech, když byl text už téměř hotov, Petr usoudil, že nemůže být
spoluautorem, neboť jeho podíl je příliš malý. To je formalistické stanovisko — Petr
sice fakticky napsal pouze oddíl 5.2 o Gödelově fuzzy logice, avšak podstatně větší
část a možná všechno inspiroval. Chci mu tedy alespoň co nejsrdečněji poděkovat
za jeho příspěvek, za stálou podporu a za všechna ta léta, kdy byl mým učitelem.
Za cenné poznámky k textu chci poděkovat kolegům, studentům a přátelům
Tomáši Auerovi, Kamile Bendové, Radku Honzíkovi, Petru Jansovi, Petru Jirků,
Janu Krajíčkovi, Ladislavu Nebeskému, Michalu Pelišovi, Petru Savickému, Jiřímu
Sgallovi, Haně Skřivanové, Jiřímu Vaňkovi a Martě Vlasákové. Mnoha dalším studentům
děkuji za podnětné poznámky a otázky, které kladli při mých hodinách.
Za zájem a podporu děkuji Pavlu Pudlákovi, Petru Štěpánkovi a Petru Vojtášovi.
Zvlášť chci poděkovat Janu Štěpánkovi, který velkou část textu přepsal na počítači
a měl přitom užitečné připomínky, a Emilu Jeřábkovi, který odhalil řadu závad
v přípravných verzích.
Děkuji také Grantové agentuře UK, která grantem podpořila přípravu knihy,
Ediční radě AV ČR, která dotovala její vydání, a Vladimíru Petkevičovi, který
ﬁnální text v krátké době přečetl a měl užitečné poznámky k využívání a zneužívání
6 Předmluva
češtiny. Nakonec a především děkuji své rodině. Haně za zázemí, které mi vytvářela,
a za rady a poznámky, které mi byly mnohokrát užitečné v pedagogické práci,
a dcerám Idě a Sylvě za to, že mi občas připomněly, jak některé věci vypadají
z pohledu studenta.
Vítězslav Švejdar, březen 2002
Obsah
Úvod 9
1 Výroková logika 13
1.1 Formule a sémantika výrokové logiky . . . . . . . . . . . . . . . . . . 13
1.2 Věta o kompaktnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.3 Hilbertovský výrokový kalkulus . . . . . . . . . . . . . . . . . . . . . 28
1.4 Gentzenovský výrokový kalkulus . . . . . . . . . . . . . . . . . . . . 40
2 Algoritmy a úlohy 49
2.1 Programování v jazyce RASP . . . . . . . . . . . . . . . . . . . . . . 52
2.2 Základní pojmy z teorie rekurzívních funkcí . . . . . . . . . . . . . . 82
2.3 Pár slov o výpočtové složitosti . . . . . . . . . . . . . . . . . . . . . 113
3 Predikátová logika 137
3.1 Formule a sémantika predikátové logiky . . . . . . . . . . . . . . . . 137
3.1.1 Jazyky, termy a formule . . . . . . . . . . . . . . . . . . . . . 137
3.1.2 Struktury . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
3.1.3 Substituce, důsledek, logicky platné formule . . . . . . . . . . 145
3.2 Hilbertovský predikátový kalkulus . . . . . . . . . . . . . . . . . . . 156
3.2.1 Korektnost a úplnost . . . . . . . . . . . . . . . . . . . . . . . 156
3.2.2 Příklady důkazů a teorií . . . . . . . . . . . . . . . . . . . . . 170
3.3 Gentzenovský predikátový kalkulus . . . . . . . . . . . . . . . . . . . 182
3.4 Vlastnosti modelů a teorií . . . . . . . . . . . . . . . . . . . . . . . . 205
3.5 Eliminace kvantiﬁkátorů . . . . . . . . . . . . . . . . . . . . . . . . . 228
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost . . . . . . . . . 256
4 Peanova a Robinsonova aritmetika 275
4.1 Axiomy a modely . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
4.2 Aritmetizace logické syntaxe . . . . . . . . . . . . . . . . . . . . . . . 291
4.3 Hierarchie aritmetických formulí . . . . . . . . . . . . . . . . . . . . 309
4.4 Σ-úplnost Robinsonovy aritmetiky . . . . . . . . . . . . . . . . . . . 322
4.5 Autoreference, Druhá Gödelova věta . . . . . . . . . . . . . . . . . . 347
8 Obsah
5 Některé neklasické logiky 365
5.1 Intuicionistická logika . . . . . . . . . . . . . . . . . . . . . . . . . . 365
5.1.1 Sémantika intuicionistické výrokové logiky . . . . . . . . . . . 368
5.1.2 Rozhodnutelnost, úplnost, složitost . . . . . . . . . . . . . . . 371
5.1.3 Sémantika intuicionistické predikátové logiky . . . . . . . . . 383
5.2 Gödelova fuzzy logika (napsal Petr Hájek) . . . . . . . . . . . . . . . 395
5.2.1 Gödelova výroková fuzzy logika . . . . . . . . . . . . . . . . . 396
5.2.2 Gödelova predikátová fuzzy logika . . . . . . . . . . . . . . . 405
5.3 Logika dokazatelnosti . . . . . . . . . . . . . . . . . . . . . . . . . . 415
5.3.1 Modální formule, aritmetická sémantika . . . . . . . . . . . . 417
5.3.2 Logické kalkuly . . . . . . . . . . . . . . . . . . . . . . . . . . 420
5.3.3 Kripkovská sémantika . . . . . . . . . . . . . . . . . . . . . . 426
5.3.4 Některé aplikace v metamatematice . . . . . . . . . . . . . . 434
5.3.5 Aritmetická úplnost . . . . . . . . . . . . . . . . . . . . . . . 438
Literatura 447
Rejstřík 453
Úvod
The reader (. . . ) learns the language of say predicate logic in much the same way
as the notion of polynomial; he is not tempted to that misplaced pedantry which led
to the odd idea that logic is the hygiene of mathematics (. . . ).
(G. Kreisel, J. L. Krivine v [51])
V matematice jsou velmi často užívány symbolické zápisy. Mohou označovat výroky,
například ∀x∀y(x · y = y · x), vlastnosti objektů, například ∃v(v2
= x), nebo
vztahy mezi objekty, například x ∈ y. Lze říci, že jejich užití je všeobecné a pro
matematiku typické. Zdaleka to však neznamená, že se vyskytují jen v matematice.
Symbolické zápisy výroků, vlastností a vztahů mezi objekty budeme nazývat
formulemi.
Uvažujme nyní těchto pět formulí (axiomů):
Ax1: ∀x∀y(x ≤ y ≡ ∃v(v + x = y)),
Ax2: ∀x∀y∀z(x + z ≤ y + z → x ≤ y),
Ax3: ∀x∀y∀z((x + y) + z = x + (y + z)),
Ax4: ∀x∀y(x · y ≤ x & x · y ≤ y),
Ax5: ∀x∀y∀z(z ≤ x & z ≤ y → z ≤ x · y),
a položme si otázku, zda z uvedených formulí vyplývá následující formule D
∀a∀b∀c((a + c) · (b + c) ≤ (a · b) + c),
tj. zda formule D je důsledkem axiomů Ax1–Ax5. Na první pohled by se mohlo zdát,
že než se na tuto otázku pokusíme odpovědět, musíme vědět, o čem se mluví (zda
například o číslech nebo o jiných objektech) a jaký význam mají symboly +, · a ≤
vyskytující se v našich formulích. Pak budeme moci rozhodnout o pravdivosti všech
formulí. Například o formulích Ax1–Ax3 lze říci, že platí v oboru nezáporných čísel,
pokud symboly + a ≤ mají obvyklý význam. Formule D by platila, kdyby + a ·
označovalo operace spojení a průsek v nějaké booleovské algebře. Každá z operací
10 Úvod
spojení a průsek je totiž v každé booleovské algebře distributivní vůči druhé. V tom
případě by platily i formule Ax1 a Ax3–Ax5, ale neplatila by formule Ax2.
Na otázku, zda D vyplývá z Ax1–Ax5, lze ve skutečnosti odpovědět kladně i
bez informace, o čem se mluví a jaký význam mají symboly +, · a ≤. Formuli D
lze totiž z formulí Ax1–Ax5 odvodit následující úvahou:
Nechť a, b a c jsou dány. Pišme d místo (a + c) · (b + c). Máme ověřit, že
d ≤ (a · b) + c. K c lze něco přičíst zleva (totiž a) tak, aby výsledek byl a + c.
Z předpokladu Ax1 tedy plyne c ≤ a+c. Ze stejného důvodu platí také c ≤ b+c.
V tom případě ale vzhledem k Ax5 platí c ≤ d. Použijme nyní Ax1 ve směru
zleva doprava: existuje q takové, že q+c = d. Podle Ax4 použitého na x := a+c
a y := b + c platí q + c ≤ a + c a q + c ≤ b + c. Teď použijme Ax2: máme
q ≤ a a q ≤ b. Ax5 dává q ≤ a · b. To je téměř to, co jsme potřebovali, neboť
Ax1 a Ax3 dávají q + c ≤ a · b + c a q + c je d.
Místo odvození se také říká důkaz. Čtenář se při svém studiu matematiky jistě už
setkal s větším množstvím důkazů více nebo méně podobných našemu příkladu.
S trochou nadsázky můžeme říci, že matematika se neskládá z ničeho jiného než
z důkazů.
Přestože zdůrazňujeme, že naše formule D vyplývá z Ax1–Ax5 bez ohledu na
význam symbolů +, · a ≤, prozraďme, kde má náš příklad původ. Všechny předpoklady
Ax1–Ax5 platí v oboru nenulových přirozených (případně celých) čísel, pokud
+ znamená násobení a x·y je největší společný dělitel čísel x a y. V tom případě ≤
musí znamenat relaci dělitelnosti (Ax1 je vlastně její deﬁnice) a formule D vyjadřuje
ne zcela triviální fakt, totiž víceméně to, že v oboru přirozených nebo celých
čísel pro operace největší společný dělitel a násobení platí distributivní pravidlo.
Intuitivně je téměř jasné, jaká posloupnost symbolů je a jaká není formulí, čili
jaká posloupnost symbolů je správně utvořeným zápisem nějakého vztahu mezi
objekty či správně utvořeným zápisem nějakého (pravdivého nebo nepravdivého)
výroku. Není překvapivé, že na této intuici lze založit formální deﬁnici syntakticky
správné formule. Lze něco podobného jako o formulích říci i o důkazech, tj.
• Lze formálně deﬁnovat pojem důkazu?
Uvidíme, že odpověď na tuto otázku je ANO. To se může zdát překvapivé, víme
přece, že nalézt důkaz určitého tvrzení často vyžaduje značnou dávku invence a
nelze předem říci, jaké obraty budou v onom důkazu použity. Přesto je tomu tak;
ukazuje se, že všechny dosud vytvořené důkazy vyhovují deﬁnici, která se skládá
z několika jednoduchých pravidel. Tento fakt lze pokládat za důležitý objev a
úspěch logiky.
Formální deﬁnice formule a důkazu umožňuje s formulemi a důkazy zacházet
jako s matematickými objekty, to znamená řešit problémy, které se jich týkají, a
dokazovat o nich tvrzení. Představme si například, že máme odpovědět na otázku,
zda existuje důkaz nějakého konkrétního tvrzení z nějaké dané množiny předpokladů.
Tvrdíme-li, že ano, můžeme se případně obejít bez jakékoliv logické teorie
Úvod 11
a důkaz prostě napsat. Čtenář si to může vyzkoušet na tomto cvičení: formule
∀a∀b∀c((a · b) + c ≤ (a + c) · (b + c)) a ∀a∀b∀c(a ≤ b & b ≤ c → a ≤ c)
jsou také odvoditelné z našich předpokladů Ax1–Ax5. Teorie pracující s pojmem
formálního důkazu a obsahující jeho přesnou deﬁnici je ale nezbytná, tvrdíme-li,
že ne, dané tvrzení není dokazatelné z dané množiny předpokladů. Pěkným příkladem
tohoto druhu je tvrzení známé jako hypotéza kontinua: každá nespočetná
podmnožina množiny R všech reálných čísel má tutéž mohutnost, jako celá množina
R. Po mnoho desetiletí selhávaly všechny pokusy dokázat hypotézu kontinua
z axiomů teorie množin a otázka, zda takový důkaz existuje, byla velmi známým
otevřeným problémem. Až v roce 1963 dokázal P. Cohen, že odpověď na tuto
otázku je negativní, hypotézu kontinua z axiomů teorie množin dokázat nelze.1
Deﬁnice důkazu spolu s faktem, že formule a důkazy jsou dosti konkrétními
objekty, skládajícími se ze znaků, umožňují kromě otázek o dokazatelnosti jednotlivých
formulí položit také otázky týkající se množin důkazů nebo množin formulí:
• Existuje algoritmus, který pro danou posloupnost znaků rozhodne, zda je nebo
není důkazem z daných předpokladů?
Každá posloupnost symbolů vyhovující deﬁnici důkazu je důkazem a zdůraznili
jsme, že důkaz je důkazem bez ohledu na význam symbolů v něm obsažených.
To znamená, že typickou odpovědí na tuto otázku je ANO. Přesněji, odpověď
je ANO za podmínky, že existuje algoritmus schopný rozhodovat o tom, co je a
co není předpokladem, tj. za podmínky, že množina předpokladů je algoritmicky
rozhodnutelná. Tato podmínka je ovšem automaticky splněna ve všech případech,
kdy množina předpokladů je konečná. Domyšleno trochu dále, odpověď ANO na
naši otázku znamená, že kdybychom autora jakéhokoliv důkazu přinutili napsat jeho
důkaz dostatečně podrobně, mohl by pak správnost důkazu zkontrolovat počítač.
Zkontrolovat správnost již existujícího důkazu může být užitečné, ale v době,
kdy důkaz ještě nemáme, bychom jistě velice uvítali informaci, zda hledaný důkaz
existuje. Uvidíme, že na otázky
• Existuje algoritmus, který pro danou formuli rozhodne, zda je nebo není dokazatelná
z daných předpokladů?
• Existuje algoritmus, který pro danou formuli rozhodne, zda platí v určitém
konkrétním oboru, například v oboru reálných čísel nebo v oboru přirozených
čísel?
neexistuje žádná typická odpověď. Pro některé množiny předpokladů nebo číselné
(nebo jiné) obory je odpověď ANO a pro jiné NE.
Odpověď ANO na otázku po algoritmické rozhodnutelnosti znamená, že máme
algoritmus, který správně vyřeší všechny instance dané úlohy. Odpověď NE však
znamená víc než to, že jej nemáme. Nemáme jej z dobrého důvodu, totiž proto,
1Za předpokladu, že existuje vůbec nějaké tvrzení, které nelze z axiomů teorie množin dokázat.
12 Úvod
že neexistuje. Ve 30. letech dvacátého století, tedy dříve, než byly vyvinuty elektronické
počítače, vznikly teoretické modely počítačů a o některých úlohách vyskytujících
se v logice bylo skutečně dokázáno, že nejsou algoritmicky rozhodnutelné.
Od té doby logika úzce souvisí s teoretickou informatikou. Mezi pojmy algoritmus,
výpočet a důkaz existují četné analogie, algoritmicky zajímavé úlohy často vznikají
právě v logice a logické metody se naopak uplatňují v informatice. Jsme přesvědčeni,
že pojem algoritmu dnes patří spolu s pojmy důkaz a důsledek k základním
logickým pojmům.
Úmluva, že s formulemi a důkazy zacházíme jako s čísly, funkcemi, množinami
a ostatními matematickými objekty a v úvahách o nich užíváme matematické prostředky,
na první pohled nebudí žádné podezření. Už v kapitole 1 se ale čtenář
možná pozastaví nad důkazem věty o kompaktnosti ve výrokové logice, ve kterém
použijeme topologické pojmy a vlastně i Tichonovovu větu o kartézském součinu
topologických prostorů. Čtenáře by mohlo napadnout, že než si dovolíme užívat
metod teorie množin při studiu konkrétních objektů, měli bychom teorii množin
prozkoumat hlouběji a nezpochybnitelným způsobem prokázat oprávněnost jejích
prostředků. Případně bychom to mohli udělat ve více krocích: v každém kroku
bychom pomocí prostředků, o kterých dosud víme, že jsou oprávněné a nezpochybnitelné,
prokázali správnost, oprávněnost a nezpochybnitelnost dalších prostředků,
které by pak bylo dovoleno užívat v příštím kroku. Toto je zhruba obsah tzv.
Hilbertova programu (budování matematiky a logiky). V kapitole 4 se seznámíme
s Gödelovými větami o neúplnosti, z nichž slavnou Druhou větu o neúplnosti interpretujeme
tak, že Hilbertův program je neproveditelný. Z matematických metod
nelze vydělit ty, které jsou ﬁnitní, tj. nezpochybnitelné a nezávislé na formálních teoriích.
Teorie množin nebo některá jiná formální teorie nutně hraje v logice dvojakou
roli: poskytuje prostředky k výzkumu logických objektů, tedy i formálních teorií,
a zároveň jako formální teorie je předmětem výzkumu.
• Lze se v důkazech tvrzení o konkrétních objektech, jako jsou formule, důkazy
nebo počítačové programy, vždy obejít bez náročnějších a abstraktnějších pojmů
a prostředků, jako jsou funkce na nekonečných množinách, prostory různého
druhu nebo třeba ordinální indukce či ordinální rekurze?
Odpověď na tuto poněkud vágní otázku tedy zní NE.
Bohužel, chtělo by se dodat. Má ale dobrý smysl říci bohužel, když se nepodařilo
udělat něco, co udělat nelze?
V kapitole 4 a v oddílu 5.3 uvidíme, že Gödelovy věty o neúplnosti lze chápat
také pozitivně, tj. jako něco, co lze hlouběji prozkoumat a osvětlit a co může sloužit
jako nástroj k řešení problémů.
Takže formule, důkazy, důsledek, úlohy a algoritmy. To, co vypadá jako rozumný
plán výzkumu, nemusí být vždy také proveditelné a někdy lze dokázat, že
proveditelné není. A netýká se to jen Hilbertova programu. O tom to všechno bude.
1
Výroková logika
Všechny důležité matematické věty mají tvar ekvivalence. (J. Krajíček)
Nebo jsou to spodní odhady. (J. Sgall)
1.1 Formule a sémantika výrokové logiky
V příkladu obsaženém v úvodu jsme viděli, že v symbolických zápisech výroků,
vlastností a vztahů se uplatňují symboly několikerého druhu: symboly pro relace
mezi objekty a pro operace s objekty (například ≤ a +), proměnné x, y, . . . ,
pomocné symboly, totiž závorky, a konečně logické symboly, které můžeme rozdělit
na logické spojky (&, ∨, → a ¬) a kvantiﬁkátory (∀ a ∃). Složitější formule jsou
sestaveny z jednodušších pomocí logických spojek a kvantiﬁkátorů. V této kapitole
se zabýváme výrokovou logikou, ve které se z logických symbolů uvažují pouze
logické spojky. Kvantiﬁkátory se ignorují spolu se vším, co k nim patří. Formule
začínající kvantiﬁkátorem a také formule jako v·v ≤ x, jež neobsahují žádné logické
symboly, se ve výrokové logice považují za dále nedělitelné. Složitější výrokové
formule jsou tedy sestaveny z jednodušších pomocí logických spojek.
Předpokládejme, že jsme pevně zvolili neprázdnou množinu symbolů At neobsahující
žádný ze šesti symbolů (, ), &, ∨, →, ¬. Prvkům množiny At říkejme výrokové
atomy nebo jen atomy. Následující deﬁnice říká, které z výrazů sestavených z prvků
množiny At ∪ {(, ), &, ∨, →, ¬} jsou výrokovými formulemi.
Deﬁnice 1.1.1 Množina všech výrokových formulí je nejmenší množina výrazů
splňující podmínky
◦ každý výrokový atom je výroková formule,
◦ je-li ϕ výroková formule, pak ¬ϕ je výroková formule,
◦ jsou-li ϕ a ψ výrokové formule, pak (ϕ & ψ), (ϕ ∨ ψ) a (ϕ → ψ) jsou výrokové
formule.
14 1 Výroková logika
Jsou-li p, q a r výrokové atomy, pak ((p∨¬q)→r), dále ¬(p&¬p) a ovšem také
p a ¬p jsou příklady výrokových formulí. Výrazy
¬(p), p & ¬q, p ∨ q → r
podle naší deﬁnice výrokovými formulemi nejsou, ale přinejmenším druhý a třetí
z nich posuzujme shovívavě. Domluvme se, že úplně vnější pár závorek je povoleno
vypouštět, a dále, že spojkám & a ∨ přisuzujeme vyšší prioritu než spojce →.
Výraz p ∨ q → r je tedy přípustný zápis pro výrokovou formuli ((p ∨ q) → r).
Formule označujeme malými řeckými písmeny nebo velkými latinskými písmeny
ze začátku abecedy. Množiny formulí označujeme velkými latinskými písmeny T,
S, T1, . . . nebo velkými řeckými písmeny.
Spojky &, ∨, → a ¬ nazýváme konjunkce, disjunkce, implikace a negace. Formule
ϕ & ψ, ϕ ∨ ψ, ϕ → ψ, ¬ϕ čteme „ϕ a ψ (případně „ϕ et ψ ), „ϕ nebo ψ
(případně „ϕ vel ψ ), „pokud ϕ, pak ψ (případně „ϕ implikuje ψ nebo neutrálně
„ϕ šipka ψ ) a „non ϕ (případně „není pravda, že ϕ nebo „ne ϕ ). V literatuře
se vyskytují i jiné značky pro logické spojky: ∧ pro konjunkci, | pro disjunkci,  ¡
nebo ⇒ pro implikaci, ∼ pro negaci.
Termíny konjunkce, disjunkce, implikace a negace vztahujeme nejen na samotné
logické spojky, ale i na formule, které jsou z nich utvořeny. Říkáme například, že
formule ¬ϕ je negací formule ϕ. Má-li formule χ tvar ϕ→ψ, pak formuli ϕ nazýváme
premisou a formuli ψ závěrem implikace χ.
Deﬁnice 1.1.2 Pravdivostní ohodnocení je každá funkce v z množiny všech výrokových
formulí do množiny {0, 1}, která pro libovolné formule ϕ a ψ splňuje
podmínky
◦ v(ϕ & ψ) = 1, právě když v(ϕ) = 1 a v(ψ) = 1,
◦ v(ϕ ∨ ψ) = 1, právě když v(ϕ) = 1 nebo v(ψ) = 1,
◦ v(ϕ → ψ) = 1, právě když v(ϕ) = 0 nebo v(ψ) = 1,
◦ v(¬ϕ) = 1, právě když v(ϕ) = 0.
Zápis v(ϕ) = 1 čteme „formule ϕ je splněna (pravdivostním) ohodnocením v nebo
„(ohodnocení) v splňuje formuli ϕ . Místo v(ϕ) = 1 se někdy píše také v |= ϕ.
Sémantika klasické výrokové logiky je založena na představě, že každému výroku
lze přisoudit právě jednu ze dvou pravdivostních hodnot 1 a 0. Hodnota 1 reprezentuje
pravdu, 0 nepravdu. Podmínky v deﬁnici 1.1.2 určují, jak souvisí pravdivost
výrokové formule s pravdivostí jejích komponent. Lze je schematicky znázornit
následujícími tabulkami:
& 1 0
1 1 0
0 0 0
∨ 1 0
1 1 1
0 1 0
→ 1 0
1 1 0
0 1 1
¬
1 0
0 1 ,
1.1 Formule a sémantika výrokové logiky 15
kterým říkáme pravdivostní tabulky logických spojek. K tabulce implikace pro jistotu
poznamenejme, že řádky se vztahují k premise a sloupce k závěru implikace,
tj. že v(ϕ→ψ) = 1 platí právě (pouze) tehdy, platí-li současně v(ϕ) = 1 a v(ψ) = 0. E
Z tabulky disjunkce je zřejmé, že spojku „nebo chápeme v obvyklém, tj. nevylučovacím
smyslu: disjunkce ϕ ∨ ψ je nějakým ohodnocením v splněna i v případě,
kdy jsou jím splněny obě formule ϕ a ψ.
Příklad 1.1.3 Je-li ϕ formule (¬p ∨ q) & (¬p → q) a v je ohodnocení takové, že
v(p) = v(q) = 0, pak platí v(¬p) = 1 a v(¬p → q) = 0, a tedy v(ϕ) = 0.
Každé pravdivostní ohodnocení je jednoznačně určeno svými hodnotami na výrokových
atomech, a ty mohou být voleny libovolně a navzájem nezávisle. Někdy
se pravdivostní ohodnocení deﬁnuje trochu jinak než v 1.1.2, totiž jako libovolná
funkce z množiny At všech výrokových atomů do {0, 1}. Pravdivostní tabulky
pak jednoznačně určují rozšíření v libovolného ohodnocení v na všechny výrokové
formule. Je zřejmé, že takováto deﬁnice se od naší liší jen nepodstatně.
O některých formulích lze říci, že jsou automaticky pravdivé, tj. pravdivé díky
své logické struktuře. Říká se také, že jsou logicky platné. Ve výrokové logice
takovým formulím říkáme tautologie.
Deﬁnice 1.1.4 Řekneme, že výroková formule ϕ je splnitelná, jestliže existuje
pravdivostní ohodnocení v takové, že v(ϕ) = 1. Formule ϕ je tautologie, jestliže
v(ϕ) = 1 pro každé pravdivostní ohodnocení v. Množinu všech splnitelných výrokových
formulí a množinu všech tautologií značíme Sat resp. Taut.
Příklad 1.1.5 V příkladu 1.1.3 je uvedena formule ϕ a pravdivostní ohodnocení v
takové, že v(ϕ) = 0. Formule ϕ tedy není tautologie. Pro libovolné ohodnocení v
takové, že v(p) = 0 a v(q) = 1, platí v(ϕ) = 1. Formule ϕ je tedy splnitelná.
Slovem „libovolné v předchozím příkladu chceme zdůraznit, že pravdivostní
ohodnocení je deﬁnováno na množině všech výrokových formulí, tj. je deﬁnováno
i na atomech jiných než p a q, a může tedy existovat mnoho (dokonce nespočetně
mnoho, je-li množina At všech výrokových atomů nekonečná) ohodnocení v s vlastností
v(p) = 0 a v(q) = 1. Je ale zřejmé, že pravdivostní hodnota v(ϕ) závisí
na ohodnocení jen těch atomů, které se ve ϕ vyskytují. Chceme-li určit, zda nějaká
formule je tautologie, stačí probrat všechny funkce z F do {0, 1}, kde F je
(konečná!) množina všech výrokových atomů, které se vyskytují v dané formuli.
Ukažme si postup na formuli B = ¬(p ∨ q → p & r) → (r → q). Množina F všech
atomů vyskytujících se v B má v našem případě tři prvky a všech funkcí z F
do {0, 1} je osm. Označme C formuli p ∨ q → p & r a utvořme tabulku jako na obrázku
1.1.1. V záhlaví tabulky jsou všechny podformule formule B a v prvních třech
sloupcích jsou všechny možnosti, jak lze přiřadit pravdivostní hodnoty atomům p,
q a r. Řádky tabulky odpovídají pravdivostním ohodnocením a pravdivostní tabulky
logických spojek jednoznačně určují, jak v daném řádku na základě prvních
tří hodnot stanovit pravdivostní hodnoty ostatních (neatomických) formulí. Pro
16 1 Výroková logika
p q r r → q p ∨ q p & r C ¬C ¬C → (r → q)
1 1 1 1 1
1 1 0 1 1
1 0 1 0 1 1 1 0 1
1 0 0 1 1
0 1 1 1 1
0 1 0 1 1
0 0 1 0 0 0 1 0 1
0 0 0 1 1
Obrázek 1.1.1: Tabulková metoda
přehlednost jsme nepodstatné hodnoty ponechali nevyplněné. Ve všech případech,
kdy v(q) = 1 nebo v(r) = 0, platí v(r → q) = 1, a tedy v(B) = 1 bez ohledu na
hodnotu v(¬C). A ve zbývajících dvou případech rovněž platí v(B) = 1 díky tomu,
že v(¬C) = 0. Zjistili jsme, že formule B je tautologie. Při určování pravdivostních
hodnot jsme ovšem mohli postupovat čistě mechanicky, čili systematicky vyplnit
všechny hodnoty v tabulce bez úvah o tom, které jsou a které nejsou podstatné.
Právě popsaný postup, kterým lze zjistit, zda daná formule je nebo není tautologií
nebo splnitelnou formulí, se nazývá tabulková metoda. Díky ní můžeme říci,
že problém určit, zda daná formule je tautologie, je algoritmicky rozhodnutelný.
Tabulková metoda ale není příliš efektivním algoritmem. Vyskytuje-li se v dané
formuli n výrokových atomů, příslušná tabulka má 2n
řádků. Velikost pravdivostní
tabulky formule, která se vejde do jediného řádku, může značně přesáhnout velikost
průměrné knihy!
Deﬁnice 1.1.6 Řekneme, že výroková formule ϕ je (tautologickým) důsledkem
množiny formulí T nebo že ϕ vyplývá z T, a píšeme T |= ϕ, jestliže ϕ má pravdivostní
hodnotu 1 při každém pravdivostním ohodnocení v, které přiřazuje hodnotu 1
všem formulím v T. Symbolicky:
T |= ϕ ⇔ ∀v(∀ψ ∈ T(v(ψ) = 1) ⇒ v(ϕ) = 1).
O množině T v této souvislosti mluvíme jako o množině předpokladů nebo o množině
axiomů. Formule ϕ je důsledkem formule ψ, jestliže {ψ} |= ϕ. Formule ϕ a ψ
jsou ekvivalentní, jestliže ϕ je důsledkem ψ a zároveň ψ je důsledkem ϕ.
Znaménko |= jsme již dříve použili v jiném významu. V kontextu v |= ϕ vlevo
od |= stojí pravdivostní ohodnocení a zápis znamená, že ono ohodnocení splňuje
formuli ϕ. V kontextu T |= ϕ vlevo stojí množina formulí a znaménko |= znamená
důsledek. Mohlo by se zdát, že kolizi bychom se mohli vyhnout tak, že
znaménko |= bychom vyhradili pouze pro vztah důsledku a místo v |= ϕ bychom
vždy psali v(ϕ) = 1. Ve výrokové logice je to asi pravda, ale se znaménkem |= budeme
pracovat i v predikátové logice a tam je jeho užití ve více významech natolik
rozšířené, že je asi měnit nelze.
1.1 Formule a sémantika výrokové logiky 17
Příklad 1.1.7 Předpokládejme, že množina At všech výrokových atomů je nekonečná
spočetná, At = {p0, p1, p2, . . . }, položme T = {pn→pm; n < m} a uvažujme,
které formule tvaru pn → pm vyplývají z T. Když n < m, pak pn → pm vyplývá
z T; je zřejmé, že každý prvek jakékoliv množiny T vyplývá z T. Když n = m, pak
pn →pm také vyplývá z T, neboť má pravdivostní hodnotu 1 při každém pravdivostním
ohodnocení, které přiřazuje hodnotu 1 všem prvkům z T (a při každém jiném
pravdivostním ohodnocení ovšem také). Když n > m, pak pravdivostní ohodnocení
v, pro které platí v(pi) = 0 pro i ≤ m, a v(pi) = 1 pro i > m, splňuje všechny
formule v T, ale nesplňuje formuli pn → pm. Formule pn → pm tedy pro n > m
nevyplývá z T.
Věta 1.1.8 (a) T ∪ {ψ} |= ϕ, právě když T |= ψ → ϕ.
(b) Je-li T konečná, pak T |= ϕ, právě když { T} |= ϕ, kde T je konjunkce
všech formulí v T (v libovolném pořadí).
(c) ∅ |= ϕ, právě když ϕ je tautologie.
(d) Formule ϕ a ψ jsou ekvivalentní, právě když pro každé pravdivostní ohodnocení
v platí v(ϕ) = v(ψ).
Důkaz ponecháváme za cvičení.
Z tvrzení (a)–(c) plyne, že je-li T konečná, pak T |= ϕ, právě když T → ϕ
je tautologie. To znamená, že úloha, zda daná formule vyplývá z dané konečné
množiny předpokladů, je algoritmicky rozhodnutelná a k jejímu řešení lze užít tabulkovou
metodu.
Snadno lze ověřit, že každé dvě formule umístěné ve stejném řádku následující
tabulky jsou spolu ekvivalentní (pro každou volbu formulí A, B a C):
A ∨ (B ∨ C) (A ∨ B) ∨ C asociativní zákony
A & (B & C) (A & B) & C . . .
A ∨ (B & C) (A ∨ B) & (A ∨ C) distributivní zákony
A & (B ∨ C) (A & B) ∨ (A & C) . . .
¬(A & B) ¬A ∨ ¬B de Morganovy zákony
¬(A ∨ B) ¬A & ¬B . . .
¬¬A A zákon dvojné negace.
V posledním sloupci je u každé ekvivalence uveden tradiční název. A když už jsme
u vyjmenovávání tradičních „zákonů : ¬(A & ¬A) (přesněji řečeno fakt, že každá
formule tohoto tvaru je tautologií) se nazývá zákon sporu a A ∨ ¬A se nazývá
princip vyloučeného třetího (lze se setkat i s latinským názvem tertium non datur).
Domluvme se, že vzhledem k platnosti asociativního zákona budeme často vypouštět
závorky ve výrazech obsahujících několik konjunkcí nebo několik disjunkcí
za sebou a například místo A ∨ ((B ∨ C) ∨ D) budeme psát jen A ∨ B ∨ C ∨ D.
18 1 Výroková logika
Nazvěme literálem každou formuli tvaru p nebo ¬p, kde p je výrokový atom.
Disjunkce několika literálů se nazývá klauzule. Řekneme, že formule A je v konjunktivním
normálním tvaru, jestliže A je konjunkcí klauzulí. Formule A je naopak
v disjunktivním normálním tvaru, jestliže A je disjunkcí formulí, z nichž každá je
konjunkcí literálů.
Příklad 1.1.9 Formule p i ¬p ∨ q jsou klauzule, takže formule p & (¬p ∨ q) je
v konjunktivním normálním tvaru. Formule ¬p∨¬q∨r je (jednočlennou) konjunkcí
klauzulí a zároveň je disjunkcí tří (jednočlenných) konjunkcí literálů. Je to tedy
formule, která je jak v konjunktivním, tak v disjunktivním normálním tvaru.
Věta 1.1.10 Každá výroková formule je ekvivalentní s jistou formulí, která je v disjunktivním
normálním tvaru, a také s jistou formulí, která je v konjunktivním normálním
tvaru.
Důkaz Dokážeme indukcí podle počtu výskytů logických spojek v A, že libovolná
formule A je ekvivalentní s nějakou formulí v disjunktivním a také s nějakou (jinou)
formulí v konjunktivním normálním tvaru. Když A neobsahuje logické spojky, pak
A je atomem, a tedy formulí v konjunktivním i v disjunktivním normálním tvaru.
Není-li A atomem, pak A je tvaru ¬B, B∨C, B&C nebo B→C. Probereme všechny
čtyři případy. Každá z formulí B, C obsahuje méně logických spojek než A, a dle
indukčního předpokladu je tedy každá z nich ekvivalentní s formulí v konjunktivním
i s formulí v disjunktivním normálním tvaru. Existují tedy klauzule E1, . . , En,
En+1, . . , En+m a formule v disjunktivním normálním tvaru D takové, že B je
ekvivalentní s E1 & . . & En, dále C je ekvivalentní s En+1 & . . & En+m a konečně
B je ekvivalentní s D.
Utvořme z D formuli D tak, že navzájem zaměníme konjunkce a disjunkce, odstraníme
všechny negace, a naopak připíšeme negaci ke každému atomu, který ji
dosud neměl. Je zřejmé, že při každém pravdivostním ohodnocení mají D a D
opačné pravdivostní hodnoty. Protože D je ekvivalentní s B, znamená to, že D
je ekvivalentní s ¬B. Navíc D je konjunkcí klauzulí. Dokázali jsme, že ¬B je
ekvivalentní s nějakou formulí v konjunktivním normálním tvaru.
Nechť A je tvaru B & C. Pak A je ekvivalentní s formulí
E1 & . . & En & En+1 & . . & En+m,
která je v konjunktivním normálním tvaru.
Nechť A je tvaru B ∨ C. Pak A je ekvivalentní s formulí
(E1 & . . & En) ∨ (En+1 & . . & En+m)
a snadno lze ověřit, že také s formulí 1≤i≤n<j≤n+m(Ei ∨ Ej), která je v konjunktivním
normálním tvaru.
Je-li A tvaru B → C, pak A je ekvivalentní s ¬B ∨ C. Víme už, že ¬B je ekvivalentní
s formulí v konjunktivním normálním tvaru, a z předchozího odstavce víme,
1.1 Formule a sémantika výrokové logiky 19
jak k disjunkci dvou formulí v konjunktivním normálním tvaru nalézt ekvivalentní
formuli také v konjunktivním normálním tvaru.
Dokázali jsme, že ve všech čtyřech případech je formule A ekvivalentní s formulí
v konjunktivním normálním tvaru. Ponecháváme na čtenáři, aby domyslel, že A je
ekvivalentní také s formulí v disjunktivním normálním tvaru. QED
Není pravda, že konjunktivní nebo disjunktivní normální tvar formule je určen
jednoznačně, a nepomůže dodat „až na pořadí členů v konjunkcích a disjunkcích .
Jednoduchým příkladem je formule (p → q) & (q → r) & (r → p), na kterou nás
upozornil P. Savický. Ta je ekvivalentní jak s formulí (¬p ∨ q) & (¬q ∨ r) & (¬r ∨ p),
tak s formulí (¬p ∨ r) & (¬r ∨ q) & (¬q ∨ p).
Někdy je výhodné pracovat s menším počtem než se čtyřmi logickými spojkami.
V tom případě lze jen některé z nich prohlásit za základní (tj. za opravdové
symboly) a formule obsahující ty ostatní považovat za zkratkovité zápisy formulí
obsahujících jen ony základní. Lze dokonce vystačit s jedinou logickou spojkou, pokud
si pro tento účel zvlášť deﬁnujeme novou logickou spojku jinou než &, ∨ a →.
O tom jsou některá cvičení. Někdy je naopak výhodné seznam logických symbolů
ještě rozšířit, například o ekvivalenci ≡ nebo o tzv. logické konstanty a ⊥ (pravda
a nepravda, verum a falsum), které se syntakticky chovají jako atomy, ale při každém
pravdivostním ohodnocení má konstanta povinně hodnotu 1 a konstanta ⊥
naopak hodnotu 0. Konstanty a ⊥ lze považovat za „nulární logické spojky.
Je dobré si uvědomit, že mluvíme-li o jazyce matematiky, chceme-li jej zkoumat
matematickými prostředky a chceme-li si přitom pomáhat symbolickými zápisy,
nelze se vyhnout užití některých slov a symbolů na dvou různých úrovních. Ve výrocích
o logických symbolech a formulích se mohou vyskytnout třeba implikace
a kvantiﬁkátory. Například v symbolickém zápisu v deﬁnici důsledku se vyskytují
kvantiﬁkátory ∀v a ∀ψ, které nemají význam formálních symbolů (to přijde
až v predikátové logice), ale zkratek. Lze také říci, že kvantiﬁkátory jsou tam
použity na metamatematické úrovni. Jen v případě implikace a ekvivalence odlišujeme
graﬁcky formální symbol od metamatematické zkratky: formální symbol je →
(a případně ≡, pokud jsme ekvivalenci zahrnuli do seznamu formálních symbolů),
na metaúrovni píšeme ⇒ a ⇔.
Cvičení
1. Určete, které z následujících výrokových formulí jsou splnitelné a které jsou
tautologie:
((p → q) → q) → q, ¬p → ¬(p ∨ (p & q)),
¬p → ¬(p ∨ q), (p → (q ∨ r)) → (q ∨ (p → r)),
¬p → ¬(p & q), (p → q) → ((q → r) → (p → r)),
p → p & (p ∨ q), (p → q) & q → p,
p → p ∨ (p & q), ¬p → (p & q),
(p → q) ∨ (q → p), ((p → q) → p) → p.
20 1 Výroková logika
2. Formule ϕ je splnitelná, právě když ¬ϕ není tautologie. Když ϕ → χ i χ → ψ
jsou tautologie, pak i ϕ → ψ je tautologie. Dokažte.
3. Rozhodněte, zda platí
(a) Když ϕ je tautologie a ψ vznikne z ϕ nahrazením některých výskytů
atomu p toutéž formulí χ, pak ψ je tautologie.
(b) Když ϕ je tautologie a ψ vznikne z ϕ nahrazením všech výskytů atomu p
toutéž formulí χ, pak ψ je tautologie.
(c) Když ϕ je tautologie a ψ vznikne z ϕ nahrazením všech výskytů atomu p
libovolnými (i různými) formulemi, pak ψ je tautologie.
(d) Když ψ1 resp. ψ2 vznikne z ϕ nahrazením některých výskytů atomu p formulí
χ1 resp. χ2 a χ1 a χ2 jsou ekvivalentní, pak ψ1 a ψ2 jsou ekvivalentní.
4. Předpokládejte, že i ekvivalence ≡ se považuje za základní logickou spojku, a
navrhněte pro ni pravdivostní tabulku tak, aby platilo toto: ϕ je ekvivalentní
s ψ, právě když formule ϕ ≡ ψ je tautologie.
5. Dokažte větu 1.1.8.
6. Dokažte, že jsou-li A a B libovolné výrokové formule, pak formule A & B je
ekvivalentní s formulí ¬(A → ¬B). S použitím cvičení 3 zdůvodněte, že když
ψ vznikne z ϕ nahrazením všech podformulí tvaru A & B formulí ¬(A → ¬B),
pak ϕ a ψ jsou ekvivalentní. Navrhněte podobné záměny i pro ostatní logické
spojky a zdůvodněte, že každá formule ϕ je ekvivalentní s formulí ψ, která
neobsahuje jiné logické spojky než
(a) → a ¬
(b) & a ¬
(c) ∨ a ¬.
7. Pro libovolnou množinu výrokových formulí Γ označme Cl(Γ) (od anglického
closure) množinu všech tautologických důsledků množiny Γ. Rozhodněte, zda
pro každou množinu formulí Γ resp. pro každé dvě množiny Γ a ∆ platí
(a) Γ ⊆ Cl(Γ),
(b) Cl(Cl(Γ)) = Cl(Γ),
(c) Cl(Γ ∪ ∆) = Cl(Γ) ∪ Cl(∆).
Pokud v (b) nebo v (c) je odpověď ne, rozhodněte, zda platí alespoň některá
inkluze.
8. Booleovská funkce n proměnných je libovolná funkce f z {0, 1}n
do {0, 1}.
Například rovnosti
f(0, 0) = 0, f(0, 1) = 0, f(1, 0) = 1, f(1, 1) = 0
určují jednu z booleovských funkcí dvou proměnných. Kolik je booleovských
funkcí n proměnných? Řekneme, že výroková formule neobsahující jiné atomy
než p0, . . , pn−1 deﬁnuje booleovskou funkci f, jestliže pro každé pravdivostní
ohodnocení v je v(ϕ) = f(v) (to je napsáno trochu nepřesně, ale snad je tomu
1.1 Formule a sémantika výrokové logiky 21
rozumět: formule ¬(p0 →p1) deﬁnuje funkci dvou proměnných zmíněnou výše).
Dokažte, že každou booleovskou funkci deﬁnuje některá výroková formule.
Návod. Nejprve uvažujte funkce, které mají jen jednu hodnotu 1 a jinak samé
hodnoty 0. Pak uvažujte disjunkce formulí deﬁnujících takové funkce.
9. Zdůvodněte, že na předchozím cvičení lze založit alternativní důkaz tvrzení,
že každá formule je ekvivalentní s nějakou formulí v disjunktivním normálním
tvaru.
10. Dokažte, že není pravda, že každá formule je ekvivalentní s nějakou formulí
sestavenou jen z logických spojek &, ∨ a →.
Návod. Dokažte, že každá formule sestavená jen ze dvou atomů p0 a p1 pouze
s užitím spojek &, ∨ a → deﬁnuje booleovskou funkci, která má v bodě [1, 1]
hodnotu 1. O formulích např. ¬p0 ∨ ¬p1 nebo p0 & ¬p0 to ale pravda není, a
žádná z nich tedy není ekvivalentní s formulí sestavenou z p0 a p1 jen užitím
spojek &, ∨ a →.
11. Uvažujte smyšlenou logickou spojku ↓, jejíž pravdivostní tabulka vznikne záměnou
nul a jedniček v pravdivostní tabulce disjunkce:
↓ 1 0
1 0 0
0 0 1
Tato spojka se někdy nazývá Pierceovou šipkou a lze ji číst „ani-ani : A ↓ B E
je ekvivalentní s ¬A & ¬B. Dokažte, že každá výroková formule je ekvivalentní
s formulí neobsahující jinou logickou spojku než ↓.
12. Nechť ϕ je libovolná výroková formule. Označme ϕq( ) resp. ϕq(⊥) formuli,
která z ní vznikne nahrazením všech výskytů atomu q logickou konstantou
resp. ⊥. Dokažte, že ϕ → ϕq( ) ∨ ϕq(⊥) je tautologie.
13. Dokažte, že pro klasickou výrokovou logiku platí věta o interpolaci, kterou lze
nejsnáze formulovat pro případ, kdy se připouštějí logické konstanty a ⊥:
jsou-li ϕ a ψ dvě výrokové formule takové, že ϕ → ψ je tautologie, pak existuje
výroková formule ω (zvaná interpolant formulí ϕ a ψ) splňující podmínky:
◦ ω obsahuje pouze atomy vyskytující se zároveň v obou formulích ϕ a ψ
(plus případně konstanty a ⊥),
◦ obě formule ϕ → ω i ω → ψ jsou tautologie.
Návod. Nechť q1, . . , qn jsou všechny atomy, které se vyskytují ve ϕ a nevyskytují
se v ψ. Vezměte za ω disjunkci všech 2n
formulí, které vzniknou z ϕ
dosazením konstant a ⊥ za atomy q1, . . , qn. Fakt, že ϕ → ω je tautologie,
odvoďte z předchozího cvičení. Dále si všimněte, že je-li α kterýkoliv z 2n
disjunktů
formule ω, pak formuli α → ψ lze získat z formule ϕ → ψ opakovaným
užitím cvičení 3(b).
22 1 Výroková logika
1.2 Věta o kompaktnosti
Předpokládejme, že T je množina, jejímiž prvky jsou uzavřené podmnožiny intervalu
[[0, 1]] chápaného jako podmnožina množiny R všech reálných čísel. Má-li
každých konečně mnoho prvků množiny T neprázdný průnik, tj. platí-li F = ∅
pro každou konečnou množinu F ⊆ T, pak existuje alespoň jedno reálné číslo, které
je současně prvkem všech prvků množiny T, tj. platí T = ∅.
Právě uvedené tvrzení se v topologii nazývá princip kompaktnosti, reálný interval
[[0, 1]] je z topologického hlediska kompaktní množinou. Nahradíme-li v principu
kompaktnosti termíny podle následující tabulky:
uzavřená podmnožina intervalu [[0, 1]] výroková formule
množina uzavřených množin množina výrokových formulí
průnik množiny je neprázdný množina je splnitelná,
dostaneme rovněž pravdivé tvrzení, které se nazývá větou o kompaktnosti ve výrokové
logice. Uvádíme dvě (ekvivalentní) verze.
Věta 1.2.1 (o kompaktnosti ve výrokové logice) (a) Je-li T množina výrokových
formulí taková, že každá konečná množina F ⊆ T je splnitelná, pak T je
splnitelná.
(b) Je-li T množina výrokových formulí a ϕ je výroková formule taková, že T |= ϕ,
pak existuje konečná množina F ⊆ T taková, že F |= ϕ.
Podmínka T |= ϕ podle deﬁnice znamená, že množina T ∪{¬ϕ} není splnitelná.
V tom případě a platí-li tvrzení (a), existuje konečná množina F ⊆ T ∪ {¬ϕ}
výrokových formulí, která není splnitelná. Ať už formule ¬ϕ je nebo není v F,
také (F − {¬ϕ}) ∪ {¬ϕ} je nesplnitelná množina. To opět podle deﬁnice důsledku
znamená F − {¬ϕ} |= ϕ. Množina F − {¬ϕ} je ovšem konečnou podmnožinou
množiny T. Dokázali jsme, že (b) plyne z (a), a zbývá tedy dokázat (a).
Uvedeme dva různé důkazy bodu (a). K prvnímu z nich použijeme dočasný
pomocný pojem konečně splnitelné množiny a pomocné tvrzení o tomto pojmu.
Řekneme, že množina S výrokových formulí je konečně splnitelná, jestliže každá
konečná F ⊆ S je splnitelná. Věta o kompaktnosti říká, že množina S je konečně
splnitelná, právě když je splnitelná. Před dokončením důkazu věty o kompaktnosti
se na tento fakt nespoléhejme. Po něm pojem konečné splnitelnosti ztratí smysl.
Lemma 1.2.2 Nechť S je množina výrokových formulí a ϕ je výroková formule.
Je-li S konečně splnitelná, pak alespoň jedna z množin S ∪ {ϕ} a S ∪ {¬ϕ} je
konečně splnitelná.
Důkaz Kdyby ne, pak existují konečné množiny F1, F2 ⊆ S takové, že F1 ∪ {ϕ} a
F2 ∪ {¬ϕ} nejsou splnitelné. Snadno lze ověřit, že v tom případě ani F1 ∪ F2 není
splnitelná. QED
1.2 Věta o kompaktnosti 23
Důkaz věty o kompaktnosti Je-li množina At všech výrokových atomů konečná
nebo spočetná, je množina všech výrokových formulí nekonečná spočetná a můžeme
ji seřadit do posloupnosti. Nebudeme-li trvat na indexování přirozenými čísly a
připustíme i čísla ordinální, můžeme ji seřadit do posloupnosti v každém případě.
Předpokládejme tedy, že ε je limitní ordinální číslo a že {ψα ; α < ε} je posloupnost
všech výrokových formulí. Dále předpokládejme, že T je množina výrokových formulí,
jejíž každá konečná podmnožina je splnitelná, tedy že T je konečně splnitelná.
Deﬁnujme posloupnost množin { Sα ; α < ε } a množinu S následující rekurzí:
S0 = T,
Sα+1 =
Sα ∪ {ψα} když Sα ∪ {ψα} je konečně splnitelná
Sα ∪ {¬ψα} jinak,
Sλ =
α<λ
Sα, když λ < ε je limitní,
S =
α<ε
Sα.
Pro α = 0 je množina Sα konečně splnitelná podle předpokladu věty. Když Sα
je konečně splnitelná, pak je podle lemmatu i Sα+1 konečně splnitelná. Když λ
je limitní a všechny Sα pro α < λ jsou konečně splnitelné, pak i Sλ je konečně
splnitelná, neboť libovolná konečná podmnožina množiny Sλ je podmnožinou už
některé Sα pro α < λ. Dokázali jsme indukcí, že každá množina Sα je konečně
splnitelná. Úvahou stejnou jako v případě limitního indexu lze zdůvodnit, že i celá
množina S je konečně splnitelná.
Postupně dokážeme, že S má ještě následující vlastnosti:
(i) ϕ ∈ S, právě když ¬ϕ /∈ S,
(ii) ϕ → ψ ∈ S, právě když ϕ /∈ S nebo ψ ∈ S,
(iii) ϕ ∨ ψ ∈ S, právě když ϕ ∈ S nebo ψ ∈ S,
(iv) ϕ & ψ ∈ S, právě když ϕ ∈ S a ψ ∈ S.
(i) Kdyby platilo ϕ ∈ S a ¬ϕ ∈ S, pak {ϕ, ¬ϕ} by byla nesplnitelnou konečnou
podmnožinou množiny S a S by nebyla konečně splnitelná. ϕ /∈ S a ¬ϕ /∈ S
současně také platit nemůže: ϕ má v enumeraci { ψα ; α < ε } nějaký index,
ϕ = ψα, a už v Sα+1 (a tím spíše v S) je jedna z formulí ϕ, ¬ϕ. (ii) Nechť ϕ ∈ S,
ϕ→ψ ∈ S a ψ /∈ S. Pak podle (i) platí ¬ψ ∈ S. Ale {ϕ, ϕ→ψ, ¬ψ} je nesplnitelná
konečná podmnožina množiny S. (iii) Když ϕ ∨ ψ ∈ S, ϕ /∈ S a ψ /∈ S, pak opět
podle (i) platí ¬ϕ ∈ S a ¬ψ ∈ S. Pak ale {ϕ∨ψ, ¬ϕ, ¬ψ} je nesplnitelnou konečnou
podmnožinou množiny S. Všechny zbývající úvahy v (ii), (iii) a (iv) jsou podobné
a přenecháváme je čtenáři.
Deﬁnujme nyní funkci v z množiny všech výrokových formulí do {0, 1} předpisem
v(ϕ) = 1 ⇔ ϕ ∈ S.
24 1 Výroková logika
Podmínky (i)–(iv) říkají, že funkce v je pravdivostním ohodnocením. Pro všechny
formule ϕ ∈ T platí v(ϕ) = 1, protože platí T ⊆ S. Množina T je tedy splnitelnou
množinou výrokových formulí. QED
V kapitole o predikátové logice se setkáme s aplikací výrokové věty o kompaktnosti
a také s její predikátovou verzí. V tomto oddílu ukážeme ještě školní příklad
na užití věty o kompaktnosti v oblasti mimo logiku, totiž důkaz tvrzení, že každý
nekonečný graf, který nelze obarvit n barvami, obsahuje konečný podgraf, který
rovněž nelze obarvit n barvami. Pak ukážeme alternativní — topologický — důkaz
věty o kompaktnosti, který bude velmi snadný pro čtenáře obeznámeného se
základními topologickými pojmy. Nebudeme se ale spoléhat na předběžné znalosti
a všechny potřebné deﬁnice uvedeme a uvedeme také důkaz (pro naše potřeby postačující
verze) Tichonovovy věty, která tvrdí, že kartézský součin kompaktních
topologických prostorů je opět kompaktní topologický prostor. Zbytek tohoto oddílu
lze číst selektivně a čtenář, který se nezajímá o mimologické souvislosti věty o
kompaktnosti, jej může zcela vypustit.
Dvojice G, R je neorientovaný graf, jestliže R je symetrická a antireﬂexivní
relace na množině G, tj. jestliže R splňuje podmínky ∀x∀y(x R y ⇒ y R x)
a ∀x¬(x R x). Graf G , R je podgraf grafu G, R , jestliže platí inkluze G ⊆ G
a R ⊆ { [x, y] ; x ∈ G & y ∈ G & x R y }. Funkce h z G do {1, . . , n} je
obarvení grafu G, R n barvami, platí-li ∀x∀y(x R y ⇒ h(x) = h(y)). Čísla 1, . . , n
reprezentují n barev. Obarvení je přidělení barev vrcholům grafu tak, aby vrcholům
spojeným hranou nikdy nebyla přidělena táž barva.
Příklad 1.2.3 Uvažujme tvrzení jestliže pro každý konečný podgraf grafu G, R
existuje jeho obarvení n barvami, pak i pro celý graf G, R existuje jeho obarvení
n barvami. Toto tvrzení dokážeme převedením na větu o kompaktnosti. Nechť
graf G, R je dán. Můžeme si zvolit množinu T výrokových formulí a dokonce i
množinu At výrokových atomů. Zvolme ji takto:
At = { px,i ; x ∈ G & 1 ≤ i ≤ n }.
Každá dvojice [x, i], kde x je vrchol grafu a i je barva, má v množině At atom px,i,
který reprezentuje tvrzení vrcholu x byla přidělena barva i. Za množinu T zvolme
sjednocení následujících tří množin výrokových formulí:
{ px,1 ∨ . . ∨ px,n ; x ∈ G } ; Každý vrchol má nějakou barvu,
{ px,i → ¬px,j ; i = j } ; ale jen jednu,
{ px,i → ¬py,i ; x R y } ; sousední vrcholy mají různé barvy.
Nechť v je libovolné pravdivostní ohodnocení splňující všechny formule množiny T.
Z ohodnocení v můžeme sestrojit funkci h takto: h(x) deﬁnujeme jako ono i, pro
které platí v(px,i) = 1. Je zřejmé, že číslo i je jednoznačně určeno a že h je
obarvení grafu G, R . Zdůvodnili jsme, že je-li T splnitelná, pak graf G, R lze
obarvit n barvami. Podobně lze zdůvodnit, že existuje-li pro libovolný konečný
1.2 Věta o kompaktnosti 25
podgraf grafu G, R obarvení n barvami, pak každá konečná část F množiny T je
splnitelná. Naše tvrzení tedy bezprostředně vyplývá z věty o kompaktnosti.
Nyní směřujme ke stručnému výčtu nejzákladnějších topologických pojmů a
k topologickému důkazu věty o kompaktnosti. Označme P(A) množinu všech podmnožin
množiny A, tj. potenční množinu množiny A. Nadále předpokládejme, že
A je vždy neprázdná. Množina T ⊆ P(A) je topologie na A, jestliže ∅ ∈ T , A ∈ T
a T je uzavřena na konečné průniky a na libovolná sjednocení. Je-li T topologie
na A, pak dvojice A, T je topologický prostor a prvkům topologie T říkáme otevřené
množiny prostoru A, T . Množina X ⊆ A je uzavřená, platí-li A − X ∈ T ,
tj. je-li její komplement otevřenou množinou.
Příklad 1.2.4 Množiny {∅, A} a P(A) jsou krajní příklady topologií na množině A.
Druhé z nich říkáme diskrétní topologie. Každá z množin ∅ a A je jak otevřenou,
tak uzavřenou množinou libovolného prostoru A, T .
Příklad 1.2.5 Nechť A, ≤ je (ne nutně lineárně) uspořádaná množina, tj. ≤ je
reﬂexivní, tranzitivní a slabě antisymetrická relace na množině A. Prohlašme množinu
X ⊆ A za otevřenou, jestliže pro každé a ∈ X platí { y ; a ≤ y } ⊆ X. Snadno
lze ověřit, že takto deﬁnovaná množina všech otevřených množin je uzavřená na
libovolná sjednocení a také na libovolné — nejen konečné — průniky, a je to tedy
topologie.
Příklad 1.2.6 Nechť P je neprázdná množina. Označme 2P
množinu všech funkcí
z P do dvouprvkové množiny {0, 1}:
2P
= { f ; f : P → {0, 1} }.
Prohlašme množinu X ⊆ 2P
za otevřenou, jestliže pro každou funkci g ∈ X existují
prvky x1, . . , xn ∈ P takové, že { f ; f(x1) = g(x1) & . . & f(xn) = g(xn) } ⊆ X.
Množina X je tedy otevřená, jestliže s každým prvkem g obsahuje všechny funkce,
které se s funkcí g shodují na jisté konečné množině. Předpokládejme, že X a Y
jsou dvě množiny funkcí otevřené v právě uvedeném smyslu. Nechť g ∈ X ∩ Y .
Protože g ∈ X, také všechny funkce, které se s funkcí g shodují na jisté konečné
množině {x1, . . , xn}, jsou v X. Protože g ∈ Y , také všechny funkce, které se
s funkcí g shodují na jisté konečné množině {y1, . . , ym}, jsou v Y . Pak ale všechny
funkce, které se s funkcí g shodují na množině {x1, . . , xn, y1, . . , ym}, jsou jak v X,
tak v Y . Tím je ověřeno, že průnik dvou otevřených množin je opět otevřená
množina. Snadno lze ověřit, že libovolné sjednocení otevřených množin je opět otevřenou
množinou. Právě deﬁnované množině otevřených množin se říká produktová
topologie na množině 2P
. Topologický prostor 2P
, T , kde T je produktová topologie,
značíme obvykle pouze 2P
a nazýváme kartézskou mocninou prostoru {0, 1}
(vybaveného diskrétní topologií).
Řekneme, že topologický prostor je kompaktní, jestliže každá množina uzavřených
množin, jejíž každá konečná část má neprázdný průnik, má neprázdný průnik.
Řekneme, že množina F ⊆ P(A) je ﬁltr na množině A, jestliže
26 1 Výroková logika
• A ∈ F, ∅ /∈ F,
• Y ∈ F, kdykoliv X ⊆ Y a X ∈ F,
• F je uzavřená na konečné průniky.
Množina U ⊆ P(A) je ultraﬁltr na A, jestliže U je ﬁltr a jestliže navíc pro každou
množinu X ⊆ A platí, že jedna z množin X a A−X je v U. Je známo, že důsledkem
axiomu výběru je tvrzení, že každý ﬁltr je obsažen v nějakém ultraﬁltru.
Příklad 1.2.7 Je-li A nekonečná, pak množina všech jejích podmnožin, jejichž
komplement je konečný, je ﬁltr. Je-li A libovolná, pak množina všech jejích podmnožin,
které obsahují nějaký pevně zvolený prvek a ∈ A (tj. množina všech nadmnožin
množiny {a}), je ultraﬁltr. Nazýváme jej triviálním ultraﬁltrem. Každý
konečný prostor je kompaktní. Vezměme za A, ≤ množinu všech reálných čísel
s obvyklým uspořádáním. Každý interval tvaru (−∞, a) je uzavřenou množinou
v topologii z příkladu 1.2.5. Průnik všech takovýchto intervalů je prázdný, ale
průnik libovolných konečně mnoha je neprázdný. Topologický prostor deﬁnovaný
v příkladu 1.2.5 tedy v případě, kdy A, ≤ je množina všech reálných čísel, není
kompaktní.
Příklad 1.2.8 Rozmysleme si, že každá kartézská mocnina tvaru 2P
je kompaktním
topologickým prostorem. Nechť C je nějaká množina uzavřených množin prostoru
2P
. Každý prvek množiny C je tedy uzavřená množina (funkcí z P do {0, 1}).
Předpokládejme, že každá konečná část množiny C má neprázdný průnik. Ověříme,
že i C = ∅. Označme F množinu všech nadmnožin všech konečných průniků
množin z C. Je zřejmé, že F je ﬁltr. Označme U (některý) ultraﬁltr obsahující F.
Platí C ⊆ U.
Deﬁnujme pomocí ultraﬁltru U funkci g0 : P → {0, 1} předpisem
g0(x) = 1 ⇔ { f ∈ 2P
; f(x) = 1 } ∈ U.
Množiny {f ∈ 2P
; f(x) = 1} a {f ∈ 2P
; f(x) = 0} jsou navzájem komplementární,
a tedy není-li první z nich v U, tj. platí-li g0(x) = 0, musí (podle deﬁnice ultraﬁltru)
být v U druhá z nich. Tedy { f ∈ 2P
; f(x) = g0(x) } je v U pro každé x ∈ P.
Vzhledem k uzavřenosti ultraﬁltru U na konečné průniky platí také
{ f ∈ 2P
; f(x1) = g0(x1) & . . & f(xn) = g0(xn) } ∈ U
pro libovolnou konečnou množinu {x1, . . , xn} ⊆ P. Dokázali jsme, že každá otevřená
množina prostoru 2P
, jejímž prvkem je funkce g0, je v U.
Nechť nyní X ∈ C je libovolná. Víme X ∈ U. Když g0 /∈ X, pak 2P
− X je
otevřená množina obsahující g0, a tedy podle předchozího 2P
− X ∈ U. To ale
není možné vzhledem k podmínkám v deﬁnici ultraﬁltru: žádný ﬁltr neobsahuje
navzájem disjunktní množiny. Dokázali jsme g0 ∈ X. Toto platí pro každou X ∈ C.
Tedy g0 ∈ C, takže C = ∅.
1.2 Věta o kompaktnosti 27
Topologický důkaz věty o kompaktnosti Každá funkce z množiny At všech
výrokových atomů do {0, 1} má jednoznačně určené rozšíření deﬁnované na množině
všech výrokových formulí. To znamená, že pro účely tohoto důkazu můžeme
pravdivostní ohodnocení ztotožnit s prvky prostoru 2At
.
Pro libovolnou formuli ϕ označme Mod(ϕ) = { f ∈ 2At
; f(ϕ) = 1 }. Mod(ϕ) je
množina všech pravdivostních ohodnocení, která splňují formuli ϕ, přesněji řečeno
množina všech funkcí z At do {0, 1}, jejichž jednoznačně určené rozšíření na všechny
výrokové formule splňuje formuli ϕ.
Nechť ϕ je libovolná výroková formule a nechť p1, . . , pk jsou všechny atomy, které
se v ní vyskytují. Je-li f ∈ Mod(ϕ), tj. je-li ϕ splněna ohodnocením f, pak ϕ je
také splněna každým ohodnocením g, které se s f shoduje na množině {p1, . . , pk}.
Tím je ověřeno, že každá množina tvaru Mod(ϕ) je otevřenou množinou prostoru
2At
. Každá množina tvaru Mod(ϕ) je však zároveň také uzavřenou množinou
prostoru 2At
, protože je komplementem otevřené množiny Mod(¬ϕ).
Předpokládejme, že T je nějaká množina výrokových formulí, jejíž každá konečná
podmnožina je splnitelná. To znamená, že každá množina tvaru
Mod(ϕ1) ∩ . . ∩ Mod(ϕn)
je neprázdná, pokud {ϕ1, . . , ϕn} ⊆ T. Splnitelnost celé množiny T znamená
{ Mod(ϕ) ; ϕ ∈ T } = ∅ a plyne bezprostředně z kompaktnosti prostoru 2At
a uzavřenosti množin Mod(ϕi). QED
V prvním důkazu věty o kompaktnosti jsme použili předpoklad, že množinu
všech výrokových formulí lze dobře uspořádat. Použili jsme tedy axiom výběru AC.
V druhém, topologickém, důkazu jsme použili předpoklad
UF: Každý ﬁltr na P(A), kde A = ∅, je obsažen v nějakém ultraﬁltru,
který lze také považovat za axiom teorie množin. Bez důkazu jsme ponechali implikaci
AC → UF, ale důkaz vlastně plyne z cvičení 8. V případě, kdy množina At
všech výrokových atomů je nekonečná spočetná, lze větu o kompaktnosti dokázat
v teorii množin bez dodatečných axiomů.
Cvičení
1. Nechť T je množina výrokových formulí taková, že každé pravdivostní ohodnocení
splňuje některou formuli v T. Pak existuje konečná množina formulí
{ϕ1, . . , ϕn} ⊆ T taková, že ϕ1 ∨ . . ∨ ϕn je tautologie. Dokažte.
2. Nechť A, ≤ je lineárně uspořádaná množina, tj. ≤ je uspořádání na množině
A, které navíc splňuje podmínku ∀a∀b(a ≤ b ∨ b ≤ a). Nechť (c, d)
označuje množinu {a; c < a < d}, dále (c, +∞) označuje množinu {a; c < a}
a (−∞, c) označuje množinu { a ; a < c }. Množinám tvaru (c, d), (c, +∞)
a (−∞, c) říkejme otevřené intervaly. Označme T množinu všech X ⊆ A
28 1 Výroková logika
splňujících podmínku, že pro každé a ∈ X existuje otevřený interval I ⊆ X
takový, že a ∈ I. Dokažte, že T je topologie. T se nazývá intervalovou topologií
na uspořádané množině A, ≤ .
3. Dokažte, že množina všech reálných čísel s intervalovou topologií ani množina
všech racionálních čísel z intervalu [[0, 1]] s intervalovou topologií nejsou
kompaktní prostory.
4. Dokažte, že je-li F ⊆ P(A) ﬁltr a X ⊆ A libovolná, pak existuje ﬁltr, který
obsahuje množinu F ∪ {X} nebo množinu F ∪ {A − X}.
5. Ultraﬁltr U na A je triviální, právě když U obsahuje nějakou konečnou množinu.
Dokažte.
6. Nechť A je nekonečná množina. Množina všech částí množiny A, které mají
konečný doplněk, se nazývá Frechetův ﬁltr na množině A. Dokažte, že žádný
ultraﬁltr obsahující Frechetův ﬁltr není triviální.
7. Znamená-li Mod totéž, co v topologickém důkazu věty o kompaktnosti, jaké
vztahy platí mezi množinami Mod(ϕ & ψ), Mod(ϕ ∨ ψ), Mod(ϕ) a Mod(ψ)?
8. Užijte větu o kompaktnosti pro výrokovou logiku k důkazu tvrzení, že každý
ﬁltr na libovolné množině A je obsažen v některém ultraﬁltru.
Návod. Nechť je dán ﬁltr F na množině A. Zvolte množinu výrokových atomů
tak, aby obsahovala atom pX pro každou X ⊆ A. Atom pX chápejte jako
tvrzení množina X je prvek ultraﬁltru U, kde U je hledaný ultraﬁltr. Deﬁnujte
množinu formulí T vyjadřující fakt, že U je ultraﬁltr obsahující ﬁltr F. Množina
T bude mimo jiné obsahovat formuli ¬pX → pA−X pro každou X ⊆ A.
9. Zdůvodněte, že tvrzení
(i) obecná věta o kompaktnosti ve výrokové logice,
(ii) každý ﬁltr na libovolné množině A je obsažen v některém ultraﬁltru,
(iii) každý topologický prostor tvaru 2P
je kompaktní
jsou v teorii množin bez axiomu výběru navzájem ekvivalentní.
1.3 Hilbertovský výrokový kalkulus
V úvodním oddílu této kapitoly jsme logicky platné výrokové formule, tj. tautologie,
deﬁnovali pomocí sémantického pojmu pravdivostního ohodnocení. Z deﬁnice
tautologie jsme odvodili algoritmus zvaný tabulková metoda, který rozhoduje o
tom, zda daná formule je tautologií. Viděli jsme také, že tabulková metoda není
příliš efektivním algoritmem; počet pravdivostních ohodnocení, která je nutno vzít
v úvahu při zpracování nějaké formule ϕ, roste exponenciálně s počtem atomů ve ϕ.
1.3 Hilbertovský výrokový kalkulus 29
V tomto oddílu uvidíme, že tautologie lze deﬁnovat také syntakticky, totiž jako
formule, které lze odvodit mechanickou aplikací jistých strukturálních pravidel. Jinými
slovy, tautologie jsou přesně ty formule, které lze formálně dokázat pomocí
pravidel jistého důkazového systému neboli kalkulu. Místo strukturální pravidla
budeme říkat odvozovací pravidla; slovy „strukturální a „mechanická jsme chtěli
zdůraznit, že odvozovací pravidla jsou aplikovatelná na libovolné formule předepsaného
tvaru bez ohledu na jejich pravdivostní hodnoty či smysl.
Odvozovací pravidlo může vypadat například takto:
X1: ψ → ϕ , ¬ψ → ϕ / ϕ.
Toto pravidlo umožňuje prohlásit za odvozenou (formálně dokázanou) formuli ϕ,
kdykoliv se nám pro libovolnou formuli ψ podařilo (nezávisle na sobě) dokázat
formule ψ → ϕ a ¬ψ → ϕ. Pravidlo X1 je pravidlo se dvěma předpoklady a je
aplikovatelné teprve poté, kdy byly odvozeny alespoň dvě formule. Jiná pravidla
mohou mít jiný počet předpokladů. Je ale zřejmé, že abychom vůbec mohli odvodit
nějakou formuli, jsou nutná také nějaká pravidla s nulovým počtem předpokladů.
Těm říkáme výrokové axiomy a mohou být zvoleny například takto:
X2: / ϕ → (ϕ ∨ ψ),
X3: / ϕ → (ψ ∨ ϕ).
Snadno lze ověřit, že pravidlo X1 je korektní v tom smyslu, že z tautologií
umožňuje odvodit opět pouze tautologie. Pravidla X2 a X3 jsou aplikovatelná
kdykoliv, a rovněž umožňují odvodit pouze tautologie; jsou to tedy také korektní
pravidla. Víme-li už, že všechna pravidla X1–X3 jsou korektní, můžeme ve třech
krocích
1: ϕ → (ϕ ∨ ¬ϕ) ; X2
2: ¬ϕ → (ϕ ∨ ¬ϕ) ; X3
3: ϕ ∨ ¬ϕ ; X1 na 1, 2
dokázat, že každá formule tvaru ϕ ∨ ¬ϕ je tautologie. To jsme samozřejmě věděli;
důležité ale je, že nyní jsme to dokázali bez probírání pravdivostních hodnot. Úvahu
o pravdivostních hodnotách jsme totiž učinili a priori při zdůvodnění korektnosti
pravidel X1–X3.
Kalkulus tedy chápeme jako množinu odvozovacích pravidel. Kalkulus je korektní
vůči sémantice klasické výrokové logiky, jestliže každá formule v něm dokazatelná
je tautologie. A kalkulus je úplný, jestliže je korektní a navíc všechny
tautologie jsou v něm dokazatelné. Časem se budeme zabývat i jinými logikami,
než je klasická výroková logika. V obecném případě kalkulus je korektní, jestliže
neumožňuje dokázat žádnou formuli, která vzhledem k nějaké sémantice nemá být
dokazatelná, a je úplný, jestliže navíc umožňuje dokázat každou formuli, která vzhledem
k oné sémantice má být dokazatelná. Kalkulus s pravidly X1–X3 je korektní,
30 1 Výroková logika
není ale úplný vůči sémantice klasické výrokové logiky. Za chvíli uvedeme kalkulus
HK převzatý z Kleeneho knihy [49], o kterém dokážeme, že úplný je. Označení
X1–X3 bylo jen dočasné. Pravidla X2 a X3 budou v kalkulu HK vystupovat pod
jiným názvem a pravidlo X1 už používat nebudeme.
Deﬁnice 1.3.1 Posloupnost formulí ϕ1, . . , ϕn je důkaz (v hilbertovském kalkulu)
z množiny předpokladů T, jestliže každá formule ϕi je v T nebo je výrokovým
axiomem nebo je odvozena z některých formulí ϕj pro j < i pomocí některého odvozovacího
pravidla. Formule ϕ je dokazatelná z množiny T (nebo též dokazatelná
v T), jestliže existuje důkaz z množiny T takový, že ϕ je jeho posledním členem.
Kalkulus HK (hilbertovský klasický) má jediné odvozovací pravidlo modus ponens
MP: ϕ , ϕ → ψ / ψ
a následující výrokové axiomy
A1: ϕ → (ψ → ϕ),
A2: (ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ)),
A3: (¬ϕ → ¬ψ) → ((¬ϕ → ψ) → ϕ),
A4: ϕ & ψ → ϕ, ϕ & ψ → ψ,
A5: ϕ → (ψ → ϕ & ψ),
A6: ϕ → ϕ ∨ ψ, ψ → ϕ ∨ ψ,
A7: (ϕ → χ) → ((ψ → χ) → (ϕ ∨ ψ → χ)).
Fakt, že ϕ je dokazatelná z T, zapisujeme T HK ϕ nebo jen T ϕ. Je-li T = ∅,
píšeme jen HK ϕ nebo ϕ.
Přestože jsme nezapomněli, že výrokový axiom je vlastně pravidlo s nulovým
počtem předpokladů, v deﬁnici jsme poněkud nedůsledně oddělili axiomy od pravidla
MP a v souvislosti s tím jsme v jejich zápisu také vynechali lomítka.
Kalkulus HK je jen jeden z celé řady kalkulů pro klasickou výrokovou logiku.
V literatuře se vyskytují kalkuly s jiným seznamem axiomů a jsou myslitelné i
kalkuly s jiným seznamem odvozovacích pravidel. Výrokovým kalkulům založeným
na pravidle MP se také často říká fregovské.
Slovo důkaz tedy užíváme na dvou úrovních: (formální) důkaz jako odborný
termín (posloupnost formulí taková a taková) a důkaz (metamatematický) nějakého
tvrzení (o formulích, formálních důkazech, . . . ).
Zdůrazněme ještě, že A1–A7 nejsou jednotlivé axiomy, ale schémata; za ϕ, ψ
a χ mohou být voleny libovolné formule. Každou formuli, kterou získáme volbou
konkrétních formulí v nějakém schématu, nazýváme instancí onoho schématu.
Příklad 1.3.2 Zvolíme-li libovolně formuli ϕ, pak následující posloupnost pěti for-
mulí
1: ϕ → (ϕ → ϕ) ; A1
1.3 Hilbertovský výrokový kalkulus 31
2: (ϕ → ((ϕ → ϕ) → ϕ)) → ((ϕ → (ϕ → ϕ)) → (ϕ → ϕ)) ; A2
3: ϕ → ((ϕ → ϕ) → ϕ) ; A1
4: (ϕ → (ϕ → ϕ)) → (ϕ → ϕ) ; MP na 2, 3
5: ϕ → ϕ ; MP na 4, 1
je důkazem formule ϕ → ϕ z prázdné množiny předpokladů. Každá formule tvaru
ϕ → ϕ je tedy v kalkulu HK dokazatelná.
Posloupnost ϕ1, . . , ϕn, která je důkazem, nemusí být prostou posloupností; deﬁnice
1.3.1 připouští, že některé formule ϕi se v posloupnosti ϕ1, . . , ϕn vyskytují
vícekrát. Někdy se důkaz deﬁnuje nikoliv jako posloupnost, ale jako (vrcholově)
ohodnocený strom, přesněji konečný orientovaný strom, jehož vrcholům jsou přiřazeny
formule tak, že formuli přiřazenou libovolnému vrcholu v lze jedním užitím
odvozovacího pravidla odvodit z formulí přiřazených těm vrcholům, do kterých z vrcholu
v vede hrana (deﬁnice některých pojmů z teorie grafů jsou na str. 118 a n.).
I ve stromovém důkazu se ovšem táž formule může opakovat, tj. různé vrcholy mohou
být ohodnoceny toutéž formulí. Zachováme-li označení formulí čísly 1 až 5,
můžeme důkaz schématu ϕ → ϕ znázornit tak, jak je uvedeno na obrázku 1.3.1.
K orientaci šipek na obr. 1.3.1 poznamenejme, že se snažíme držet úmluvu snad
obvyklou, že cesty v orientovaných stromech vedou z kořenu směrem k listům. To
v případě důkazů může vypadat neobvykle, čtenář si ale může myslet, že šipky nesledují
„směr úvahy , nýbrž ukazují na „důvody . Mělo by být zřejmé, že pomocí
stromových důkazů lze dokázat tytéž formule, které lze dokázat pomocí důkazů-po-
sloupností.
2 3
4 1
5
t
tt

0
t
tt

0
Obrázek 1.3.1: Příklad důkazu v kalkulu HK
Důkaz schématu ϕ → ϕ je jediným případem, kdy jsme si dali práci a nějaký
důkaz z prázdné množiny předpokladů jsme zapsali celý. Ve všech ostatních případech
nám pomůže následující věta. Dokázat přímo dokazatelnost schématu ϕ → ϕ
však bylo nutné, v důkazu věty 1.3.3 se na tento fakt budeme odvolávat.
Domluvme se, že při zapisování množin formulí budeme vypouštět složené závorky
a symbol ∪ pro sjednocení. Zápis Γ, ψ tedy znamená Γ∪{ψ} a ψ1, . . , ψn ϕ
znamená {ψ1, . . , ψn} ϕ.
Věta 1.3.3 (o dedukci) Nechť Γ je množina formulí a ϕ a ψ jsou formule takové,
že Γ, ψ ϕ. Pak Γ ψ → ϕ.
32 1 Výroková logika
Důkaz Podle deﬁnice důkazu existuje posloupnost ϕ1, . . , ϕn taková, že ϕn je ϕ a
každá formule ϕi je výrokovým axiomem, nebo je odvozena z předchozích formulí
pomocí pravidla MP, nebo je prvkem množiny předpokladů Γ ∪ {ψ}. Dokážeme
indukcí podle i, že každá implikace ψ → ϕi pro 1 ≤ i ≤ n je dokazatelná z předpokladů
Γ. Nechť tedy pro všechna j < i tvrzení platí a zabývejme se implikací ψ→ϕi.
Když ϕi je ψ, pak ψ → ϕi, tj. ϕi → ϕi, je dokazatelná formule.
Když ϕi je některý výrokový axiom nebo prvek množiny Γ, pak tříčlenná posloupnost
ϕi → (ψ → ϕi), ϕi, ψ → ϕi je důkazem implikace ψ → ϕi z předpokladů Γ.
Nechť ϕi je odvozena pravidlem MP z formulí ϕj a ϕk, kde j, k < i. Jedna z formulí
ϕj, ϕk musí být implikací takovou, že její premisa je druhá z obou formulí a závěr
je ϕi. Nechť například ϕk je touto implikací a nechť j < k. Původní důkaz formule ϕ
má tedy tvar
. . , ϕj, . . , ϕj → ϕi, . . , ϕi, . .
Indukční předpoklad říká, že obě formule ψ → ϕj a ψ → (ϕj → ϕi) jsou dokazatelné
z množiny Γ. Zapišme oba důkazy za sebe a na konec připišme formule
(ψ → (ϕj → ϕi)) → ((ψ → ϕj) → (ψ → ϕi)), (ψ → ϕj) → (ψ → ϕi), ψ → ϕi.
Tím jsme získali důkaz formule ψ → ϕi z předpokladů Γ, neboť první z těchto tří
formulí je instance schématu A2 a další dvě jsou odvozeny z předchozích členů
pomocí pravidla MP. QED
Představme si nyní, že chceme zdůvodnit, že každá formule tvaru ¬¬ϕ → ϕ
je v kalkulu HK dokazatelná z prázdné množiny předpokladů. Věta o dedukci
říká, že stačí zdůvodnit dokazatelnost formule ϕ z množiny předpokladů {¬¬ϕ}.
Schéma A3 lze číst tak, že pokud ¬ϕ vede ke sporu (tj. k závěru, že současně platí
ψ i ¬ψ pro některou formuli ψ), pak platí ϕ. A vede ¬ϕ ke sporu? Ano, ¬ϕ dává
současně ¬ϕ i ¬¬ϕ, neboť jsme přijali předpoklad ¬¬ϕ. Takováto hrubá úvaha a
možná několik pokusů zpravidla umožňují sestrojit hledaný důkaz, v daném případě
formule ϕ z množiny {¬¬ϕ}:
...
1: ¬ϕ → ¬ϕ
2: (¬ϕ → ¬ϕ) → ((¬ϕ → ¬¬ϕ) → ϕ) ; A3
3: ¬¬ϕ → (¬ϕ → ¬¬ϕ) ; A1
4: ¬¬ϕ ; Předpoklad
5: ¬ϕ → ¬¬ϕ ; MP na 3, 4
6: (¬ϕ → ¬¬ϕ) → ϕ ; MP na 1, 2
7: ϕ ; MP na 5, 6.
1.3 Hilbertovský výrokový kalkulus 33
Tečkami jsou znázorněny čtyři známé kroky důkazu formule ¬ϕ → ¬ϕ. Abychom
ukázali ještě jeden příklad na sestrojení formálního důkazu, zdůvodněme, že každá
formule tvaru ¬ψ→(ψ→ϕ) je v kalkulu HK dokazatelná. Užijeme-li větu o dedukci
dvakrát, stačí zdůvodnit dokazatelnost formule ϕ z předpokladů {ψ, ¬ψ}. Opět lze
užít schéma A3. Vede i tentokrát ¬ϕ ke sporu? Ano, protože už předpoklady ψ a ¬ψ
tvoří dohromady spor. Tentokrát zapišme jen jakýsi „výtah z formálního důkazu,
s vynecháním lehkých kroků (jako je například fakt, že když α ∈ Γ a Γ α → β,
pak Γ β), zato s uvedením množiny předpokladů:
1: ¬ψ, ψ (¬ϕ → ¬ψ) → ((¬ϕ → ψ) → ϕ) ; A3
2: ¬ψ, ψ ¬ψ → (¬ϕ → ¬ψ) ; A1
3: ¬ψ, ψ ψ → (¬ϕ → ψ) ; A1
4: ¬ψ, ψ ¬ϕ → ¬ψ ; 2, MP
5: ¬ψ, ψ ¬ϕ → ψ ; 3, MP
6: ¬ψ, ψ (¬ϕ → ψ) → ϕ ; MP na 1, 4
7: ¬ψ, ψ ϕ ; MP na 5, 6
8: ¬ψ ψ → ϕ ; Věta o dedukci
9: ¬ψ → (ψ → ϕ) ; Věta o dedukci.
Lemma 1.3.4 Následující schémata jsou dokazatelná v kalkulu HK:
(a) ¬ψ → (ψ → ϕ), (g) (¬ϕ → ¬ψ) → (ψ → ϕ),
(b) (ϕ → ψ) → ((ψ → χ) → (ϕ → χ)), (h) (ψ → ϕ) → (¬ϕ → ¬ψ),
(c) ¬¬ϕ → ϕ, (i) ϕ → (¬ψ → ¬(ϕ → ψ)),
(d) ¬¬¬ϕ → ¬ϕ, (j) (¬ϕ → ϕ) → ϕ,
(e) ϕ → ¬¬ϕ, (k) (ϕ → ¬ϕ) → ¬ϕ,
(f) (ψ → ϕ) → (¬¬ψ → ¬¬ϕ), (l) (ψ → ϕ) → ((¬ψ → ϕ) → ϕ).
Důkaz Body (a) a (c) jsme již dokázali, bod (b) je lehký, (d) je instance schématu
(c). Domníváme se, že většinu zbývající práce lze ponechat na čtenáři, pro
jistotu uvádíme několik rad a návodů.
Schémata jsou seřazena, někdy pomůže použít již dokázané předchozí body. Například
bod (k) lze s užitím (c) a dosazením ¬ϕ za ϕ v (j) dokázat takto:
ϕ → ¬ϕ, ¬¬ϕ ϕ ; (c)
ϕ → ¬ϕ, ¬¬ϕ ¬ϕ ; MP
ϕ → ¬ϕ ¬¬ϕ → ¬ϕ ; Věta o dedukci
ϕ → ¬ϕ ¬ϕ ; (j).
34 1 Výroková logika
Víme-li už z (c) a (e), že dvojnou negaci lze podle potřeby přidat nebo odstranit,
snadno dokážeme (f). Bod (h) lze dokázat z (f) a (g).
V (e) lze použít axiom A3 ve tvaru (¬¬¬ϕ→¬ϕ)→((¬¬¬ϕ→ϕ)→¬¬ϕ). Formule
¬¬¬ϕ → ¬ϕ je dokazatelná díky (d), formule ¬¬¬ϕ → ϕ je dokazatelná z předpokladu
ϕ, takže ¬¬ϕ je dokazatelná rovněž z předpokladu ϕ.
Tvrzení (j) lze dokázat takto:
¬ϕ → (¬ϕ → ¬(¬ϕ → ϕ)) ; (i)
¬ϕ ¬(¬ϕ → ϕ)
¬ϕ → ¬(¬ϕ → ϕ) ; Věta o dedukci
(¬ϕ → ϕ) → ϕ ; (g)
a konečně bod (l) lze dokázat užitím bodů (h), (b) a (j). QED
Množina předpokladů T je sporná, jestliže z ní lze dokázat nějakou formuli ψ i
její negaci ¬ψ. Jinak je T bezesporná (konzistentní). Nechť T je sporná a nechť ψ je
taková, že T ψ a T ¬ψ. Podle (a) předchozího lemmatu platí T ψ→(¬ψ→ϕ),
a tedy také T ϕ, a to pro libovolnou formuli ϕ. To znamená, že T je sporná,
právě když každá formule je v T dokazatelná.
Je prázdná množina předpokladů bezesporná? Hned uvidíme, že ano, neboť věta
o korektnosti kalkulu HK říká, že z prázdné množiny předpokladů jsou dokazatelné
pouze tautologie, a neexistuje tautologie ψ taková, aby i ¬ψ byla tautologie. Existuje
algoritmus, který pro danou formuli ϕ rozhodne, zda ϕ je dokazatelná z prázdné
množiny předpokladů? Ze samotné deﬁnice důkazu takový algoritmus asi odvodit
nelze. Hned ale uvidíme, že odpověď je ano, neboť věta o úplnosti kalkulu HK říká,
že z prázdné množiny předpokladů jsou dokazatelné právě tautologie, a víme, že
pro rozpoznávání tautologií existuje algoritmus. Korektnost a úplnost se týká dokazatelnosti
z prázdné množiny. Budeme uvažovat také silnou korektnost a silnou
úplnost, které se týkají dokazatelnosti z libovolné množiny předpokladů.
Věta 1.3.5 (o úplnosti) Formule ϕ je dokazatelná z prázdné množiny předpokladů,
právě když ϕ je tautologie.
Věta 1.3.6 (o silné úplnosti) (a) Je-li T libovolná množina formulí, pak T je
splnitelná, právě když T je bezesporná.
(b) Je-li T množina formulí a ϕ libovolná formule, pak T ϕ, právě když T |= ϕ.
Implikaci ⇒ ve větě o úplnosti se říká věta o korektnosti a implikacím ⇒ ve
větě o silné úplnosti se říká věta o silné korektnosti. Zdůrazněme, že právě věty
o korektnosti jsou důležitým nástrojem, chceme-li dokázat, že nějaká formule není
dokazatelná nebo že nějaká množina je bezesporná. Cvičení 11 ukazuje použití věty
o korektnosti na kalkulus, o kterém nevíme, zda je úplný vůči dané sémantice.
1.3 Hilbertovský výrokový kalkulus 35
Důkaz (všech tvrzení obou vět až na jedno) Začněme důkazem implikace ⇒
v tvrzení (b) věty o silné úplnosti. Tím bude dokázána i implikace ⇒ ve větě o
úplnosti. Platí-li T ϕ, pak existuje důkaz ϕ1, . . , ϕn (kde ϕn je ϕ) formule ϕ
z předpokladů T. Indukcí podle i dokážeme T |= ϕi. Když ϕi je výrokový axiom
nebo prvek množiny T, pak vskutku T |= ϕi. Jinak je ϕi odvozena z předchozích
členů ϕj a ϕk = ϕj → ϕi pravidlem MP. Indukční předpoklad říká T |= ϕj
a T |= ϕj → ϕi. Zbývá ověřit, že pravidlo MP je silně korektní v tomto smyslu:
když T |= ϕj a T |= ϕj → ϕi, pak T |= ϕi. To ponecháváme na čtenáři.
Zvolme nyní pevně atom p a uvažujme formuli p & ¬p. Snadno lze ověřit, že
T p & ¬p, právě když T je sporná. Z deﬁnice důsledku plyne, že T |= p & ¬p,
právě když T není splnitelná. Tím jsme ověřili, že ve větě o silné úplnosti (a)
vyplývá z (b).
Předpokládejme nyní, že T |= ϕ. Podle věty o kompaktnosti existuje konečná
množina F = {ψ1, . . , ψk} ⊆ T taková, že F |= ϕ. Snadnou úvahou o pravdivostních
ohodnoceních lze zjistit, že formule ψ1 → (ψ2 → (. . → (ψk → ϕ) . .) je tautologie.
Podle věty o úplnosti je tato formule dokazatelná z T (a z jakékoliv jiné množiny
předpokladů také). Protože všechny ψi jsou v T, platí T ϕ. Použitím věty o
kompaktnosti a věty o úplnosti jsme dokončili důkaz věty o silné úplnosti. Na
později jsme odložili podstatný krok, totiž důkaz implikace ⇐ ve větě o úplnosti.
QED
Nechť ϕ je výroková formule a nechť v je pravdivostní ohodnocení. Deﬁnujme
formuli ϕv
jako ϕ v případě, kdy v(ϕ) = 1, a jako ¬ϕ v případě, kdy v(ϕ) = 0.
V obou případech tedy platí v(ϕv
) = 1.
Lemma 1.3.7 Nechť v je pravdivostní ohodnocení, p1, . . , pm jsou výrokové atomy
a ϕ je formule sestavená z p1, . . , pm (ne všechny se skutečně musí ve ϕ vyskytovat).
Pak ϕv
je dokazatelná z množiny předpokladů {pv
1, . . , pv
m}.
Důkaz Označme T množinu předpokladů {pv
1, . . , pv
m} a postupujme indukcí podle
složitosti formule ϕ. Je-li ϕ výrokový atom, pak ϕv
je v T a platí T ϕv
.
Nechť ϕ je tvaru ¬ψ a nechť pro ψ tvrzení platí. Když v(ψ) = 1, pak ψv
je ψ,
dále ϕv
je ¬¬ψ a z indukčního předpokladu T ψv
plyne T ϕv
díky tvrzení (e)
lemmatu 1.3.4. Když v(ψ) = 0, pak ϕv
= (¬ψ)v
= ¬ψ = ψv
a není co dokazovat.
Nechť ϕ je tvaru ψ → χ a nechť pro ψ i χ tvrzení platí. Když v(χ) = 1, pak
χv
= χ a ϕv
= ψ → χ, a z indukčního předpokladu T χv
plyne T ϕv
díky
axiomu χ → (ψ → χ). Když v(ψ) = 0, pak ψv
= ¬ψ a ϕv
= ψ → χ, a z indukčního
předpokladu T ψv
plyne T ϕv
díky bodu (a) lemmatu 1.3.4. Poslední možný
případ je v(ψ) = 1 a zároveň v(χ) = 0. Pak ψv
= ψ, χv
= ¬χ a ϕv
= ¬(ψ → χ),
a z indukčních předpokladů T ψv
a T χv
plyne T ϕv
díky bodu (i) lemmatu
1.3.4.
Zbývající případy, kdy ϕ je konjunkcí nebo disjunkcí, přenecháváme čtenáři s tím,
že je třeba také formulovat a dokázat příslušné rozšíření lemmatu 1.3.4. QED
36 1 Výroková logika
Důkaz věty o úplnosti Nechť ϕ je libovolná tautologie. Chceme ověřit, že ϕ je
dokazatelná v kalkulu HK. Nechť p1, . . , pm jsou všechny výrokové atomy vyskytující
se ve ϕ. Protože ϕ je tautologie, předchozí lemma říká, že
pv
1, . . , pv
m ϕ
pro každé pravdivostní ohodnocení v. Deﬁnujme pro 0 ≤ k ≤ m elementární množinu
(předpokladů) délky k jako množinu obsahující k formulí, a to právě jednu
z formulí pi, ¬pi pro každý z atomů p1, . . , pk. Díky tomuto dočasnému pojmu nebudeme
už muset mluvit o pravdivostních ohodnoceních. Existuje 2k
elementárních
množin délky k. Uvažujme nyní tvrzení
Je-li T libovolná elementární množina délky k, pak T ϕ. (∗k)
Předchozí lemma říká, že pro k = m tvrzení (∗k) platí. Dokážeme (sestupnou)
indukcí podle k, že (∗k) platí pro každé k takové, že 0 ≤ k ≤ m. Tvrzení (∗0) je to,
co jsme měli dokázat.
Nechť tedy 0 ≤ k < m a T je libovolná elementární množina délky k. Indukční
předpoklad říká, že platí T, pk+1 ϕ i T, ¬pk+1 ϕ, neboť T, pk+1 a T, ¬pk+1 jsou
elementární množiny délky k + 1. Věta o dedukci dává
T pk+1 → ϕ a T ¬pk+1 → ϕ.
Z toho plyne T ϕ vzhledem k bodu (l) lemmatu 1.3.4. QED
Pokusme se shrnout, čeho jsme v tomto oddílu dosáhli a co se nepodařilo. Sestrojili
jsme důkazový systém, který je silně úplný vzhledem k sémantice klasické
výrokové logiky. Pozoruhodné je, že všechny tautologie lze odvodit užitím jen
konečně mnoha logických principů vyjádřených axiomy a odvozovacími pravidly
kalkulu HK. Další výhodou kalkulu HK je to, že přidáním několika pravidel a axiomů
o kvantiﬁkátorech z něj lze, jak později uvidíme, snadno získat kalkulus i pro
predikátovou logiku.
K vysvětlení toho, co možná nedopadlo úplně podle očekávání, zaveďme několik
pojmů. Délku formule ϕ značíme |ϕ| a rozumíme jí souhrnný počet všech výskytů
logických spojek a atomů ve ϕ. Například formule (¬p → p) → q má délku 6.
Délkou |d| důkazu d a délkou |T| konečné množiny T rozumíme součet délek všech
formulí v d resp. v T. Délky tedy měříme prvky množiny N = {0, 1, 2, 3, . . . } všech
přirozených čísel. O funkcích f a g z N do N řekneme, že f neroste řádově rychleji
než g, stručně f ∈ O(g) nebo f(n) je O(g(n)), jestliže existují přirozená čísla
c a n0 taková, že f(n) ≤ c · g(n) pro všechna n ≥ n0. Například funkce 6n2
+ 9
je O(n2
), protože pro n ≥ 3 platí 6n2
+ 9 ≤ 7n2
. Táž funkce je ovšem i O(n3
) atd.
Řekneme-li, že každá tautologie délky n má důkaz délky O(g(n)), pak to v souladu
s touto deﬁnicí znamená, že existuje číslo c takové, že každá tautologie ϕ od určité
délky výše má (alespoň jeden) důkaz, jehož délka je nejvýše c · g(|ϕ|).
Ve cvičeních vybízíme čtenáře k analýze našeho důkazu věty o úplnosti, kterou
lze ověřit, že každá tautologie délky n má důkaz délky O(n2
· 2n
). Zajímavá a
1.3 Hilbertovský výrokový kalkulus 37
dosud nevyřešená je otázka, zda funkci n2
·2n
lze nahradit některou funkcí rostoucí
pomaleji než exponenciálně, například polynomem, tj. otázka
• Má každá tautologie délky n důkaz v HK délky p(n), kde p je vhodný polynom?
Pokud ne, existuje kalkulus jiný než HK, pro který to platí?
Tato otázka souvisí s důležitými otevřenými problémy ve výpočtové složitosti a
krátce se k ní ještě vrátíme v příští kapitole. Odpověď ano by ve výpočtové složitosti
měla silné a neočekávané důsledky, a je tudíž považována za nepravděpodobnou.
To znamená, že za nedokázaných, ale celkem věrohodných předpokladů
z výpočtové složitosti mají některé krátké tautologie jen velmi dlouhé důkazy, a
platí to o jakémkoliv kalkulu. O některých kalkulech (jiných než HK) to dokonce
již bylo dokázáno bez užití předpokladů z výpočtové složitosti. Nalezení formálního
důkazu nějaké formule může v jednotlivých případech být rychlejší cestou k ověření,
že je tautologií, než probírání všech pravdivostních ohodnocení, ale obecně, tj. pro
všechny tautologie, to (asi) neplatí.
Kvantitativní analýza výsledků z logiky je oblast, která je živá a v poslední době
se rychle rozvíjí. Studiu problematiky výrokových kalkulů a její souvislosti s výpočtovou
složitostí je například věnována Krajíčkova kniha [50]. Zajímavé a přehledné
pojednání o délkách důkazů (i v predikátové logice) je Pudlákova kapitola [69].
Cvičení
1. Zdůvodněte podrobně, že ve větě o dedukci platí i opačná implikace: když
T ψ → ϕ, pak T, ψ ϕ.
2. Dokončete důkaz lemmatu 1.3.4.
3. Množina T, ¬ϕ je sporná, právě když T ϕ. Dokažte.
Návod. Využijte bod (j) lemmatu 1.3.4.
4. Kromě schémat týkajících se implikace a negace, která jsou uvedena v lemmatu
1.3.4, jsou k dokončení důkazu věty o úplnosti užitečná ještě tři schémata
týkající se disjunkce:
ϕ → (ϕ ∨ ψ), ψ → (ϕ ∨ ψ), ¬ϕ → (¬ψ → ¬(ϕ ∨ ψ)).
Zdůvodněte, že jsou dokazatelná v kalkulu HK. Formulujte ještě další tři potřebná
schémata týkající se konjunkce a zdůvodněte i jejich dokazatelnost.
5. Pravidlo substituce ϕ / ϕp(χ) umožňuje z libovolné formule ϕ odvodit formuli,
která z ní vznikne nahrazením všech výskytů některého atomu toutéž (libovolnou)
formulí. Rozhodněte, zda pro kalkulus, který vznikne přidáním pravidla
substituce ke kalkulu HK, platí věta o korektnosti a věta o silné korektnosti.
6. Zdůvodněte, že z věty o silné úplnosti plyne věta o kompaktnosti.
38 1 Výroková logika
7. Zdůvodněte, že (b) ve větě o silné úplnosti plyne z (a).
Návod. Využijte cvičení 3.
8. Označme HK∗
výrokový kalkulus, který vznikne z kalkulu HK nahrazením schématu
A3 následujícím schématem A3∗
:
A3∗
: (¬ϕ → ¬ψ) → (ψ → ϕ).
Zdůvodněte, že pro kalkulus HK∗
platí věta o dedukci i věta o silné korektnosti.
9. Dokažte, že všechna schémata z lemmatu 1.3.4 jsou dokazatelná také v kalkulu
HK∗
. Pro kalkulus HK∗
tedy platí věta o úplnosti, a tedy HK a HK∗
jsou
ekvivalentní kalkuly.
Návod. Postupujte jako v důkazu lemmatu 1.3.4. V (c) zdůvodněte, že místo
¬¬ϕ → ϕ stačí dokázat ¬¬ϕ ¬¬ϕ → ϕ. K tomu užijte A3∗
ve tvaru
(¬ϕ → ¬¬¬ϕ) → (¬¬ϕ → ϕ). V (l) dokažte
ψ → ϕ, ¬ψ → ϕ ¬ϕ → ϕ ; (h), (b),
a pak užijte (j).
10. Zdůvodněte, že každá formule neobsahující konjunkci a disjunkci je v kalkulu
HK dokazatelná bez užití axiomů A4–A7.
11. Předpokládejte, že konjunkce a disjunkce se neuvažují a že implikace a negace
nemají dvouhodnotové, ale následující tříhodnotové tabulky:
¬
2 0
1 0
0 2
→ 2 1 0
2 2 1 0
1 2 2 0
0 2 2 2
Dokažte, že pravidlo MP je silně korektní vůči takto modiﬁkované sémantice
v tom smyslu, že z formulí, které při každém pravdivostním ohodnocení mají
pravdivostní hodnotu 2, dovoluje odvodit opět pouze formuli, která při každém
pravdivostním ohodnocení má hodnotu 2. Uvažujte výrokový logický systém
s jediným pravidlem modus ponens a s následujícími schématy axiomů:
ϕ → (ψ → ϕ),
(ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ)),
(ϕ → ψ) → ((ϕ → ¬ψ) → ¬ϕ),
ϕ → (¬ϕ → ψ).
Formulujte a dokažte větu o silné korektnosti tohoto systému vůči uvedené
tříhodnotové sémantice. Dokažte, že formule (¬p → ¬q) → ((¬p → q) → p)
a ¬¬p → p nejsou v tomto systému dokazatelné.
1.3 Hilbertovský výrokový kalkulus 39
12. Rozhodněte, které formule z lemmatu 1.3.4 jsou dokazatelné v kalkulu z cvičení
11.
Návod. Tentokrát je asi výhodnější dokázat dřív (e) než (d) a dřív (h) než (f).
13. Zdůvodněte, že připustíme-li i konjunkci a disjunkci a přidáme-li ke kalkulu ze
cvičení 11 schémata A4–A7, na nedokazatelnosti formule ¬¬p → p a formule
(¬p → ¬q) → ((¬p → q) → p) se nic nezmění.
14. Nechť T a ϕ jsou takové, že T ϕ. Vezměte limitní ordinální číslo ε a posloupnost
{ψα; α < ε} všech výrokových formulí a deﬁnujte posloupnost {Sα; α < ε}
množin výrokových formulí následující rekurzí:
S0 = T ∪ {¬ϕ},
Sα+1 =
Sα ∪ {ψα} když Sα ∪ {ψα} je bezesporná
Sα ∪ {¬ψα} jinak,
Sλ =
α<λ
Sα, když λ < ε je limitní,
S =
α<ε
Sα.
Dokažte, že každá množina Sα i celá S je bezesporná a že S má všechny vlastnosti
(i)–(iv) z prvního důkazu věty o kompaktnosti. Dále podobně jako v onom
důkazu deﬁnujte pravdivostní ohodnocení, které splňuje všechny formule množiny
T, ¬ϕ. Tím jste dokončili přímý důkaz věty o silné úplnosti kalkulu HK.
15. Má-li libovolné ze schémat jmenovaných v lemmatu 1.3.4 délku n, pak má důkaz
v HK délky O(n). Dokažte.
Návod. Důkaz kterékoliv formule tvaru například ¬¬ϕ→ϕ lze získat dosazením
do jediného důkazu formule ¬¬p → p.
16. Má-li formule ϕ důkaz délky n z množiny T, ψ, pak formule ψ → ϕ má důkaz
délky O(n) · O(|ψ|) z množiny T. Dokažte.
Návod. Nechť d = ϕ1, . . , ϕr, kde ϕr = ϕ, je důkaz formule ϕ z množiny T, ψ.
Nechť |d| ≤ n. Musí platit r ≤ n. Můžeme předpokládat, že formule ϕ1, . . , ϕr
jsou navzájem různé. Nechť d je důkaz formule ψ→ϕ sestrojený v důkazu věty
o dedukci. V místě, kde v důkazu d je formule ϕi odvozena z předchozích formulí
pomocí pravidla MP, jsou v důkazu d tři formule. Přeskupením symbolů
v těchto třech formulích můžeme získat: formuli ϕi, šest výskytů formule ψ,
tři výskyty formule ϕj → ϕi a sedm výskytů implikace. Protože v důkazu d se
neopakují formule, můžeme říci, že každá formule ϕk důkazu d se v důkazu d
vyskytuje nejvýše sedmkrát, a to jednou nebo čtyřikrát (je-li výrokovým axiomem
nebo prvkem množiny Γ) na původním místě, a pak ještě třikrát někde
dále, je-li implikací ϕj → ϕi zmíněnou výše. V důkazu d je dále nejvýše 6n
výskytů formule ψ a nejvýše 7n nových implikací, jiné symboly v něm nejsou.
40 1 Výroková logika
17. Dokažte, že je-li v pravdivostní ohodnocení a ϕ výroková formule sestavená
z atomů p1, . . , pm, pak ϕv
má důkaz z předpokladů pv
1, . . , pv
m délky O(|ϕ|2
).
18. Dokažte, že je-li ϕ tautologie délky n, pak ϕ má důkaz délky O(n2
· 2n
).
Návod. Uvažte, že formule délky n obsahuje nejvýše n různých atomů. J. Krajíček
nás upozornil, že lze počítat o něco přesněji: tautologie délky n má nejvýše
(2n)/3 atomů a funkce n2
· 2(2n)/3
je v O(2n
).
19. Zdůvodněte, že ke každému důkazu-posloupnosti délky n existuje stromový
důkaz téže formule, jehož délka je O(2n
).
1.4 Gentzenovský výrokový kalkulus
Věta o úplnosti pro hilbertovský kalkulus HK spolu s tabulkovou metodou zaručují
existenci algoritmu, který pro každou výrokovou formuli rozhodne, je-li dokazatelná
v kalkulu HK. Šlo by takový algoritmus odvodit přímo z deﬁnice důkazu,
bez odvolání se na sémantiku? Možná, že o existenci důkazu dané formule
v HK nebo v nějakém jiném kalkulu by šlo rozhodnout tak, že bychom se pokusili
důkaz dané formule sestrojit od konce, tj. že bychom se pokusili zpětným užíváním
pravidel kalkulu dospět od dané formule k axiomům. Pravidlo modus ponens
kalkulu HK má bohužel pro tento účel nevýhodnou vlastnost, že dvojic ψ1, ψ2,
z nichž lze jedním užitím pravidla MP odvodit danou formuli ϕ, je nekonečně
mnoho.
Studium kalkulu GK, do kterého se nyní pustíme, vrhne určité světlo na otázku,
jakou cenu je třeba zaplatit za kalkulus, jehož pravidla by neměla právě popsanou
nevýhodnou vlastnost pravidla MP.
V kalkulu GK (gentzenovském klasickém) se na rozdíl od kalkulu HK nedokazují
jednotlivé formule, ale sekventy. Někdy se proto mluví také o sekventovém kalkulu.
Sekvent je deﬁnován jako dvojice konečných množin formulí. Sekvent sestávající
z množin Γ a ∆ zapisujeme Γ ⇒ ∆ . Jeho zamýšlený význam je „platí-li všechny
formule z Γ, pak platí i některá formule v ∆ . Znaménko ⇒ v zápisu sekventu není
metamatematickou zkratkou ani logickou spojkou, nýbrž formálním symbolem oddělujícím
množiny Γ a ∆. Množině Γ v sekventu Γ ⇒ ∆ říkáme antecedent
a množině ∆ sukcedent. Antecedent i sukcedent mohou být i prázdné. Pokračujeme
v praxi vypouštění množinových symbolů ∪ a ∅ a složených závorek, jde-li o
množiny formulí. Například místo Γ ∪ {ϕ} ⇒ ∅ píšeme jen Γ, ϕ ⇒ . Význam
sekventu Γ ⇒ je „nemohou současně platit všechny formule z Γ (tj. „množina Γ
je sporná ), význam sekventu ⇒ ϕ je „platí ϕ . V souladu s tím deﬁnujeme
důkaz formule ϕ jako důkaz sekventu ⇒ ϕ .
V literatuře se většinou lze setkat s trochu jiným způsobem zapisování sekventů.
Například v [49] a [91] se nepíší lomené závorky a místo ⇒ se píše delší jednoduchá
šipka −→. Spojka implikace se v literatuře o gentzenovských kalkulech často
zapisuje symbolem  ¡.
1.4 Gentzenovský výrokový kalkulus 41
Gentzenovský (sekventový) kalkulus GK má následující odvozovací pravidla:
A: / Γ, ϕ ⇒ ∆, ϕ ,
W: Γ ⇒ ∆ / Γ ⇒ ∆, ϕ , Γ ⇒ ∆ / Γ, ϕ ⇒ ∆ ,
∨-r: Γ ⇒ ∆, ϕ / Γ ⇒ ∆, ϕ ∨ ψ , Γ ⇒ ∆, ϕ / Γ ⇒ ∆, ψ ∨ ϕ ,
&-l: Γ, ϕ ⇒ ∆ / Γ, ϕ & ψ ⇒ ∆ , Γ, ϕ ⇒ ∆ / Γ, ψ & ϕ ⇒ ∆ ,
&-r: Γ ⇒ ∆, ϕ , Γ ⇒ ∆, ψ / Γ ⇒ ∆, ϕ & ψ ,
∨-l: Γ, ϕ ⇒ ∆ , Γ, ψ ⇒ ∆ / Γ, ϕ ∨ ψ ⇒ ∆ ,
¬-l: Γ ⇒ ∆, ϕ / Γ, ¬ϕ ⇒ ∆ ,
¬-r: Γ, ϕ ⇒ ∆ / Γ ⇒ ∆, ¬ϕ ,
→-r: Γ, ϕ ⇒ ∆, ψ / Γ ⇒ ∆, ϕ → ψ ,
→-l: Γ ⇒ ∆, ϕ , Π, ψ ⇒ Λ / Γ, Π, ϕ → ψ ⇒ ∆, Λ ,
Cut: Γ ⇒ ∆, ϕ , Π, ϕ ⇒ Λ / Γ, Π ⇒ ∆, Λ .
Vidíme, že na rozdíl od kalkulu HK, který má jen jedno pravidlo s nenulovým počtem
předpokladů, má kalkulus GK naopak jen jedno pravidlo, totiž A, s nulovým
počtem předpokladů. Pravidlo A umožňuje prohlásit za odvozený jakýkoliv sekvent,
který má nějakou formuli současně v antecedentu i v sukcedentu. Takovému
sekventu se říká iniciální sekvent, někdy též axiom.
Důkaz v kalkulu GK lze podobně jako důkaz v kalkulu HK deﬁnovat buď jako
konečnou posloupnost sekventů, v níž každý (je iniciální nebo) je odvozen z předchozích
pomocí některého pravidla, nebo jako konečný orientovaný strom s vrcholy
ohodnocenými sekventy, v jehož listech jsou iniciální sekventy, dále každý jiný sekvent
je odvozen z jednoho nebo dvou dceřinných sekventů pomocí některého pravidla
a v kořenu je výsledný (ﬁnální) sekvent.
Jednoduchý důkaz zapsaný ve formě stromu může vypadat například takto:
ϕ ⇒ ϕ / ⇒ ϕ, ¬ϕ
¬ϕ ⇒ ¬ϕ
ϕ → ¬ϕ ⇒ ¬ϕ / ⇒ (ϕ → ¬ϕ) → ¬ϕ .
V tomto důkazu je ﬁnální sekvent ⇒ (ϕ→¬ϕ)→¬ϕ odvozen třemi kroky ze dvou
iniciálních sekventů. Vlevo nahoře je lomítkem vyznačeno použití pravidla ¬-r.
Každé z obou pravidel pro negaci umožňuje připsat negaci ke kterékoliv formuli
v antecedentu (resp. v sukcedentu) a zároveň ji přemístit na druhou stranu. Velkou
složenou závorkou je vyznačeno použití pravidla →-l. Toto pravidlo je použito na
množiny Γ = ∅, ∆ = {ϕ}, Π = ∅ a Λ = {¬ϕ}. Pravidlo →-l umožňuje utvořit E
implikaci z formulí, z nichž závěr byl původně v antecedentu jednoho a premisa
42 1 Výroková logika
v sukcedentu druhého sekventu. Tyto formule jsou v našem případě vyznačeny
podtržením. V posledním kroku je použito pravidlo →-r.
Na obrázku 1.4.1 je jiný příklad důkazu, tentokrát zapsaný ve formě stromu
s kořenem dole a s kroky vyznačenými vodorovnými linkami. Snadno lze ověřit,
že všechny kroky tohoto důkazu odpovídají pravidlům kalkulu GK. V okamžiku,
kdy bylo použito pravidlo →-l, jsme pro jistotu ony formule, ze kterých byla utvořena
„nová implikace v antecedentu, opět vyznačili podtržením. Všimněme si
podrobně posledních dvou kroků, na kterých si můžeme ukázat důležitou vlastnost
kalkulu GK. V předposledním kroku je formule ¬ψ ∨ χ odvozena pomocí pravidla
∨-r z formule ¬ψ a v posledním kroku je pak táž formule odvozena podle
stejného pravidla ještě jednou z formule χ. Druhé odvození téže formule ale rozhodně
nebylo zbytečné, neboť současně byla odstraněna formule χ. Tím chceme
upozornit na skutečnost, že zápisy tvaru ∆, ψ nebo ∆, ϕ∨ψ připouštějí, že formule ψ
resp. ϕ∨ψ je v množině ∆. Pravidlo ∨-r umožňuje odvodit sekvent Γ ⇒ ∆, ϕ∨ψ
ze sekventu Γ ⇒ ∆, ψ jak v případě, kdy ψ ∈ ∆, což velkou cenu nemá, tak
v případě, kdy ϕ ∨ ψ ∈ ∆, což je naopak podstatné. Totéž platí o ostatních pravidlech.
Není tedy úplně výstižné říci například o pravidlu ¬-l, že umožňuje připsat
do antecedentu formuli ¬ϕ za předpokladu, že v sukcedentu předchozího již dokázaného
sekventu je formule ϕ. Přesnější je říci, že pravidlo ¬-l umožňuje odstranit
ze sukcedentu libovolnou formuli ϕ za předpokladu, že formule ¬ϕ je v antecedentu
nebo že ji tam přidáme. Na pravidlech gentzenovského kalkulu je tedy podstatné
to, že ve formálním důkazu mohou některé formule postupně zmizet. Méně podstatné
je to, že nové formule se mohou postupně objevit. Kdyby šlo jen o přidání
nových formulí, vystačili bychom s pravidlem W, kterému se česky říká pravidlo
oslabení, anglicky weakening rule.
Formuli nebo formulím, které při použití nějakého pravidla vznikají nově nebo
opětovně, se říká principální formule tohoto (použití) pravidla. Formuli, která při
použití pravidla mizí, říkejme vstupní formule tohoto (použití) pravidla. Ostatní
formule v sekventu, se kterými se neděje nic, jsou postranní. Je-li například sekvent
Γ ⇒ ∆, ϕ → ψ odvozen pravidlem →-r ze sekventu Γ, ϕ ⇒ ∆, ψ , pak
ϕ a ψ jsou vstupní formule, ϕ → ψ je principální a formule v Γ a v ∆ jsou postranní.
Jak vstupní, tak principální formule může být zároveň postranní formulí.
χ ⇒ χ
ϕ, ψ ⇒ ϕ ϕ, ψ ⇒ ψ
ϕ, ψ ⇒ ϕ & ψ
ϕ ⇒ ϕ & ψ, ¬ψ
⇒ ϕ & ψ, ¬ψ, ¬ϕ
¬ϕ → χ ⇒ ϕ & ψ, ¬ψ, χ
¬(ϕ & ψ), ¬ϕ → χ ⇒ ¬ψ, χ
¬(ϕ & ψ), ¬ϕ → χ ⇒ ¬ψ ∨ χ, χ
¬(ϕ & ψ), ¬ϕ → χ ⇒ ¬ψ ∨ χ
Obrázek 1.4.1: Příklad důkazu v gentzenovském kalkulu
1.4 Gentzenovský výrokový kalkulus 43
Pravidlo Cut, kterému se česky říká pravidlo řezu, nemá žádnou principální formuli.
Ostatní pravidla mají vždy jednu principální formuli, jen o pravidle A si můžeme
myslet, že má dvě. Pravidlům W a Cut se říká strukturální, ostatní pravidla jsou
výrokově logická. Důkaz, ve kterém není použito pravidlo Cut, se nazývá bezřezový.
Oba dosud uvedené příklady jsou bezřezové.
Prohlédněme si ještě jeden příklad důkazu, tentokrát zapsaného ve formě posloupnosti
sekventů. Na tomto příkladu si zároveň ukážeme, jak může být pravidlo
Cut užitečné ke spojení dílčích výsledků do jediného důkazu. Předpokládejme,
že si přejeme dokázat formuli ((ϕ → ψ) → ϕ) → ϕ. Označme ji A. Máme tedy
sestrojit důkaz sekventu ⇒ A . Důkaz sestrojíme formalizací následující úvahy:
(i) Platí ϕ nebo ¬ϕ.
(ii) Když ϕ, pak ano, platí také jakákoliv implikace tvaru (. .) → ϕ.
(iii) Když ¬ϕ, pak platí ϕ → ψ.
(iv) Když ¬ϕ a ϕ → ψ, pak neplatí (ϕ → ψ) → ϕ.
(v) Když ¬((ϕ → ψ) → ϕ), pak ano, platí implikace ((ϕ → ψ) → ϕ) → ϕ.
Jednotlivým krokům této neformální úvahy odpovídá následující formální důkaz.
Každý z prvních třinácti členů je buď iniciálním sekventem nebo je odvozen z bezprostředně
předchozího nebo dvou předchozích sekventů:
1: ϕ ⇒ ϕ, ψ
2: ϕ, ¬ϕ ⇒ ψ
3: ¬ϕ ⇒ ϕ → ψ ; Krok (iii)
4: ϕ → ψ ⇒ ϕ → ψ
5: ϕ ⇒ ϕ
6: ϕ → ψ, (ϕ → ψ) → ϕ ⇒ ϕ
7: ϕ → ψ, ¬ϕ, (ϕ → ψ) → ϕ ⇒
8: ϕ → ψ, ¬ϕ ⇒ ¬((ϕ → ψ) → ϕ) ; Krok (iv)
...
11: ¬((ϕ → ψ) → ϕ) ⇒ A ; Krok (v)
12: ϕ, (ϕ → ψ) → ϕ ⇒ ϕ
13: ϕ ⇒ A ; Krok (ii).
Nyní použijeme (třikrát) pravidlo řezu a dokončíme důkaz sekventu ⇒ A :
14: ϕ → ψ, ¬ϕ ⇒ A ; Cut na 11, 8
44 1 Výroková logika
15: ¬ϕ ⇒ A ; Cut na 14, 3
16: ϕ ∨ ¬ϕ ⇒ A ; ∨-l na 15, 13
...
21: ⇒ A .
Vynechali jsme šest sekventů s čísly 9, 10 a 17–20. Čtenář, který je dovede doplnit,
pravděpodobně už ví, jak gentzenovský kalkulus funguje.
Řekneme, že Γ ⇒ ∆ je tautologický sekvent, jestliže ke každému pravdivostnímu
ohodnocení v, pro které platí v(ϕ) = 1 pro každou formuli ϕ ∈ Γ, existuje
formule ψ ∈ ∆ taková, že v(ψ) = 1. To znamená, že sekvent je tautologický, jestliže
neexistuje pravdivostní ohodnocení, které přiřazuje hodnotu 1 všem formulím v antecedentu
a hodnotu 0 všem formulím v sukcedentu.
Věta 1.4.1 (o úplnosti kalkulu GK) Sekvent Γ ⇒ ∆ je dokazatelný v kalkulu
GK, právě když je tautologický.
Důkaz Implikace ⇒ je věta o korektnosti a lze ji dokázat indukcí podle počtu
kroků v důkazu sekventu Γ ⇒ ∆ . Je zřejmé, že každý iniciální sekvent je
tautologický. Neexistuje-li pravdivostní ohodnocení v, které přiřazuje hodnotu 1
všem formulím v Γ a hodnotu 0 všem formulím v ∆, pak neexistuje ani pravdivostní
ohodnocení, které přiřazuje hodnotu 1 všem formulím v Γ, Π a hodnotu 0 všem
formulím v ∆, Λ, a to bez ohledu na volbu množin formulí Π a Λ. Tím je ověřena
korektnost pravidla W.
Korektnost všech ostatních pravidel lze ověřit podobně, podívejme se namátkou
ještě na pravidlo →-r. Nechť Γ, ϕ ⇒ ∆, ψ je tautologický sekvent. Máme ověřit,
že v tom případě i Γ ⇒ ∆, ϕ → ψ je tautologický sekvent. Nechť tedy v je
pravdivostní ohodnocení, které přiřazuje hodnotu 1 všem formulím v Γ. Když
v(ϕ) = 0, pak v(ϕ → ψ) = 1. Když v(ϕ) = 1, pak, protože Γ, ϕ ⇒ ∆, ψ je
tautologický sekvent, platí v(ψ) = 1 nebo v(χ) = 1 pro některou formuli χ ∈ ∆.
Když v(ψ) = 1, pak ovšem i v(ϕ → ψ) = 1. Ve všech případech tedy v sukcedentu
∆, ϕ → ψ existuje formule, které ohodnocení v přiřazuje hodnotu 1.
Zbývá dokázat podstatnou implikaci ⇐ tvrzení věty. Nechť Γ ⇒ ∆ je tautologický
sekvent. Máme dokázat, že je dokazatelný v GK. Postupujme indukcí podle
souhrnného počtu (výskytů) logických spojek v množině Γ ∪ ∆.
Nechť v množině Γ ∪ ∆ nejsou žádné logické spojky, tj. jsou tam samé atomické
formule. Když Γ ∩ ∆ = ∅, lze všem formulím v Γ přiřadit hodnotu 1 a všem
formulím v ∆ hodnotu 0. Jinak řečeno, když Γ ⇒ ∆ je tautologický sekvent,
pak Γ ∩ ∆ = ∅ a sekvent Γ ⇒ ∆ je iniciální, tedy dokazatelný v GK.
Nechť nyní Γ ∪ ∆ obsahuje i neatomické formule. Zvolme libovolnou z nich a
označme ji χ. Nechť χ ∈ Γ. Označme Π = Γ − {χ}, platí Π, χ = Γ. Podle toho,
1.4 Gentzenovský výrokový kalkulus 45
zda χ je tvaru ϕ → ψ, ϕ ∨ ψ, ϕ & ψ nebo ¬ϕ, připišme nad sekvent Γ ⇒ ∆ dva
(v případě negace jen jeden) nové sekventy podle následujícího návodu:
......
Π, ψ ⇒ ∆
......
Π ⇒ ∆, ϕ
Π, ϕ → ψ ⇒ ∆
......
Π, ϕ ⇒ ∆
......
Π, ψ ⇒ ∆
Π, ϕ ∨ ψ ⇒ ∆
......
Π, ϕ, ψ ⇒ ∆
Π, ϕ, ϕ & ψ ⇒ ∆
Π, ϕ & ψ ⇒ ∆
......
Π ⇒ ∆, ϕ
Π, ¬ϕ ⇒ ∆
s úmyslem vytvořit postupně důkaz sekventu Π, χ ⇒ ∆ . Snadno lze ověřit,
že je-li Π, χ ⇒ ∆ tautologický sekvent, pak nově utvořené sekventy jsou také
tautologické. A dále, ﬁnální sekvent Π, χ ⇒ ∆ je z nově utvořených sekventů
odvoditelný použitím (v případě konjunkce dvojnásobným) příslušného pravidla
kalkulu GK. Ve všech případech jsme tedy zpětným užitím pravidla →-l, ∨-l,
&-l resp. ¬-l (v případě konjunkce dvojnásobným užitím) převedli dokazatelnost
daného sekventu na dokazatelnost jednoho nebo dvou jiných tautologických sekventů.
Každý z nich má nejméně o jednu logickou spojku méně, a podle indukčního
předpokladu je tedy dokazatelný. Do míst označených tečkami tedy můžeme vepsat
další sekventy tak, abychom dostali požadovaný důkaz sekventu Γ ⇒ ∆ .
V případě, kdy χ ∈ ∆, postupujeme analogicky: podle toho, zda χ je implikací,
konjunkcí, negací nebo disjunkcí, použijeme zpětně pravidlo →-r, &-r, ¬-r resp.
dvakrát pravidlo ∨-r. QED
Větu o silné úplnosti kalkulu GK explicitně neformulujeme, spokojme se s následujícím
komentářem. Existují nejméně dva rozumné způsoby, jak pro gentzenovský
kalkulus deﬁnovat dokazatelnost z množiny předpokladů:
(i) Sekvent Γ ⇒ ∆ je dokazatelný z množiny předpokladů T, jestliže existuje
konečná množina Ω ⊆ T taková, že sekvent Ω, Γ ⇒ ∆ je dokazatelný v GK.
(ii) Sekvent Γ ⇒ ∆ je dokazatelný z T, jestliže je dokazatelný v modiﬁkovaném
kalkulu, ve kterém se kromě běžných iniciálních sekventů připouštějí ještě
iniciální sekventy tvaru ⇒ ϕ , kde ϕ ∈ T.
Obě možnosti jsou ekvivalentní (cvičení). Máme-li dokazatelnost sekventu z množiny
předpokladů a deﬁnujeme-li ještě vyplývání sekventu z množiny předpokladů,
snadno pak domyslíme, že silná úplnost plyne z úplnosti s užitím věty o kompaktnosti,
podobně jako v případě kalkulu HK.
Vraťme se ještě k našemu důkazu věty o úplnosti kalkulu GK. Důkaz daného
sekventu jsme tam sestrojili zpětným použitím pravidel kalkulu GK. Ne všechna
pravidla jsme v důkazu potřebovali. Obešli jsme se bez užití pravidel W a Cut a
věta o úplnosti by tedy platila i pro kalkulus bez těchto dvou pravidel. Navíc, u
46 1 Výroková logika
pravidla →-l, v jehož formulaci se vyskytují čtyři množiny formulí Γ, ∆, Π a Λ,
bychom vystačili s jednodušší formulací se dvěma množinami:
Γ ⇒ ∆, ϕ , Γ, ψ ⇒ ∆ / Γ, ϕ → ψ ⇒ ∆ .
Možnost zbavit se pravidla W a zjednodušit pravidlo →-l pokládejme za nepodstatnou.
Pravidlo W a obecnější formulace pravidla →-l se v kalkulu GK připouštějí
hlavně proto, aby bylo možné jen nevelkou modiﬁkací získat kalkulus pro jednu z neklasických
logik, což uvidíme v kapitole 5. Za pozoruhodnou pokládejme možnost
zbavit se pravidla Cut.
Věta 1.4.2 (o eliminovatelnosti řezů) Každý sekvent dokazatelný v kalkulu GK
je dokazatelný i bez užití pravidla řezu.
Všimněme si některých souvislostí věty o eliminovatelnosti řezů. Předpokládejme,
že v určitém kroku důkazu byl sekvent S odvozen použitím nějakého logického
pravidla ze sekventu S1 nebo ze dvou sekventů S1 a S2. Už jsme si vysvětlili,
že v sekventu S1 nebo v sekventech S1 a S2 mohou být formule, které nejsou v S.
Zbavit se určitých formulí je vlastně cílem dokazování. Například když S1 je sekvent
Γ, ϕ ⇒ ∆, ψ a S je sekvent Γ ⇒ ∆, ϕ→ψ , žádná z formulí ϕ a ψ nemusí
být prvkem množiny Γ ∪ ∆. Důležité však je, že žádná z těchto dvou formulí nemůže
zmizet beze stopy, obě jsou podformulemi formule ϕ → ψ. Této vlastnosti
pravidla →-r se anglicky říká subformula property. Česky říkejme, že pravidlo →-r
zachovává podformule: je-li sekvent S odvozen jedním krokem pomocí tohoto pravidla
ze sekventu S1, pak každá formule vyskytující se v S1 je podformulí některé
formule sekventu S (pokud ovšem vztah „býti podformulí chápeme jako reﬂexivní;
každá formule je svou vlastní podformulí). Lze ověřit, že také všechna ostatní pravidla
kalkulu GK s výjimkou pravidla Cut zachovávají podformule. Z toho plyne,
že každý bezřezový důkaz zachovává podformule v tom smyslu, že každá formule
v něm se vyskytující je podformulí některé formule ﬁnálního sekventu. Je-li tedy
dán sekvent Γ ⇒ ∆ , pak všech sekventů sestavených z podformulí formulí v něm
se vyskytujících je jen konečný počet, takže existuje algoritmus, který je všechny
probere. Zatím se zabýváme a ještě se dost dlouho budeme zabývat jen klasickou
logikou, pro kterou to mnoho nedává. Poznamenejme však pro budoucnost, že pro
každou výrokovou logiku, pro kterou lze deﬁnovat gentzenovský kalkulus tak, aby
platila věta o eliminovatelnosti řezů a aby všechna pravidla kromě pravidla Cut
zachovávala podformule, existuje algoritmus, který rozhoduje, zda daný sekvent je
nebo není dokazatelný.
Označme GK0 kalkulus, jehož pravidla se shodují s pravidly kalkulu GK až na
to, že se nepřipouští pravidlo Cut. Pro oba kalkuly platí věta o úplnosti, a tedy libovolný
sekvent Γ ⇒ ∆ je dokazatelný v GK, právě když je dokazatelný v GK0.
To ale neznamená, že sekvent Γ ⇒ ∆ je stejně rychle dokazatelný v GK a v GK0.
Kalkuly GK a GK0 jsou ekvivalentní, nemusí ale být stejně efektivní. K tomu zaveďme
následující pojem. Kalkulus C2 polynomiálně simuluje kalkulus C1, jestliže
ke každému důkazu délky n, který je důkazem nějaké formule v kalkulu C1, existuje
1.4 Gentzenovský výrokový kalkulus 47
důkaz téže formule v kalkulu C2 délky ne větší než p(n), kde p je vhodný polynom.
Přitom délkou důkazu (či sekventu) se myslí souhrnný počet výskytů všech výrokových
atomů a logických spojek. Lze dokázat (cvičení), že kalkuly HK a GK jsou
vzájemně polynomiálně simulovatelné: každý z nich polynomiálně simuluje druhý.
Existují i další výsledky o polynomiální simulovatelnosti kalkulů: J. Krajíček dokázal,
že stromové důkazy (v kalkulu HK i v kalkulu GK) polynomiálně simulují
důkazy-posloupnosti. Krajíčkův důkaz si ukážeme v oddílu 3.3. Na druhé straně
lze z [11] vyčíst Takeutiho důkaz, že (alespoň v případě, kdy důkazy jsou stromy)
není pravda, že kalkulus GK0 polynomiálně simuluje kalkulus GK. To znamená, že
použití pravidla řezu může některé důkazy velmi výrazně zkrátit.
Cvičení
1. Sestrojte důkazy následujících sekventů v kalkulu GK:
ϕ ∨ (ϕ & ψ) ⇒ ϕ , ϕ ∨ (ψ & ¬ψ) ⇒ ϕ ,
ψ & ¬ψ ⇒ ϕ & ψ & ¬ψ , ϕ → ψ, ¬ψ ⇒ ψ → χ ,
ϕ ∨ (ψ & χ) ⇒ (ϕ ∨ ψ) & (ϕ ∨ χ) , ϕ → ψ, ¬ψ ⇒ ϕ → χ ,
(ϕ ∨ ψ) & (ϕ ∨ χ) ⇒ ϕ ∨ (ψ & χ) , ¬(ϕ → ψ) ⇒ ϕ .
2. Vypracujte všechny vynechané části důkazů vět o korektnosti a úplnosti kalkulu
GK.
3. Deﬁnujte hloubku stromu jako délku nejdelší větve. Délka jednoprvkové větve
je nula. Analyzujte důkaz věty o úplnosti kalkulu GK a zdůvodněte, že každý
tautologický sekvent s n logickými spojkami má stromový důkaz hloubky nejvýše
2n, ve kterém je nejvýše 2n+1
− 1 sekventů.
Návod. Mez 2n+1
−1 dokažte indukcí podle n. Důkaz sekventu s n+1 logickými
spojkami sestává z důkazu sekventu s nejvýše n logickými spojkami a jednoho
nebo dvou dodatečných sekventů, nebo ze dvou důkazů sekventů s n logickými
spojkami a jen jednoho dodatečného sekventu.
4. Každý tautologický sekvent délky n má bezřezový důkaz délky O(n · 2n
). Do-
kažte.
5. Předpokládejte, že i ekvivalence ≡ se považuje za základní spojku, a navrhněte
pro ni pravidla zachovávající podformule tak, aby pro výsledný kalkulus platila
věta o úplnosti i věta o eliminovatelnosti řezů.
6. Navrhněte modiﬁkaci kalkulu GK pro případ, kdy se připouštějí i logické konstanty
a ⊥.
7. Dokažte, že kalkulus GK se stromovými důkazy (s důkazy-posloupnostmi) polynomiálně
simuluje kalkulus HK se stromovými důkazy (resp. s důkazy-po-
sloupnostmi).
48 1 Výroková logika
Návod. Každý axiom kalkulu HK lze dokázat v kalkulu GK důkazem lineární
délky. Pravidlo MP lze v kalkulu GK simulovat dvěma řezy.
8. Dokažte, že ve stejném smyslu také kalkulus HK polynomiálně simuluje kalkulus
GK.
Návod. Je-li Γ ⇒ ∆ sekvent takový, že Γ = ∅ a ∆ = ∅, deﬁnujte formuli
f( Γ ⇒ ∆ ) jako Γ → ∆. Rozšiřte deﬁnici i na případ, kdy Γ = ∅ nebo
∆ = ∅. U každého pravidla S1 / S resp. S1, S2 / S pracujte s implikacemi
f(S1) → f(S) a f(S1) → (f(S2) → f(S)).
9. Představte si modiﬁkaci kalkulu GK, ve které se pravidlo A smí použít jen
tehdy, je-li jeho principální formule atomická. Dokažte, že takto modiﬁkovaný
kalkulus je ekvivalentní s původním a že jej polynomiálně simuluje.
10. Nechť T je libovolná množina výrokových formulí. Označme GKT kalkulus,
ve kterém se kromě pravidel kalkulu GK připouštějí ještě iniciální sekventy
tvaru ⇒ α , kde α ∈ T. Dokažte, že libovolná formule ϕ je dokazatelnáE
v kalkulu GKT , právě když existuje konečná množina Ω ⊆ T taková, že sekvent
Ω, Γ ⇒ ∆ je dokazatelný v kalkulu GK.
11. Dokažte, že pro kalkulus GKT neplatí věta o eliminovatelnosti řezů.
Návod. Uvažujte množinu T = {p & q} a důkaz atomu p.
12. Uvažujte kalkulus s logickými konstantami a ⊥. Nechť Γ, Π ⇒ ∆, Λ je
tautologický sekvent. Dokažte indukcí podle počtu kroků v jeho bezřezovém
důkazu, že existuje formule ω, která je sestavena jen z atomů vyskytujících
se současně v obou sekventech Γ ⇒ ∆ a Π ⇒ Λ a případně logických
konstant a ⊥, a taková, že oba sekventy Γ ⇒ ∆, ω a Π, ω ⇒ Λ jsou
tautologické.
13. Odvoďte z předchozího cvičení větu o interpolaci: jsou-li ϕ a ψ výrokové formule
takové, že ϕ → ψ je tautologie, pak buď jedna z formulí ¬ϕ, ψ je tautologie,
nebo existuje formule ω sestavená jen z atomů vyskytujících se zároveň v obou
formulích ϕ, ψ taková, že ϕ → ω i ω → ψ jsou tautologie.
2
Algoritmy a úlohy
The distinction between recursive and recursively enumerable can be traced back to
(. . . ) Leibniz, when he talked of ars iudicandi (checking the correctness of a proof)
and ars inveniendi (ﬁnding a proof). (P. Odifreddi v [61])
Úlohy obecně mohou nebo nemusí být algoritmicky rozhodnutelné, a rozhoduje-li
nějaký algoritmus určitou úlohu, může mít tento algoritmus různé nároky na čas
potřebný k práci a na paměťový prostor nutný pro pomocné výpočty a poznámky.
Ukažme si nejprve na třech jednoduchých příkladech, co myslíme úlohou:
Hodnota booleovského výrazu
Dáno: Konečná posloupnost w sestavená ze znaků (, ), +, *, 0 a 1.
Úkol: Určit, zda w je syntakticky správným booleovským výrazem, a pokud ano,
určit jeho hodnotu.
Násobení
Dáno: Dvě přirozená čísla x a y.
Úkol: Určit jejich součin x · y.
Prvočíselnost
Dáno: Přirozené číslo x.
Úkol: Určit, zda x je prvočíslo.
Booleovský výraz je deﬁnován podobnou rekurzí jako třeba syntakticky správná
výroková formule (viz deﬁnice 1.1.1): 0 a 1 jsou booleovské výrazy, a dále jsou-li
u a v booleovské výrazy, pak také (u+v) a (u*v) jsou booleovské výrazy. Příkladem
booleovského výrazu je třeba ((1+0)+((1+1)*0)). Hodnotou booleovského výrazu
rozumíme to, co dostaneme, vyčíslíme-li operace + a * podle pravdivostních tabulek
pro disjunkci resp. konjunkci uvedených na straně 14. Výrazy (1+0) i (1+1) mají
tedy hodnotu 1, výraz ((1+1)*0) má hodnotu 0, výraz ((1+0)+((1+1)*0)) má
hodnotu 1.
Každá úloha je vlastně nekonečnou množinou otázek. V případě úlohy Násobení
jsou to například otázky „jaký je součin čísel 7 a 5? , „jaký je součin čísel
50 2 Algoritmy a úlohy
23 a 49? atd. Těmto otázkám se říká instance dané úlohy. Společnou vlastností
všech úloh je to, že instance i příslušné odpovědi lze zapsat jako konečné
posloupnosti znaků (symbolů), přičemž tyto symboly patří do předem známé konečné
množiny přípustných symbolů.
Předem zvolené konečné množině symbolů se říká abeceda. Konečné posloupnosti
prvků abecedy Σ jsou slova abecedy Σ nebo slova v abecedě Σ. Počtu výskytů
symbolů ve slově w říkáme délka slova w a značíme jej |w|. Délka slova w může být
libovolné přirozené číslo včetně nuly. Množina všech slov v abecedě Σ se značí Σ∗
.
U některých úloh můžeme uvažovat dvě abecedy, vstupní abecedu pro zapisování
instancí a výstupní abecedu pro zapisování odpovědí. V případě úlohy Hodnota
booleovského výrazu je vstupní abecedou množina {(, ), +, *, 0, 1}, za výstupní
abecedu můžeme považovat množinu {n, 0, 1}, jejíž prvky reprezentují odpovědi
„dané slovo w není booleovským výrazem , „dané slovo w je booleovským výrazem
s hodnotou 0 a „dané slovo w je booleovským výrazem s hodnotou 1 . Jsou-li
w1 a w2 slova v abecedě Σ, pak w1w2 značí spojení (konkatenaci) slov w1 a w2,
tj. slovo vzniklé zapsáním slov w1 a w2 (v tomto pořadí) za sebe. Například zápis
(u+v) v deﬁnici booleovského výrazu lze tedy chápat jako konkatenaci pěti slov,
z nichž tři jsou jednoznaková.
Vidíme, že úloha Hodnota booleovského výrazu je z matematického hlediska
vlastně funkcí z množiny {(, ), +, *, 0, 1}∗
do množiny {n, 0, 1}∗
či do množiny
{n, 0, 1}. Rovněž Prvočíselnost je vlastně funkcí, totiž funkcí deﬁnovanou
na množině N všech přirozených čísel, která má v bodě x ∈ N hodnotu 1
nebo 0 podle toho, zda x je nebo není prvočíslo. Snadno se lze domluvit, že také
Prvočíselnost je vlastně funkcí deﬁnovanou na jisté množině slov, přesněji řečeno
funkcí z jisté množiny X ⊆ Σ∗
1 do jisté množiny tvaru Σ∗
2: stačí říci, že přirozené
číslo je reprezentováno svým dekadickým zápisem, za vstupní abecedu Σ1
zvolit množinu {0, 1, . . , 9} obsahující deset dekadických číslic a za výstupní abecedu
prohlásit množinu {n, 0, 1}, jejíž prvky reprezentují odpovědi „dané slovo w
není zápisem přirozeného čísla , „dané slovo w je zápisem složeného přirozeného
čísla a „dané slovo w je zápisem prvočísla . Mohli bychom se také rozhodnout,
že přirozená čísla budeme zapisovat binárně (ve dvojkové soustavě), a že tedy vystačíme
se vstupní abecedou {0, 1}. V případě úlohy Násobení je malá potíž
v tom, že instance jsou dvojicemi přirozených čísel. Snadným řešením této potíže
je přijmout do vstupní abecedy ještě jeden znak pro oddělování přirozených čísel
od sebe, řekněme středník ;, a za vstupní slova správného formátu pak považovat
slova tvaru w1;w2, kde w1 a w2 jsou zápisy přirozených čísel. Úloha Násobení
je tedy vlastně funkcí z množiny {;, 0, 1, . . , 9}∗
nebo z množiny {;, 0, 1}∗
do množiny
{n, 0, 1}.
Úlohu tedy budeme v oddílu 2.1 deﬁnovat jako libovolnou funkci z jisté množiny
X do množiny Σ∗
2, kde X ⊆ Σ∗
1 a Σ1 a Σ2 jsou abecedy. Funkci g : X → Y ,
kde X a Y jsou nějaké množiny, budeme často také nazývat úlohou, a to tehdy,
bude-li domluveno nebo bude-li zřejmé, jak se prvky množin X a Y zapisují pomocí
symbolů jistých abeced. Tak jsme postupovali v případě úloh Prvočíselnost a
Násobení. Samozřejmě, existuje mnoho funkcí, které úlohami nejsou. Příkladem
2 Algoritmy a úlohy 51
funkce, kterou nelze považovat za úlohu, je funkce x → ex
, tj. mocnina se základem
e, kde e je Eulerovo číslo, uvažovaná v reálném oboru.
O funkci g z X do Σ∗
2, kde X ⊆ Σ∗
1, budeme říkat, že je algoritmicky počitatelná,
jestliže existuje algoritmus, který každý vstup w ∈ X přepracuje na
výsledek g(w). Existenci takového algoritmu budeme většinou prokazovat zapsáním
onoho algoritmu v programovacím jazyce RASP, který si pro tento účel zavedeme.
Jazyk RASP je abstraktním programovacím jazykem v tom smyslu, že se
nevztahuje k žádnému skutečnému počítači. Píšou se v něm programy pro myšlený
počítač, jehož činnost je přesně deﬁnována, který ale nikdy nebyl skutečně realizován
(sestaven z elektronických či jiných součástek). Takovému myšlenému počítači
vybavenému příslušným programovacím jazykem se také říká výpočtový model. Naším
primárním výpočtovým modelem tedy bude počítač RASP resp. programovací
jazyk RASP.
Budeme-li chtít zdůraznit, že nám jde o algoritmické zpracování určitých syntaktických
objektů (například formulí nebo důkazů), budeme k zápisu těchto syntaktických
objektů užívat strojopisné písmo. To jsme také udělali na začátku při
zápisu booleovských výrazů.
Časem uvidíme, že existují četné analogie mezi dokazováním a programováním.
Máme-li neformální (nicméně správný a dostatečně podrobný) důkaz nějakého tvrzení,
je pouze věcí zkušenosti, jak jej přepsat do formalismu kteréhokoliv logického
kalkulu. To jsme už viděli na str. 43, kde jsme na základě neformální úvahy sestrojili
formální důkaz formule ((ϕ→ψ)→ϕ)→ϕ, a řadu takových případů ještě uvidíme.
Podobně se to má s programováním. Neformální, nicméně správný a dostatečně
podrobný algoritmus může zkušený programátor přepsat do formalismu kteréhokoliv
programovacího jazyka. Zkušený programátor ale také ví, že je podstatné, aby
před psaním programu v daném jazyce již měl onen neformální algoritmus.
Skutečnost, že daný neformální důkaz nebo daný neformální algoritmus byl
úspěšně přepsán do formalismu určitého logického kalkulu nebo do formalismu určitého
programovacího jazyka, lze chápat jako potvrzení správnosti takového neformálního
důkazu nebo algoritmu. Postupně však chceme čtenáře přesvědčit, že
správný algoritmus lze rozpoznat i bez přepisování do daného formalismu a že
obvykle lze bez přepisování do daného formalismu stanovit i to, jaké má daný algoritmus
nároky na čas a paměťový prostor. Jsme přesvědčeni, že totéž platí i o
dokazování. Každý, kdo má určitou zkušenost s matematickými důkazy, dovede
odlišit správný důkaz od nesprávného a nepotřebuje se přitom opírat o jakýkoliv
logický kalkulus. Takto také rozumíme citátu z knihy [51] uvedenému v Úvodu na
str. 9: logika není hygienou matematiky.
V této kapitole si tedy zavedeme programovací jazyk RASP, naučíme se v něm
programovat a naučíme se analyzovat programy v něm napsané. Dále se zmíníme
o nejdůležitějších pojmech teorie rekurzívních funkcí a výpočtové složitosti. Tyto
pojmy pak využijeme v kapitole 4 a v některých úvahách kapitoly 5. Nicméně
čtenář, kterého souvislosti logiky a teoretické informatiky tolik nezajímají, by měl
vědět, že téměř celou kapitolu 3 a značné části zbývajících kapitol lze číst bez znalosti
problematiky z kapitoly 2. Naopak vážnější zájemce o teoretickou informatiku
52 2 Algoritmy a úlohy
upozorňujeme, že většinu obtížnějších důkazů týkajících se pojmů z kapitoly 2 jsme
vypustili. O jazyce RASP, který studujeme v oddílu 2.1, musíme uznat, že je v literatuře
méně běžný. Hledali jsme ale takový jazyk, ve kterém i netriviální programy
lze skutečně napsat, a to tak, že mají rozumnou délku a současně není obtížné
stanovit jejich časové a prostorové nároky. Některým čtenářům bude přitom určitě
zřejmé, že do deﬁnice jazyka RASP uložil autor část zkušenosti, kterou kdysi získal
v ČKD Polovodiče při psaní programů pro počítače ﬁrmy Digital. Některé vlast-E
nosti našeho výpočtového modelu jsou převzaty z jazyka, který na tomtéž pracovišti
navrhl a implementoval J. Pavelka se spolupracovníky.
2.1 Programování v jazyce RASP
Hlavními částmi počítače RASP jsou paměť, procesor, vstupní páska a výstupní
páska. Paměť počítače RASP je rozdělena na (paměťové) buňky. Každá buňka
může obsahovat (libovolně velké) celé číslo. Buněk je nekonečně mnoho a jsou
číslovány celými čísly. Je-li celé číslo chápáno jako číslo paměťové buňky, říkáme
mu adresa (oné buňky). Protože připouštíme i záporné adresy, můžeme o paměti
počítače RASP říci, že je oboustranně neomezená. Obsah libovolné buňky může
být interpretován jako data, tj. jako číslo, s nímž má být proveden nějaký výpočet,
nebo jako adresa (jiné buňky), nebo jako číselný kód (strojový kód) nějaké instrukce
(pro procesor).
Procesor počítače RASP pracuje v taktech (krocích), v každém taktu provádí
jednu instrukci, kterou si přečetl (tj. jejíž strojový kód si přečetl) v paměti počítače.
Strojový kód instrukce zabírá v paměti počítače podle druhu instrukce jednu nebo
několik sousedících buněk. Procesor má schopnost uchovávat (bez použití paměti
počítače) údaj, kterému se říká čítač instrukcí a který sestává z jednoho celého čísla.
Význam čítače instrukcí je „adresa instrukce, která má být provedena v následujícím
taktu . Každý takt tedy probíhá tak, že procesor přečte z paměti strojový kód
instrukce, jejíž adresu má uloženou v čítači instrukcí, přitom podle druhu instrukce
zvětší obsah čítače instrukcí tak, aby obsahoval adresu bezprostředně následující
instrukce, a pak přečtenou instrukci provede. Výsledkem provedení instrukce může
být ještě další změna čítače instrukcí. Některé instrukce, tzv. skokové instrukce,
totiž dělají právě (a pouze) to, že nastaví do čítače instrukcí určitou hodnotu, a to
podmíněně (podle výsledku dříve provedených instrukcí), nebo nepodmíněně.
Jednoduchý příklad programu v jazyce RASP je na obrázku 2.1.1 vlevo. V tomto
programu jsou užity dvě jednooperandové instrukce jeq a jgt, čtyři dvouoperandové
instrukce mov, cmp, add a sub (s operandy oddělenými čárkou) a jedna instrukce
bez operandů, totiž halt.
Předpokládáme, že máme k dispozici program zvaný překladač (jazyka RASP),
jehož účelem je přeložit program v jazyce RASP do strojového kódu. Přeložit
program znamená nahradit každou instrukci jejím strojovým kódem a určit tomuto
kódu místo v paměti počítače RASP. Nezabýváme se otázkou, zda překladač
výsledek své práce vhodným způsobem uloží, abychom jej kdykoliv později mohli
2.1 Programování v jazyce RASP 53
mov #0,20 mov #0,Z
cmp 18,#0 cmp X,#0
jeq 17 jeq Done
add 19,20 Rep: add Y,Z
sub #1,18 sub #1,X
jgt 9 jgt Rep
halt Done: halt
813 X: 813
964 Y: 964
0 Z: 0
Obrázek 2.1.1: Výpočet součinu
spustit, nebo zda jej rovnou zapíše do paměti počítače RASP a spustí jej. Pomíjíme
také otázku, na jakém počítači pracuje překladač, zda rovněž na počítači RASP či
na nějakém jiném, a nepokoušíme se speciﬁkovat strojové kódy instrukcí. RASP
je zkratka slov random access stored program. Termín „random v tomto případě
neznamená „náhodný , ale spíše „libovolný : procesor může v jednom taktu přečíst
nebo modiﬁkovat libovolně vzdálenou paměťovou buňku. „Stored program
znamená, že běžící program je umístěn v paměti počítače spolu s daty, která zpracovává.
Program tedy může svou činností sám sebe modiﬁkovat; tuto možnost ale
nehodláme využívat.
Deﬁnujme, že strojový kód instrukce zabírá v paměti počítače jednu, dvě nebo
tři paměťové buňky podle toho, jde-li o instrukci bez operandů, o instrukci s jedním
operandem nebo o instrukci se dvěma operandy. Předpokládáme-li, že strojový kód
první instrukce mov #0,20 programu na obr. 2.1.1 vlevo je uložen na adresách 1,
2 a 3, snadno lze odpočítat, že například instrukce add 19,20 je umístěna na adrese
9 a instrukce halt je umístěna na adrese 17. Vše, co překladač nerozpozná jako
instrukci, považuje za číslo (konstantu), kterou má rovněž uložit do paměti. To znamená,
že v případě programu z obr. 2.1.1 překladač za strojový kód instrukce halt
uloží čísla 813, 964 a 0, a to na adresy 18, 19 a 20.
Důležitou vlastností překladače jazyka RASP je schopnost pracovat se symbolickými
odkazy. Libovolná instrukce může být označena návěštím, které je v zápisu
programu umístěno vlevo před instrukcí na tomtéž řádku a které je od ní odděleno
dvojtečkou. Překladač při překladu programu určí hodnotu každého návěští, a to
stejným způsobem, jako když jsme před chvilkou určili, že adresa instrukce halt
z programu na obr. 2.1.1 je 17. Vyskytne-li se návěští v operandu některé instrukce,
překladač místo něj použije jeho hodnotu, tj. adresu instrukce, která je oním návěštím
označena. Vpravo na obrázku 2.1.1 je týž program jako vlevo, jsou v něm
ale použity symbolické odkazy. Návěštími jsou označeny i buňky s adresami 18,
19 a 20, které neobsahují opravdové instrukce. To je ovšem také povoleno. Je
zřejmé, že můžeme-li užívat symbolické odkazy, nemusíme odpočítávat instrukce,
abychom zjistili, na jaké adrese je co uloženo, a nemusíme dokonce ani vědět, kolik
paměťových buněk je třeba k uložení strojových kódů jednotlivých instrukcí.
54 2 Algoritmy a úlohy
Význam instrukce add Y,Z je „přičti k číslu uloženému na adrese Z číslo uložené
na adrese Y (neboli „sečti čísla uložená na adresách Y a Z a ulož výsledek
na adresu Z ), význam instrukce sub #1,X je „odečti jedničku od čísla uloženého
na adrese X . Instrukce jgt Rep je podmíněný skok; její význam je „pokračuj na
adrese Rep (tj. na adrese 9), byl-li výsledek naposled provedené aritmetické instrukce
(v našem případě instrukce sub) větší než nula . Tyto tři instrukce tedy
pracují tak, že přičtou k obsahu buňky Z obsah buňky Y tolikrát, kolik udávalo
číslo původně uložené v buňce X. Poté je provedena instrukce halt, jejíž význam je
„hotovo, skonči . Před prvním provedením instrukce add umístěné na adrese Rep
program provede instrukci mov #0,Z, která znamená „ulož nulu na adresu Z . Tato
instrukce je zbytečná, neboť nulu na adresu Z uložil již překladač (tj. obsah adresy Z
byl staticky inicializován pomocí zápisu Z: 0). Účelem instrukce cmp (compare, porovnej)
je zjistit, zda první z obou činitelů je nulový. Pokud ano, program přeskočí
tři instrukce uložené na adresách Rep až Rep+7 (tj. podmíněný skok jeq Done se
provede) a skončí svou činnost provedením instrukce halt. Tím jsme zdůvodnili,
že program z obrázku 2.1.1 vypočte součin nezáporných čísel uložených v buňkách
X a Y a uloží jej do buňky Z.
Procesor počítače RASP při své činnosti udržuje kromě čítače instrukcí dva
tzv. podmínkové bity Z a G. Nastavení určité hodnoty podmínkových bitů je vedlejším
(a někdy jediným) efektem provedení kterékoliv aritmetické instrukce. Podle
nastavení podmínkových bitů se pak řídí činnost skokových instrukcí. Bit Z je
nebo není nastaven podle toho, byl-li výsledek naposled provedené aritmetické instrukce
nulový (zero). Bit G je nebo není nastaven podle toho, byl-li výsledek
naposled provedené aritmetické instrukce větší než nula (greater). Přesný význam
instrukce jgt lab (jump if greater) tedy je „pokračuj na adrese lab , je-li bit G
nastaven (tj. má-li hodnotu 1), jinak pokračuj bezprostředně následující instrukcí .
Instrukce jeq (jump if equal) má analogický význam, řídí se bitem Z. Kromě dvou
podmíněně skokových instrukcí máme v jazyce RASP ještě nepodmíněný skok jmp,
ten se provede vždy bez ohledu na hodnoty podmínkových bitů. Žádná ze skokových
instrukcí nemění hodnoty podmínkových bitů, takže podmíněně skoková
instrukce může smysluplně následovat po jiné skokové instrukci, čili není nutné,
aby před provedením skokové instrukce bezprostředně předcházelo provedení aritmetické
instrukce. Tuto možnost budeme (muset) využívat.
Jazyk RASP má aritmetické instrukce mov (move, přenes), cmp (porovnej), add
(přičti), sub (odečti), neg (negate, změň znaménko) a shr (shift right, děl dvěma).
K aritmetickým instrukcím počítejme i instrukce read a write, o kterých bude
řeč později. Význam instrukce mov jsme již deﬁnovali. Je-li například v paměťové
buňce X uloženo číslo 5, po provedení instrukce mov X,R je hodnota 5 jak v buňce X,
tak v buňce R, a dále bit G je nastaven (má hodnotu 1) a bit Z není nastaven (má
hodnotu 0), protože číslo 5 je kladné a není nulové. Význam instrukcí add, sub
a neg je zřejmý. Instrukci sub by samozřejmě bylo možné simulovat pomocí dvojice
neg a add. Tím se ale nezabýváme, nesnažíme se, aby náš programovací jazyk byl za
každou cenu co nejúspornější. Instrukce cmp nastaví podmínkové bity stejně, jako by
je nastavila instrukce sub s prohozenými operandy. Například je-li opět v X číslo 5
2.1 Programování v jazyce RASP 55
mov #0,Z mov #0,Z
cmp X,#0 if X eq #0 then goto Done
jeq Done ;
jgt I1B if le then
neg X neg X
neg Y neg Y
I1B: endif
L1A: loop
mov X,Q mov X,Q
shr X shr X
sub X,Q sub X,Q
sub X,Q sub X,Q
jeq I2B if ne then add Y,Z
add Y,Z ;
I2B: add Y,Y add Y,Y
cmp X,#0 endloop X le #0
jgt L1A ;
Done: halt Done: halt
Obrázek 2.1.2: Jiný program pro výpočet součinu
a v Y číslo 4, instrukce sub X,Y uloží do buňky Y novou hodnotu −1 a vynuluje
bity Z a G, kdežto instrukce cmp X,Y ponechá obsah buněk X a Y beze změny a
nastaví bit G a vynuluje bit Z, protože výsledek 1 (který se nikam nezapisuje)
odčítání 5 − 4 je kladný a není nulový. Mnemonika instrukce shr je odvozena od
představy, že číslo je v paměťové buňce počítače reprezentováno svým binárním
zápisem (tj. posloupností nul a jedniček); dělení dvěma pak znamená nejnižší bit
zahodit a všechny ostatní bity posunout o jedno místo doprava. Je-li například
v buňce X uložena hodnota 4, 0 nebo −3, pak po provedení instrukce shr X tam je
2, 0 resp. −1.
Na obrázku 2.1.2 vlevo je uveden program, který počítá součin jiným způsobem
než program z obrázku 2.1.1, totiž s využitím tzv. školního algoritmu pro násobení,
který je naznačen na obrázku 2.3.6 na straně 133. Program opět očekává vstupní
data v buňkách X a Y, svůj výsledek nakonec zapíše do buňky Z. Navíc užívá
pomocnou buňku Q. Představujme si, že paměťové buňky X, Y, Z a Q jsou umístěny
těsně za závěrečnou instrukcí halt; jejich alokaci (tj. deklaraci návěští X, Y, Z a Q a
určení počátečního obsahu příslušných buněk) jsme pro stručnost vynechali.
Program nejprve inicializuje obsah buňky Z. Testováním, zda obsah buňky X
je nenulový, pak zjistí, zda je třeba dělat cokoliv dalšího. Na rozdíl od programu
z obrázku 2.1.1 se nespoléhá na to, že vstupy uložené v X a Y jsou nezáporné: je-li
první činitel záporný, využije rovnost x·y = (−x)·(−y) a pomocí dvou instrukcí neg
změní jejich znaménka. Všimněme si, že instrukce jgt I1B využívá fakt, že předchozí
instrukce jeq Done nezměnila podmínkové bity nastavené instrukcí cmp X,#0
(po pravdě řečeno, zjišťování, zda obsah buňky X je nenulový, není pro správné fun-
56 2 Algoritmy a úlohy
gování programu nezbytné). Program dále provádí opakovaně instrukce na adresách
L1A až Done-2. Vysvětleme si smysl těchto instrukcí podrobněji.
Označme u, v a z obsahy buněk X, Y a Z v kterémkoliv okamžiku výpočtu.
Označme x a y vstupní data, tj. počáteční obsahy buněk X a Y. Nechť dále n je
počet cifer v binárním zápisu čísla x a nechť j označuje počet, kolikrát byla dosud
provedena instrukce shr X. Tvrdíme, že vždy před provedením instrukce mov X,Q
a také vždy v okamžiku provedení instrukce jgt L1A platí
u = x div 2j
, v = y · 2j
, z = y · (x mod 2j
), (∗)
kde (x div 2j
) označuje výsledek celočíselného dělení čísla x číslem 2j
, tj. číslo, jehož
binární zápis vznikne z binárního zápisu čísla x odstraněním j nejnižších číslic,
a (x mod 2j
) označuje zbytek po dělení čísla x číslem 2j
, tj. číslo, jehož binární
zápis naopak vznikne z j nejnižších číslic binárního zápisu čísla x odstraněním
případných zbytečných nul na začátku. Pro j = 0 rovnosti (∗) platí: před prvním
provedením instrukce mov X,Q máme u = x, v = y, (x mod 20
) = 0 a z = 0.
Platnost prvních dvou rovností i pro j > 0 je zřejmá, neboť instrukce shr X vždy
dělí u dvěma a instrukce add Y,Y násobí v dvěma. Třetí rovnost se snadno dokáže
indukcí podle j. Když (x div 2j
) čili u je sudé, pak (x mod 2j+1
) = (x mod 2j
),
dvojnásobné odečtení čísla (u div 2) od u dá nulu a z se nemění. Když naopak
číslo (x div 2j
) je liché, čili když (j + 1)-ní nejnižší číslice v binárním zápisu čísla x
je 1, pak dvojnásobné odečtení čísla (u div 2) od u dá nenulový výsledek, instrukce
add Y,Z se provede, nová hodnota z je v + z, tj. y · 2j
+ y · (x mod 2j
), a platí
(x mod 2j+1
) = 2j
+ (x mod 2j
). Po n-násobném provedení instrukce shr X je u
nulové, skok jgt L1A se neprovede, (x mod 2n
) je x, platí z = y·x a program skončí
činnost provedením instrukce halt. Program z obrázku 2.1.2 tedy správně spočítá
součin kterýchkoliv dvou celých čísel.
V instrukcích programů jsme zatím vystačili se dvěma druhy operandů, přímými
a běžnými. Přímý operand má tvar # výraz a jeho hodnotou je hodnota výrazu
výraz . Kdyby například v kontextu programu z obr. 2.1.1 byly použity
operandy #Done+3 nebo #Z, oba by měly tutéž hodnotu 20. Běžný operand má
tvar výraz a jeho hodnotou je číslo uložené na adrese, která je hodnotou výrazu
výraz . Například, opět v kontextu programu z obr. 2.1.1, operand Done+3 má
zpočátku hodnotu 0 a v okamžiku provedení instrukce halt je jeho hodnotou součin
obou vstupních čísel. Kromě přímých a běžných operandů připouští jazyk RASP
ještě operandy vzdálené. Vzdálený operand může mít tvar @ výraz1 ( výraz2 ),
@( výraz )+ nebo -@( výraz ). Hodnotou operandu @ výraz1 ( výraz2 ) je číslo,
které je uloženo na adrese, která vznikne přičtením čísla výraz1 k číslu uloženému
na adrese výraz2 . Přitom toto sčítání procesor provádí interně, bez modiﬁkace
obsahu adresy výraz2 a podmínkových bitů. Například je-li návěští Done přiřazena
hodnota 17 a je-li v určitém stadiu výpočtu v X uloženo číslo 2, pak operandy
@Done+1(X) a Done+3 mají tutéž hodnotu, totiž číslo uložené na adrese Done+3.
Hodnotou operandu @( výraz )+ je číslo, jehož adresa je uložená na adrese výraz .
Znaménko plus znamená, že po přečtení obsahu adresy výraz je tento obsah zvětšen
o jedničku. Přitom modiﬁkace obsahu adresy výraz nemá vliv na hodnoty
2.1 Programování v jazyce RASP 57
podmínkových bitů. Je-li například v X číslo 140, instrukce mov #-4,@(X)+ zvětší
obsah buňky X na 141, uloží číslo −4 na adresu 140 a vynuluje bity Z a G (protože
číslo −4 je nenulové a nekladné). Operand -@( výraz ) procesor vyhodnotí
tak, že sníží obsah adresy výraz o jedničku (opět beze změny podmínkových
bitů), a pak onen obsah použije jako adresu hodnoty operandu. Domluvme se,
že místo @0( výraz2 ) je dovoleno psát pouze @( výraz2 ).
Vzdálené operandy usnadňují práci se složitějšími datovými strukturami, než
jsou jednotlivá čísla. Například pracujeme-li se seznamem čísel, která jsou uložena
na adresách Tab, Tab+1, Tab+2 atd., můžeme se rozhodnout, že obsah adresy X
bude sloužit jako ukazatel do tohoto seznamu. Provedení instrukce mov #Tab,X
pak znamená, že ukazatel X byl nasměrován na začátek našeho seznamu. Je-li
kdykoliv později provedena instrukce mov @(X)+,Y, znamená to, že program si do Y
uložil jeden prvek seznamu a přesměroval ukazatel X na prvek těsně následující.
Jednou z velmi užitečných standardních datových struktur je zásobník. Zásobník
je seznam, jehož délka se může měnit odebíráním položek a přidáváním nových
položek. O položce naposled uložené do zásobníku se říká, že je umístěna na vrcholu
zásobníku. Ze zásobníku může být odebrána pouze položka umístěná na vrcholu.
To znamená, že položka uložená do zásobníku může být odebrána pouze tehdy,
byly-li odebrány všechny položky, které do zásobníku byly uloženy později než ona.
Zásobník je obvyklé realizovat jako souvislou část paměti plus ukazatel (zásobníkový
ukazatel), který vždy obsahuje adresu vrcholu zásobníku. V jazyce RASP
předpokládáme, že zásobníkovým ukazatelem je paměťová buňka SP (stack pointer)
a že vrchol zásobníku má nižší adresu než všechny ostatní prvky. Při uložení nového
prvku do zásobníku tedy musí být snížen obsah adresy SP, a naopak zvýšení
obsahu adresy SP znamená odebrání prvku (prvků) ze zásobníku. Návěští SP se
nemusí deklarovat, překladač mu automaticky přiřadí hodnotu 0. To znamená, že
paměťová buňka 0 slouží jako zásobníkový ukazatel.
Zásobník se dobře hodí k implementaci volání podprogramů. Například součástí
programu z obrázku 2.1.3 je podprogram Cnv. V hlavním programu začínajícím na
adrese Sta se vyskytují dvě instrukce jmp Cnv, neboli podprogram Cnv je volán
ze dvou různých míst. Vždy před provedením instrukce jmp Cnv je ale pomocí
instrukce mov #C1,-@(SP) resp. mov #C2,-@(SP) uložena do zásobníku tzv. návratová
adresa, čili informace o tom, kde má činnost hlavního programu po návratu
z podprogramu pokračovat. Uvnitř podprogramu se předpokládá, že na vrcholu
zásobníku je uložena návratová adresa; ta se uplatní v okamžiku, kdy je ze zásobníku
odebrána provedením instrukce jmp @(SP)+ na adrese L1C. Zásobník se
užívá také k implementaci lokálních dat podprogramu, což v programu z obrázků
2.1.3 a 2.1.4 nebylo třeba, a k předávání parametrů podprogramu, což, jak si za
chvíli vysvětlíme, se v tomto programu skutečně děje.
Programy z obrázků 2.1.1 a 2.1.2 nejsou zcela kompletní. Pominuli jsme totiž
otázku, jak se vstupní čísla, která se mají násobit, octnou v buňkách X a Y. Obecněji
řečeno, pominuli jsme vstupní a výstupní operace. Neřekli jsme také, kde je určeno,
že program začíná práci provedením instrukce na adrese 1. Vysvětleme si nejprve
to druhé, začátek činnosti programu.
58 2 Algoritmy a úlohy
K tomu, že překladač určí strojový kód každé instrukce a stanoví mu místo v paměti
počítače RASP, nyní dodejme, že při obsazování paměti začíná od adresy 0.
Start programu probíhá tak, že obsah adresy 0 je vynulován (tím je inicializován
zásobníkový ukazatel) a program je spuštěn od instrukce, jejíž adresa byla předtím
(před vynulováním) umístěna na adrese 0. Stanovením obsahu adresy 0 tedy
při psaní programu určujeme startovací adresu programu, čili iniciální hodnotu
čítače instrukcí (nikoliv iniciální hodnotu zásobníkového ukazatele, ta je vždy nulová).
Například v programu z obr. 2.1.3 je umístěním čísla Sta na adresu 0 (tj. do
prvního řádku programu) určeno, že program má svou činnost začít provedením
instrukce mov #C1,-@(SP) na adrese Sta. Adresa 0, tj. adresa SP, v tom okamžiku
obsahuje číslo 0. Ukládání položek do zásobníku pak znamená ukládat je na (nižší
a nižší) záporné adresy. Nulový obsah buňky 0 znamená prázdný zásobník.
Data, která má program zpracovat, jsou uložena na vstupní pásce. Vstupní
páska je rozdělena na pole, která jsou očíslována celými nezápornými čísly. Pole
vstupní pásky mohou obsahovat znaky. Máme k dispozici kódovou tabulku, která
znakům přiřazuje celé nezáporné číselné kódy. Kódová tabulka je něco jako tabulka
ASCII; skutečnou tabulku ASCII jsme nepoužili pouze proto, že v ní nejsou
zahrnuty některé znaky důležité pro logiku, například logické spojky. Předpokládáme,
že kódová tabulka obsahuje znaky všech abeced, které jsme kdy potřebovali
či budeme potřebovat, a že kdyby snad ne, můžeme ji rozšířit o další znaky. Jeden
ze znaků je mezera, kterou lze podle potřeby zapisovat jako „ nebo jako „ ,
žádným zvláštním číselným kódem ani ničím jiným však významná není. Vstupní
páska je nekonečná, ale jen v konečně mnoha počátečních polích jsou znaky. Ve
všech zbývajících polích vstupní pásky je koncová značka , kterou nepokládáme
za znak (nemůže být prvkem žádné abecedy) a která má kód −1. Čtení znaků ze
vstupní pásky se děje pomocí instrukce read. Tato instrukce má dva operandy:
druhý operand určuje, kam se má do paměti uložit číselný kód znaku umístěného
v poli, které je určeno prvním operandem. Například instrukce read 2,-@(SP)
uloží do zásobníku číselný kód znaku umístěného ve třetím (počítáme od nuly) poli
vstupní pásky. Obsah vstupní pásky se během činnosti počítače nemůže měnit.
Témuž programu mohou ovšem být ke zpracování předložena různá data, tj. různé
obsahy vstupní pásky.
Opačný význam než vstupní páska má výstupní páska, na tu program může
zapsat výstupní data. Výstupní páska je také rozčleněna na pole číslovaná přirozenými
čísly. Při zahájení činnosti programu je výstupní páska prázdná, tj.
obsahuje samé koncové značky. Zapisování znaků na výstupní pásku se děje instrukcí
write. První operand instrukce write udává číselný kód znaku, druhý
udává pole výstupní pásky, na které má být tento znak zapsán. Abychom se
při psaní programu nemuseli zabývat číselnými kódy znaků, připouští překladač
jazyka RASP výrazy tvaru ‘ znak (levý apostrof následovaný jedním znakem).
Hodnotou výrazu ‘ znak je číselný kód znaku znak . Například je-li v paměťové
buňce I číslo 0, instrukce write X,@(I)+ zapíše do nejlevějšího pole výstupní
pásky znak, jehož číselný kód je uložen v buňce X. Je-li později provedena instrukce
write #‘7,@(I)+ a nebyl-li mezitím změněn obsah buňky I, je do druhého nejle-
2.1 Programování v jazyce RASP 59
Sta Sta
Cnv: mov @(SP),-@(SP) Cnv: mov @(SP),-@(SP)
mov #0,@1(SP) mov #0,@1(SP)
L1A: loop
read @(Inp)+,X read @(Inp)+,X
sub #‘0,X sub #‘0,X
jgt I1A if lt then exit
jeq I1A ;
jmp L1C ;
I1A: cmp X,#1 if X gt #1 then exit
jgt L1C ;
add @1(SP),@1(SP) add @1(SP),@1(SP)
add X,@1(SP) add X,@1(SP)
jmp L1A endloop
L1C: jmp @(SP)+ ret
Inp: 0 Inp: 0
Out: 0 Out: 0
X: 0 X: 0
Sta: mov #C1,-@(SP) Sta: call Cnv
jmp Cnv ;
C1: mov #C2,-@(SP) call Cnv
jmp Cnv ;
C2: add @(SP)+,@(SP) add @(SP)+,@(SP)
Obrázek 2.1.3: Kompletní program pro výpočet součtu, první část
vějšího pole vstupní pásky (tj. do pole s číslem 1) zapsán znak 7. Program může
do určitého pole výstupní pásky zapisovat i opakovaně, a to jak (různé) znaky, tak
koncovou značku. Program ale nemá možnost číst po sobě znaky, které zapsal na
výstupní pásku.
Po provedení instrukce read op1 , op2 či write op1 , op2 , kterým je čten
nebo zapisován znak s číselným kódem x, mají bity Z a G tutéž hodnotu, jako
kdyby bylo číslo x přenášeno instrukcí mov.
Nyní si můžeme podrobněji prohlédnout program na obrázcích 2.1.3 a 2.1.4.
Program sečte dvě přirozená čísla, o nichž předpokládá, že jsou na vstupní pásce
zapsaná ve dvojkové soustavě a oddělená jedním znakem různým od znaků 0 a 1.
Program užívá buňku X jako pomocnou proměnnou. Dále užívá buňky Inp a Out
jako vstupní a výstupní ukazatel, tj. jako ukazatel do vstupní resp. výstupní pásky.
Zpočátku každý z ukazatelů ukazuje na nejlevější pole své pásky, tj. na pole s číslem
0.
Program volá „konverzní podprogram Cnv, od kterého očekává, že určí hodnotu
jednoho sčítance a uloží ji na vrchol zásobníku. Protože máme dva sčítance,
podprogram Cnv je volán dvakrát. Po druhém volání jsou v zásobníku dvě položky
(tj. v buňce SP je číslo −2). Instrukce add @(SP)+,@(SP) na adrese C2 dělá vlastně
60 2 Algoritmy a úlohy
mov @(SP)+,X mov @(SP)+,X
L2A: loop
mov X,-@(SP) mov X,-@(SP)
shr X shr X
sub X,@(SP) sub X,@(SP)
sub X,@(SP) sub X,@(SP)
add #‘0,@(SP) add #‘0,@(SP)
cmp X,#0 endloop X eq #0
jeq L2C ;
jmp L2A ;
L2C: ;
L3A: loop
write @(SP)+,@(Out)+ write @(SP)+,@(Out)+
cmp SP,#0 endloop SP eq #0
jeq L3C ;
jmp L3A ;
L3C: halt halt
Obrázek 2.1.4: Kompletní program pro výpočet součtu, dokončení
vše podstatné: jednu ze dvou položek ze zásobníku odebere a druhou nahradí jejich
součtem. Připomeňme, že @(SP) znamená totéž co @0(SP). Nyní se věnujme
podprogramu Cnv. Podprogram nejprve provede instrukci mov @(SP),-@(SP). Tím
je zásobník prodloužen o jednu položku, stále však platí, že na vrcholu je uložena
návratová adresa. Výsledek v svého výpočtu čili výstupní parametr podprogram
uloží do buňky, kde byla návratová adresa původně a kterou lze nyní adresovat
jako @1(SP). Až podprogram svou činnost skončí, tj. až bude návratová adresa ze
zásobníku odebrána instrukcí jmp @(SP)+, výstupní parametr v se octne na vrcholu
zásobníku. Zpočátku platí v = 0. Každým provedením instrukce read @(Inp)+,X
je přečten jeden znak ze vstupní pásky a vstupní ukazatel je přesměrován na následující
znak. Zjistí-li se, že právě přečtený znak není číslice 0 ani 1, čtení znaků
končí a vstupní ukazatel je správně nastaven pro případné druhé volání podprogramu
Cnv. V opačném případě, tj. jestliže byla přečtena číslice, číslo v uložené
v buňce @1(SP) je pomocí dvou instrukcí add nahrazeno číslem 2v nebo 2v+1 podle
toho, zda přečtená číslice byla 0 nebo 1. Podprogram předpokládá, že číselný kód
znaku 1 je o jedničku větší než číselný kód znaku 0. To znamená, že provedením
instrukce sub #‘0,X je číselný kód znaku 0 nebo 1 převeden na číslo 0 resp. 1.
Poté, co program přečetl oba vstupy a sečetl je instrukcí add @(SP)+,@(SP),
provádí „výstupní konverzi , tj. převádí výstup z číselné do znakové podoby. To
je vidět na obrázku 2.1.4. Číslice výsledku jsou nejprve uloženy do zásobníku, a
teprve pak, v obráceném pořadí, zapsány na výstupní pásku. Všimněme si ještě, že
program nemá žádné nároky na formát vstupních dat: nevadí mu, začíná-li zápis
nenulového čísla nulami, prázdnou posloupnost číslic považuje za zápis čísla 0, znaky
případně umístěné na vstupní pásce za oběma sčítanci ignoruje.
2.1 Programování v jazyce RASP 61
Činnost programu pracujícího na počítači RASP může skončit provedením instrukce
halt, ale také detekováním chybového stavu. Chybový stav může například
nastat provedením instrukcí mov #X,Y a jmp Y, neboť pravděpodobně ne každé
číslo X je strojovým kódem nějaké instrukce. Jiným příkladem chybového stavu je
pokus zapsat na výstupní pásku do pole se záporným číslem nebo číst ze vstupní
pásky z pole se záporným číslem. Můžeme si představovat, že zastaví-li se procesor
provedením instrukce halt, na jeho panelu se rozsvítí zelené signální světlo, kdežto
zastaví-li se po detekování chyby, na panelu se rozsvítí červené signální světlo. Během
práce počítače jsou obě světla zhasnutá. Zastavení procesoru a rozsvícení
červeného signálního světla lze z programu dosáhnout provedením instrukce error.
To je poslední instrukce jazyka RASP, o které jsme se dosud nezmínili. Daný program
může instrukci error dát libovolný předem dohodnutý význam. Rozsvícení
červeného světla může například indikovat nesprávný formát vstupních dat. Má-li
program pouze dva možné výstupy (ANO a NE), je také možné stanovit, že na
výstupní pásku se nic nezapisuje a že výsledkem činnosti programu je pouze rozsvícení
toho nebo onoho signálního světla. V tom případě provedení instrukce error
neznamená žádnou „chybu .
Shrňme a nepatrně rozšiřme své poznatky o jazyce RASP a o počítači RASP.
Program v jazyce RASP se člení na řádky. Každý řádek může mít tři pole. Pole návěští
končí dvojtečkou, pole komentáře začíná středníkem, zbývající (střední) část
řádku je pole instrukce. Pole komentáře slouží pouze pro pisatele nebo čtenáře programu,
překladač jazyka RASP je ignoruje. Pole instrukce může obsahovat výraz,
nebo skutečnou instrukci. Výraz je sestaven z návěští, čísel a výrazů tvaru ‘ znak
pomocí znamének. Příklady výrazů jsou Res-Tab+4, ‘A+64 nebo -4. Je-li v nějakém
řádku programu uvedeno návěští a přitom chybí pole instrukce, návěští se
vztahuje k nejbližšímu následujícímu řádku s neprázdným polem instrukce. Není-li
v poli instrukce výraz, může tam být skutečná instrukce. Výraz se v programu
může vyskytnout samostatně, tj. jako jediný obsah pole instrukce, nebo jako součást
operandu instrukce. Překladač jazyka RASP převádí výrazy na jejich hodnoty E
a instrukce na jejich strojové kódy a určuje jim místo v paměti počítače RASP.
V jazyce RASP máme celkem třináct instrukcí. Je to osm aritmetických instrukcí,
které mohou měnit obsah paměti i podmínkové bity, nemohou ale měnit čítač instrukcí
v tom smyslu, že po provedení aritmetické instrukce je vždy provedena
ta instrukce, která v paměti bezprostředně následuje. Dále máme tři skokové instrukce,
ty mohou měnit čítač instrukcí, nemění ale podmínkové bity a nemění
ani obsah paměti až na výjimku, že při vyhodnocení vzdáleného operandu takové
instrukce může dojít ke zvětšení nebo zmenšení obsahu určité paměťové buňky o
jedničku. A konečně máme instrukce halt a error. Dvě posledně jmenované instrukce
jsou instrukce bez operandů, instrukce add, sub, cmp, mov, read a write
jsou instrukce se dvěma operandy, zbývající instrukce neg, shr, jeq, jgt a jmp
mají jeden operand. Operandy jsou přímé, běžné a vzdálené. Operand jednooperandové
instrukce a druhý operand dvouoperandové instrukce musí být běžný nebo
vzdálený s výjimkou instrukce cmp, jejíž druhý operand může být i přímý. První
operand dvouoperandové instrukce může být libovolný s výjimkou instrukce read,
62 2 Algoritmy a úlohy
jejíž první operand může být pouze běžný nebo vzdálený. Překladač jazyka RASP
převádí výrazy na jejich hodnoty a instrukce na jejich strojové kódy a určuje jim
místo v paměti počítače RASP. Činnost programu začíná přenesením obsahu paměťové
buňky 0 do čítače instrukcí a jejím vynulováním. Činnost programu končí
provedením jedné z instrukcí halt nebo error nebo detekováním chybového stavu.
Pro určitost deﬁnujme, že v okamžiku startu počítače jsou oba podmínkové bity
nulové a že instrukce halt a error podmínkové bity nemění. Není zaručeno, že
každý program při zpracování libovolných dat někdy skončí. Například program
z obrázku 2.1.1 dospěje k výsledku právě tehdy, je-li počáteční obsah buňky X nezáporný.
V opačném případě program pracuje donekonečna, tj. zacyklí se. Počítač
RASP pracuje s čísly, s okolím ale komunikuje pomocí znaků zapsaných na vstupní
a výstupní pásce a pomocí dvou signálních světel. Obsah vstupní pásky se během
činnosti programu nemění.
Označení RASP jsme převzali z knihy [1]. V této knize se kromě počítače RASP
užívá také (hlavně) počítač RAM (random access machine). Modely RAM a RASP
mají tutéž množinu instrukcí, liší se ale tím, že program počítače RAM není uložen
v paměti. Pro model RASP jsme se rozhodli proto, že implementace volání podprogramů,
kterou považujeme za dost důležitou, by na počítači RAM byla mnohem
méně přirozená. Počítače RAM se uvažují také v knihách [62] a [52]. Na rozdíl
od všech tří knih jsme připustili, aby aritmetické operace probíhaly ve všech paměťových
buňkách, nikoli jen v jedné k tomu určené. Připustili jsme také paměť
se zápornými adresami. Ani jedno totiž nic nestojí a přitom to značně usnadňuje
programování. Stejně jako v knize [62] a na rozdíl od knih [1] a [52] jsme mezi
instrukce jazyka nepřijali instrukce pro násobení a dělení. Ty by totiž nic podstatného
nepřinesly, ale komplikovaly by úvahy, které povedeme dále, o časové a
paměťové náročnosti úloh a programů.
V pravých částech obrázků 2.1.2, 2.1.3 a 2.1.4 jsou tytéž programy přepsány
s použitím „konstruktů call, if–endif a loop–endloop. Tyto konstrukty nejsou
novými instrukcemi, nýbrž textovými zkratkami, pod nimiž se skrývají fragmenty
programů, tj. instrukce a návěští. Takovýmto textovým zkratkám se zpravidla říká
makra. Užití maker může někdy zkrátit zápis programu, jejich hlavní význam je
ale v tom, že naznačují „logiku programu , čili zpřehledňují význam skokových
instrukcí. Značně také omezují potřebu návěští. O textu, který se skrývá pod
určitým makrem, říkáme, že je oním makrem generován. Nadále budeme makra
při psaní programů hojně využívat a budeme se spoléhat na to, že čtenář, který si
pečlivě prohlédl obrázky 2.1.2 až 2.1.4, dovede kterýkoliv program obsahující makra
přepsat na program bez maker.
Vysvětleme si nyní podrobněji syntax a význam (některých) maker. Nejprve se
zabývejme makrem if. Podmínka cnd umístěná mezi if a then může mít tvar
op1 rel op2 nebo tvar rel . Jako „relační znaménko rel se připouštějí mnemoniky
gt a eq, které jsou opsány z mnemonik podmíněně skokových instrukcí,
dále k nim komplementární mnemoniky le (less or equal, menší nebo rovno) a ne
(not equal, nerovno), a konečně lt (less than, menší než) a ge (greater or equal,
větší nebo rovno). Makro if generuje jednu až tři skokové instrukce a případně
2.1 Programování v jazyce RASP 63
loop ; Všechny znaky
read @(Inp)+,X ; Přečti další znak
if lt then exit ; Koncová značka
mov X,-@(SP) ; Vše kromě pravé závorky
if X ne #‘) then repeat ; pouze ulož do zásobníku
add #1,SP ; Odeber pravou závorku
if @3(SP) ne #‘( then error ; Zkontroluj uložené
if @2(SP) ne #‘0 then ; znaky
if @2(SP) ne #‘1 then error
endif
mov @(SP)+,X ; Pravý operand
mov @(SP)+,Op ; Znaménko operace
if X eq #‘0 then
if Op eq #‘+ then goto Res ; 0+x=x
if Op ne #‘* then error
mov #‘0,@(SP) ; 0*x=0
else ; Pravý operand není nula
if X ne #‘1 then error ; Musí to být jednička
if Op eq #‘* then goto Res ; 1*x=x
if Op ne #‘+ then error
mov #‘1,@(SP) ; 1+x=1
endif
Res: mov @(SP)+,@(SP) ; Jeden znak místo pěti
endloop ; Po zpracování
if SP ne #-1 then error ; vstupu musí být v záif
@(SP) eq #‘0 then goto Done ; sobníku jediný znak,
if @(SP) ne #‘1 then error ; nula nebo jednička,
Done: write @(SP)+,0 ; který je výsledkem
halt
Obrázek 2.1.5: Výpočet hodnoty booleovského výrazu
jedno návěští. Má-li podmínka cnd složitější tvar op1 rel op2 , makro if generuje
ještě instrukci cmp op1 , op2 . V opačném případě, má-li podmínka cnd
tvar pouze rel , se předpokládá, že podmínkové bity byly nastaveny instrukcemi
předcházejícími řádek s makrem if. Mezi if a endif může, ale nemusí být použito
else. Kdyby mezi if a endif nebylo else a byl by tam pouze jeden řádek,
je povoleno psát jednořádkový if s instrukcí zapsanou za then a bez užití
makra endif.
Makra loop a endloop vymezují cyklus. Za loop i za endloop může následovat
podmínka cnd téhož tvaru jako v makru if. Na rozdíl od makra if je jak
podmínka za loop, tak podmínka za endloop nepovinná. Podmínka za loop je
podmínkou pro vstup do cyklu, podmínka za endloop je podmínkou pro opuštění
cyklu. Dvojice loop a endloop cnd odpovídá konstruktu repeat–until v jazyce
64 2 Algoritmy a úlohy
Get: mov @(SP),-@(SP) ; Posuň návratovou adresu
read @(Inp)+,@1(SP) ; V @1(SP) bude výsledek
if @1(SP) eq #‘0 then ret ; Hotovo, když jen
if @1(SP) eq #‘1 then ret ; jedna číslice
if @1(SP) ne #‘( then error ; Jinak je nutná závorka
call Get ; Čti levý podvýraz,
read @(Inp)+,-@(SP) ; operační znaménko
call Get ; a pravý podvýraz
if @1(SP) eq #‘+ then ; Logický součet
if @0(SP) eq #‘1 then mov #‘1,@2(SP)
else ; Logický součin
if @1(SP) ne #‘* then error ; nebo nesprávný formát
if @0(SP) eq #‘0 then mov #‘0,@2(SP)
endif
read @(Inp)+,-@(SP) ; Následovat musí
if @(SP)+ ne #‘) then error ; pravá závorka
add #2,SP ; Dvě položky už zbytečné
mov @(SP)+,@1(SP) ; třetí je výsledek
ret ; Hotovo, zpět
Sta: call Get ; Přečti celý výraz
read @(Inp)+,-@(SP) ; Následovat musí
if @(SP)+ ge #‘0 then error ; koncová značka
write @(SP)+,0 ; Zapiš výsledek
halt ; Hotovo
Obrázek 2.1.6: Hodnota booleovského výrazu pomocí rekurzívního volání
Pascal. Dvojice loop cnd a endloop (bez podmínky) odpovídá konstruktu while.
V cyklu mezi loop a endloop se může vyskytnout konstrukt exit, kterým lze nařídit
předčasné opuštění cyklu, a konstrukt repeat, kterým lze naopak nařídit opakování
cyklu od počátku. Konstruktu repeat tedy přisuzujeme zcela jiný význam,
než má v jazyce Pascal. Konstrukty exit a repeat, a rovněž goto, se mohou vyskytnout
také za then v jednořádkovém if. Význam maker call a ret je z obrázků
2.1.3 a 2.1.4 zřejmý.
Program z obrázku 2.1.5 určuje hodnotu booleovského výrazu. V zápisu programu
jsme vynechali řádky, které si čtenář jistě umí představit: deklaraci startovací
adresy a alokaci pomocných buněk X, Op a Inp. Program pracuje tak, že
všechny znaky booleovského výrazu zapsaného na vstupní pásce beze změny ukládá
do zásobníku a pozastaví se pouze v případě, kdy přečtený znak je pravá závorka.
V tom okamžiku musí platit, že pět nejvyšších položek na vrcholu zásobníku jsou
znaky levá závorka, číslice 0 nebo 1, znaménko + nebo *, číslice 0 nebo 1, a pravá závorka.
Není-li tomu tak, program skončí činnost provedením instrukce error. Je-li
tomu tak, program těchto pět znaků nahradí znakem 0 nebo 1, a pak pokračuje ve
čtení vstupního výrazu.
2.1 Programování v jazyce RASP 65
Program z obrázku 2.1.6 také určuje hodnotu booleovského výrazu, postupuje
ale jinak než program z obr. 2.1.5, užívá rekurzívní volání podprogramů. Program
začíná svou činnost na adrese Sta, znaky ze vstupní pásky jsou opět čteny pomocí
ukazatele Inp. Od podprogramu Get se očekává, že určí hodnotu výrazu, na jehož
nejlevější znak ukazuje buňka Inp, uloží ji do zásobníku a přesměruje ukazatel Inp
těsně za onen výraz. Pokud se po volání umístěném na adrese Sta zjistí, že na
vstupní pásce jsou ještě další (nadbytečné) znaky, program ohlásí chybu provedením
instrukce error. Pokud podprogram Get zjistí nesprávný formát booleovského
výrazu, nevrací žádný chybový parametr, nýbrž sám provede instrukci error. Podprogram
Get začíná svou činnost podobně jako podprogram Cnv z obrázku 2.1.3,
posunutím návratové adresy utvoří v zásobníku prostor pro uložení svého výstupního
parametru a přečte jeden znak ze vstupní pásky. Pokud je přečtený znak číslice
0 nebo 1, nemusí dělat již nic dalšího. V opačném případě by na pásce měl být
zapsán složený výraz, který sestává ze dvou podvýrazů spojených znakem + nebo *
a obklopených závorkami. Hodnoty obou podvýrazů zjistí dvojnásobným voláním
podprogramu Get, čili rekurzívním voláním sebe sama. Po druhém volání podprogramu
Get v osmém řádku programu, a to až do provedení instrukce add #2,SP,
lze hodnoty obou podvýrazů adresovat jako @2(SP) a @0(SP), kdežto @1(SP) je
operační znaménko. Zbytek je podobný jako v programu z obr. 2.1.5.
Nyní směřujme k deﬁnici počitatelnosti úloh a k deﬁnici časových a paměťových
nároků programu. Víme, že pouze konečný počáteční úsek vstupní pásky obsahuje
znaky a že celý zbývající úsek vstupní pásky je vyplněn koncovými značkami. Slovu
zapsanému v onom počátečním úseku říkejme vstup programu, délka tohoto slova
je délka vstupu. Délka vstupu w je tedy nejmenším číslem n takovým, že v poli
s indexem n a všech dalších polích vstupní pásky jsou koncové značky. Výstupní
páska je zpočátku prázdná, tj. obsahuje samé koncové značky, obsah některých polí
ale program během své činnosti může změnit. V okamžiku, kdy se program zastaví
(a rozsvítí některé signální světlo), jsou jen v konečně mnoha polích výstupní pásky
zapsány znaky. V každém taktu totiž program mohl změnit obsah nejvýše jednoho
pole. Zastaví-li se program provedením instrukce halt, pak za výstup programu
pokládáme slovo, které je v tom okamžiku na výstupní pásce zapsáno vlevo od
nejlevějšího pole obsahujícího koncovou značku. Nevylučujeme, že vpravo od tohoto
pole jsou na výstupní pásce zapsány ještě další znaky; ty ale k výstupu nepočítáme.
Zastaví-li se program rozsvícením červeného světla (tj. provedením instrukce error
nebo detekováním chybového stavu), nebo nezastaví-li se vůbec (tj. zacyklí-li se),
pokládáme výstup programu za nedeﬁnovaný.
Nechť Σ1 a Σ2 jsou abecedy a nechť X ⊆ Σ∗
1 a g : X → Σ∗
2. Řekneme,
že program P počítá funkci g, jestliže (i) program P při zpracování libovolného
vstupu w ∈ Σ∗
1 poskytne výstup právě tehdy, platí-li w ∈ X, a (ii) pokud to
nastane, je výstupem slovo g(w). Program P je tedy povinen dát výstup g(w),
kdykoliv w ∈ X, a nedat žádný výstup (tj. zastavit se rozsvícením červeného signálního
světla nebo se nezastavit vůbec), platí-li w ∈ Σ∗
1 −X. Řekneme, že funkce g
z X do Σ∗
2 je počitatelná (na počítači RASP), existuje-li program v jazyce RASP,
který ji počítá.
66 2 Algoritmy a úlohy
Například program z obrázku 2.1.5 počítá funkci deﬁnovanou na množině všech
booleovských výrazů, která každému booleovskému výrazu přiřazuje jeho hodnotu.
Je snadné pozměnit tento program na program počítající funkci (úlohu) Hodnota
booleovského výrazu deﬁnovanou v úvodu této kapitoly. Znamená to upravit
jej tak, aby místo provedení kterékoliv ze svých instrukcí error zapsal do nultého
pole výstupní pásky dohodnutý znak (v úvodu kapitoly to byl znak n), a pak
provedl instrukci halt. Dále nevelkou úpravou programu z obrázků 2.1.3 a 2.1.4
lze získat program, který počítá funkci [x, y] → x + y, tj. který počítá součet
přirozených čísel. Znamená to zapracovat do něj kontrolu, která připustí pouze
vstupy tvaru w1;w2, kde w1 a w2 jsou binární zápisy přirozených čísel, a odmítne
(provedením instrukce error) všechny ostatní vstupy. Přidáme-li k programu z obrázku
2.1.1 nebo k programu z obrázku 2.1.2 kontrolu formátu vstupních dat a
vstupní a výstupní konverze, dostaneme v obou případech program, který počítá
součin přirozených čísel. Programy (přesněji řečeno fragmenty programů či algoritmy)
z obrázků 2.1.1 a 2.1.2 tedy představují dvě různá zdůvodnění, proč Násobení
je funkce počitatelná na počítači RASP. Několik dalších počitatelných funkcí
je uvedeno ve cvičeních.
Nechť P je program a nechť f je funkce z N do N. Řekneme, že program P
pracuje v čase f, jestliže při zpracování libovolného vstupu délky nejvýše n se program
P zastaví po provedení nejvýše f(n) kroků. Řekneme, že úloha g : X → Σ∗
2,
kde X ⊆ Σ∗
1, je počitatelná (na počítači RASP) v čase f, jestliže existuje program,
který ji počítá a který pracuje v čase f.
Například v podprogramu Cnv na obrázku 2.1.3 je cyklus, tj. vícenásobně prováděná
sekvence instrukcí omezená makry loop a endloop. Při zpracování vstupu
délky n se tento cyklus provádí (n + 1)-krát (naposled při přečtení první koncové
značky za vstupním slovem). To znamená, že každá z deseti instrukcí cyklu se provede
nejvýše (n + 1)-krát. Výstup programu má nejvýše (n + 1) znaků (normálně
je jich nejvýše n − 1, pouze při zpracování prázdného vstupu jich je n + 1). To znamená,
že také každá z nejvýše dvanácti instrukcí dvou cyklů hlavního programu (na
obr. 2.1.4) se provádí nejvýše (n + 1)-krát. V podprogramu Cnv jsou tři instrukce
umístěné mimo cyklus a každá z nich se provádí dvakrát, v hlavním programu je
sedm instrukcí umístěných mimo oba cykly. Dohromady se tedy provede nejvýše
10(n + 1) + 12(n + 1) + 6 + 7 instrukcí. Tím jsme zdůvodnili, že náš program pro
výpočet součtu počítá v čase f, kde f(n) = 22n + 35. V dalším výkladu budeme
pokud možno dodržovat zvyklost, že počet znaků vstupu se značí n a že funkce
vyjadřující časové nebo paměťové nároky programu se zapisuje výrazem (v n). Náš
program tedy pracuje v čase 22n + 35.
Také časové nároky programu z obr. 2.1.5 lze snadno odhadnout: v programu
je 49 instrukcí a při zpracování vstupu délky n se každá z nich provede nejvýše
(n + 1)-krát. Program tedy pracuje v čase 49(n + 1). V obou případech by šlo
počítat i precizněji. To ale nemáme v úmyslu. Naopak, v dalším textu se většinou
nebudeme zajímat o přesnou hodnotu multiplikativních konstant a spokojíme
se také s odhady, které platí až na konečně mnoho výjimek. Pro tento účel jsme
v oddílu 1.3 (viz str. 36) zavedli tuto deﬁnici: funkce f je v O(g), jestliže existuje
2.1 Programování v jazyce RASP 67
konstanta c taková, že f(n) ≤ c · g(n) pro všechna dost velká n. Zatím jsme tedy
zjistili, že jak náš program pro výpočet součtu, tak program z obr. 2.1.5 pro výpočet
hodnoty booleovského výrazu pracuje v čase (f, kde f je funkce v) O(n). Na tomto
tvrzení by se nic nezměnilo, kdybychom programy upravili tak, jak je naznačeno
výše, tj. kdybychom do programu pro sčítání zapracovali kontrolu formátu vstupních
dat a kdybychom program z obr. 2.1.5 upravili tak, aby se vždy dopracoval
k rozsvícení zeleného světla. Jak součet přirozených čísel, tak určování hodnoty booleovského
výrazu jsou tedy funkce počitatelné na počítači RASP v lineárním čase.
Když v binárním zápisu čísla x je n cifer, může být potřeba až 2n
− 1 odčítání
jedničky, než je x přepracováno na nulu. To znamená, že kdybychom fragment
programu uvedený na obr. 2.1.1 doplnili na kompletní program, o výsledném programu
počítajícím funkci [x, y] → x · y bychom nemohli říci nic lepšího, než že
pracuje v čase 2n
. Protože funkce n → 2n
roste dosti rychle, rychleji než všechny
funkce tvaru n → nk
(tj. rychleji než všechny polynomy), program pro výpočet součinu
přirozených čísel založený na algoritmu z obr. 2.1.1 nelze považovat za příliš
efektivní.
Je-li naproti tomu v buňce X číslo, jehož zápis má n cifer, dospějeme již po
n-násobném provedení instrukce shr X k nule. Cyklus v algoritmu na obrázku 2.1.2
se tedy provádí pouze tolikrát, kolik cifer je v zápisu prvního činitele x. Kdybychom
tento algoritmus doplnili na kompletní program přidáním kontroly formátu vstupních
dat a vstupních a výstupních konverzí, dostali bychom program pro výpočet
součinu přirozených čísel, který pracuje v čase O(n). Díky algoritmu z obr. 2.1.2
tedy můžeme tvrdit, že úloha Násobení je na počítači RASP počitatelná v lineárním
čase. Algoritmus z obrázku 2.1.1 není pro tento účel nijak užitečný.
Přikročme k úvahám o prostorové (paměťové) náročnosti programů a úloh. Nejprve
deﬁnujme funkci z N do N předpisem (x) = log(x + 1) , kde log je dvojkový
logaritmus a z → z je horní celá část, tj. funkce, která každému (řekněme reálnému)
číslu z přiřadí nejmenší celé číslo j takové, že z ≤ j. Funkce se nazývá
délková funkce nebo také celočíselný logaritmus. Je-li x ∈ N a x > 0, pak (x)
udává počet cifer v binárním zápisu čísla x. Místo (x) se v literatuře často píše |x|
(což je v souladu s označením |w| pro délku slova w). Toho se ale držet nebudeme,
označení |x|, je-li x číslo, si vyhradíme pro absolutní hodnotu čísla x.
Deﬁnujme konﬁguraci počítače RASP jako slovo tvaru
d1d2d3d4b,a,c1, . . ,ck, (∗)
kde d1 až d4 jsou číslice 0 nebo 1, slova b, a a c2, . . , ck−1 jsou binární zápisy celých
čísel a slova c1 a ck jsou binární zápisy nenulových celých čísel. Konﬁgurace je tedy
slovem v abecedě {-, ,, 0, 1}, přičemž minus slouží k zapisování záporných čísel a
čárka slouží k oddělování čísel od sebe. Jednotlivé části konﬁgurace interpretujeme
následovně. Číslice d1 (číslice d2) je 1 právě tehdy, je-li rozsvíceno zelené resp.
červené signální světlo. Číslice d3 a d4 udávají hodnoty podmínkových bitů Z a G.
Slovo b udává hodnotu čítače instrukcí, slovo c1 udává obsah paměťové buňky, jejíž
adresu udává slovo a, slova c2, . . , ck udávají obsahy (k − 1) bezprostředně následujících
paměťových buňek. O ostatních paměťových buňkách (s adresami nižšími
68 2 Algoritmy a úlohy
než a a vyššími než a + k − 1) se rozumí, že obsahují nuly. Celá konﬁgurace tedy
udává informaci o stavu počítače RASP v určitém okamžiku jeho činnosti. Je-li
C konﬁgurace tvaru (∗), pak slovem C a obsahem w vstupní pásky je jednoznačně
určeno, co v daném okamžiku počítač udělá: neudělá nic, má-li některý z bitů
d1 a d2 hodnotu 1 (v tom případě došlo k zastavení počítače už v konﬁguraci C),
nebo přejde do jednoznačně určené konﬁgurace D, která se od konﬁgurace C může
lišit v hodnotách bitů d1 až d4, v hodnotě čítače instrukcí a dále v obsahu nejvýše
tří paměťových buněk (neboť každá instrukce modiﬁkuje obsah nejvýše jedné
paměťové buňky, ale při vyhodnocení případných vzdálených operandů může být
obsah dalších nejvýše dvou paměťových buňek zvětšen nebo zmenšen o jedničku).
Takto jednoznačně určené konﬁguraci D říkejme konﬁgurace odvozená z konﬁgurace
C a z obsahu w vstupní pásky. Konﬁguraci, ve které má některý z bitů d1 a d2
hodnotu 1 (takže neexistuje konﬁgurace z ní odvozená), říkejme koncová konﬁgurace.
Deﬁnujme konﬁguraci počáteční vzhledem k programu P jako konﬁguraci, ve
které jsou bity d1, . . , d4 nulové, čítač instrukcí má tu hodnotu, kterou překladač
při překladu programu P uložil na adresu 0, adresa 0 má nulový obsah a všechny
ostatní paměťové buňky mají ten obsah, který jim určil překladač při překladu programu
P. Řekneme, že posloupnost C0, . . , Cm konﬁgurací je výpočet programu P
ze vstupu w, jestliže C0 je konﬁgurace počáteční vzhledem k programu P, každá
konﬁgurace Ci+1 je odvozená z konﬁgurace Ci a slova w a konﬁgurace Cm je koncová.
Všimněme si, že je-li C0, . . , Cm výpočet programu ze vstupu w, pak číslo m
je počet kroků, které počítač vykonal při zpracování vstupu w. Dále si všimněme,
že připouštíme pouze výpočty, které skončily zastavením procesoru. „Výpočet ,
který probíhal donekonečna, neuznáváme za výpočet.
Nechť C0, . . , Cm je výpočet programu P ze vstupu w. Deﬁnujme velikost paměti
použité programem P při zpracování vstupu w jako číslo maxi|Ci|. Délku
konﬁgurace tedy pokládáme za velikost paměti použité programem v příslušném
kroku výpočtu, celkovou velikost paměti použité při zpracování vstupu w deﬁnujeme
jako maximální velikost paměti použité v kterémkoliv kroku výpočtu. Nechť
P je program a nechť f je funkce z N do N. Řekneme, že program P pracuje
v prostoru f, jestliže pro každé n platí, že program P se dopočítá při zpracování
libovolného vstupu délky nejvýše n a použije při tom paměť velikosti nejvýše f(n).
Řekneme, že úloha g : X → Σ∗
2, kde X ⊆ Σ∗
1, je počitatelná (na počítači RASP)
v prostoru f, jestliže existuje program, který ji počítá a který pracuje v prostoru f.
Vraťme se znovu k programu pro výpočet součtu z obrázků 2.1.3 a 2.1.4. Předpokládejme,
že programu je předložen vstup tvaru w1;w2, kde w1 a w2 jsou binární
zápisy čísel x a y. Nechť délka tohoto vstupu je nejvýše n. V okamžiku před provedením
instrukce add @(SP)+,@(SP) jsou v zásobníku uloženy dvě položky, x a y,
nejnižší paměťová buňka s nenulovým obsahem má adresu −2, číslo −2 je také
v buňce SP čili v buňce 0, a v buňce Inp je číslo n + 1. Počítač se tedy nachází
v konﬁguraci tvaru
. . ,-10,w2,w1,-10, . . ,w3, . . ,
kde w3 je binární zápis čísla n + 1 uloženého v buňce Inp. Platí |w1| + |w2| ≤ n
2.1 Programování v jazyce RASP 69
(((0+1)+0)*((0+(1*1))*0))
((0+1)+0) ((0+(1*1))*0)
(0+1) 0 (0+(1*1)) 0
0 1 0 (1*1)
1 1
¡
¡
¡
e
e
e
¡
¡
¡
e
e
e
¡
¡
¡
e
e
e
e
e
e
¡
¡
¡
 
 
 ©
d
d
d



C



s
Obrázek 2.1.7: Rekurzívní volání podprogramu
a |w3| = (n + 1) ≤ (n) + 1. Souhrnná délka všech ostatních částí konﬁgurace (naznačených
tečkami) nezávisí na n. Druhé maximum, pokud jde o velikost obsazené
paměti, nastane v okamžiku před prvním provedením instrukce write. Tehdy jsou
v zásobníku uloženy číselné kódy všech znaků, které mají být zapsány na výstupní
pásku. Znamená to nejvýše n čísel, jejichž binární zápisy mají souhrnnou délku
nejvýše c · n, kde konstanta c je dána kódovou tabulkou. Protože funkce c · n, n
i (n) + 1 jsou v O(n) (i jejich součet je v O(n)), můžeme říci, že program pracuje
v prostoru O(n). Funkce sčítání přirozených čísel je tedy na počítači RASP
počitatelná v lineárním prostoru.
Podobnou analýzou programu z obr. 2.1.5 lze ověřit, že také úloha Hodnota
booleovského výrazu je počitatelná v lineárním prostoru. I úloha Násobení
je počitatelná v lineárním prostoru a je přitom jedno, zda si pro analýzu paměťových
nároků vybereme algoritmus z obr. 2.1.2 nebo časově mnohem méně efektivní
algoritmus z obr. 2.1.1.
Také program z obrázku 2.1.6 pracuje v prostoru O(n). Protože s podobnými
programy, založenými na rekurzívním volání podprogramů, se ještě setkáme, zdůvodněme
tento fakt raději podrobněji. Předpokládejme, že programu je ke zpracování
předložen výraz w délky n. K určení hodnoty výrazu w program volá
podprogram Get. Podprogram Get při každém svém volání přečte jeden znak ze
vstupní pásky a má za úkol stanovit hodnotu podvýrazu výrazu w, který začíná
oním znakem. Než to udělá, může dojít k dalším (vnořeným) voláním podprogramu
Get. V každém okamžiku výpočtu tedy může být rozpracováno několik
„kopií podprogramu Get. Celý výpočet si můžeme představit jako strom, jehož
vrcholům odpovídají jednotlivé kopie. Z vrcholu v1 vede hrana do vrcholu v2,
jestliže kopie odpovídající vrcholu v2 je volána z kopie odpovídající vrcholu v1.
Pro případ, kdy vstupní výraz w je (((0+1)+0)*((0+(1*1))*0)), je tento strom
znázorněn na obr. 2.1.7. Pro stanovení hodnoty výrazu w je třeba znát hodnoty
70 2 Algoritmy a úlohy
GLE: read -@(Aux),X ; Vezmi předchozí znak
if X eq #‘0 then ret ; Hotovo, je-li to
if X eq #‘1 then ret ; 0 nebo 1
if X ne #‘) then error ; Jinak to musí být )
mov #1,Dp ; Inicializuj hloubku
loop ; Jdi doleva
read -@(Aux),X ; a nalezni
if X eq #‘) then add #1,Dp ; levou závorku,
if X eq #‘( then sub #1,Dp ; která je
endloop Dp eq #0 ; v patřičné hloubce
ret
Sta: loop
mov Ptr,Aux ; Přečti další znak
read @(Ptr)+,X ; Aux ukazuje na,
if lt then exit ; Ptr za onen znak
if v X je kód jednoho ze znaků (, +, *, 0, 1 then repeat
if X ne #‘) then error ; Když ), najdi
call GLE ; začátek 2. podvýrazu
read -@(Aux),X ; Vlevo musí být + nebo *
if v X není kód znaku + ani * then error
call GLE ; Začátek 1. podvýrazu
read -@(Aux),X ; Vlevo musí být
if X ne #‘( then error ; levá závorka
endloop
call GLE ; Levý konec celku
if Aux ne #0 then error ; musí být v poli nula
halt
Obrázek 2.1.8: Paměťově úsporné rozpoznávání booleovských výrazů
výrazů ((0+1)+0) a ((0+(1*1))*0), pro stanovení hodnoty výrazu ((0+1)+0) je
třeba znát hodnoty výrazů (0+1) a 0 atd.
V době, kdy je volána kopie odpovídající vrcholu v, jsou ještě rozpracovány
kopie odpovídající vrcholům ležícím na cestě z kořenu stromu do vrcholu v. Paměťový
prostor, který je v tomto okamžiku obsazen, lze odhadnout jako součet
velikostí „lokálních dat všech těchto kopií. Lokální data každé kopie sestávají
ze dvou nebo tří položek uložených v zásobníku: paměťová buňka adresovaná
jako @1(SP) je rezervována pro budoucí výsledek činnosti podprogramu, druhá
položka je návratová adresa, případná třetí je dílčí výsledek získaný prvním voláním
vnořené kopie. Každá z těchto položek je omezená konstantou, rozpracovaných
kopií je nejvýše n. Program z obr. 2.1.6 tedy opravdu pracuje v prostoru O(n).
Do budoucna si pamatujme, že výpočet podprogramu, který rekurzívně volá sám
sebe, si lze přestavit jako průchod stromem, jehož vrcholy odpovídají různým kopiím
tohoto podprogramu. Čas potřebný pro výpočet souvisí s celkovým počtem
2.1 Programování v jazyce RASP 71
vrcholů ve stromu, prostor potřebný pro výpočet souvisí s délkou nejdelší větve
stromu. U programu z obr. 2.1.6 ale mezi počtem vrcholů a maximální délkou
větve není velký rozdíl, obojí je odhadnuto číslem n a žádný podstatně lepší odhad
neexistuje.
Má-li vstup w nějakého programu P délku n, potřebuje program P nejméně
n kroků, aby přečetl všechny znaky slova w. Z tohoto důvodu budeme tvrzení, že
určitý program P pracuje v čase O(n), pokládat za maximum toho, čeho lze dosáhnout.
O programy, jejichž časové nároky rostou pomaleji než lineárně, nebudeme
usilovat. Na druhé straně může být někdy užitečné a žádoucí napsat program, jehož
prostorové nároky jsou výrazně menší než lineární. Příklad takového programu je
na obrázku 2.1.8. Tento program o každém slově w ∈ {(, ), +, *, 0, 1}∗
rozhodne,
je-li booleovským výrazem. Na rozdíl od programů z obrázků 2.1.5 a 2.1.6 se ale
nezabývá hodnotami booleovských výrazů. Program čte ze vstupní pásky znaky
jeden po druhém, ale v každém okamžiku má v paměti pouze jeden znak vstupního
slova w. Vždy, když narazí na pravou závorku, hledá k ní příslušnou levou
závorku. Udělá to tak, že si uloží jedničku do buňky Dp, jde doleva, při každém
výskytu pravé závorky k buňce Dp přičítá jedničku, při každém výskytu levé závorky
od buňky Dp odečítá jedničku. „Příslušná levá závorka se vyznačuje tím, že je-li
v souvislosti s jejím přečtením odečtena jednička od buňky Dp, poprvé dojde k tomu,
že výsledek je nula. Označme i obsah buňky Ptr. Tvrdíme, že vždy v okamžiku
provedení instrukce mov Ptr,Aux platí: ke každé pravé závorce umístěné na vstupní
pásce v poli s indexem menším než i existuje někde vlevo od ní k ní příslušná levá
závorka a tyto dvě závorky spolu se znaky umístěnými mezi nimi tvoří booleovský
výraz. Toto tvrzení lze snadno dokázat indukcí podle i. Dále lze ověřit, že řekne-li
program NE, tj. provede-li kteroukoliv ze svých pěti instrukcí error, nebo pokusí-li
se číst z pole se záporným indexem (čili „spadne z pásky ), pak má pravdu, vstupní
slovo w skutečně není booleovským výrazem (viz též cvičení 6–8). Je-li přečtena
koncová značka a předchozí znak byla pravá závorka, program prostřednictvím
posledního volání podprogramu GLE (get left end) nalezne k ní příslušnou levou
závorku. I v tomto okamžiku ovšem platí, že tyto dvě závorky spolu s textem mezi
nimi tvoří booleovský výraz. Je-li příslušná levá závorka v poli s indexem nula, program
skončí provedením instrukce halt. A opět má pravdu, celé vstupní slovo w
je booleovským výrazem.
Tento program je napsán tak, že nic nezapisuje na výstupní pásku a odpověď
ANO či NE (daný vstup je či není booleovským výrazem) dá najevo rozsvícením
zeleného resp. červeného signálního světla. Snadno bychom jej ale upravili tak, aby
žádný výpočet nekončil rozsvícením červeného světla a aby odpověď ANO či NE
dal program najevo zápisem (třeba jednoznakových slov a či n) na výstupní pásku.
Takováto úprava by nic (podstatného) neměnila na jeho časových a paměťových
nárocích.
V dalším textu se často spokojíme s tím, že místo programu podáme pouze
neformální algoritmus, a budeme se spoléhat na to, že čtenář by jej dovedl přepsat
do jazyka RASP. Algoritmus pro rozpoznávání booleovských výrazů, tj. neformální
verze programu z obr. 2.1.8, může vypadat například takto:
72 2 Algoritmy a úlohy
S užitím hlavního ukazatele Ptr čti znaky jeden po druhém, pozastav se pouze
u pravé závorky a u koncové značky. Ostatní přípustné znaky jsou (, +, *, 0, 1,
ty pouze zkontroluj.
Je-li přečtený znak pravá závorka, pak užij pomocný ukazatel Aux, a
– ukaž si na těsně předchozí znak. Není-li to 0 ani 1, musí to být pravá
závorka. V tom případě si ukaž na k ní příslušnou levou závorku.
– ukaž si na těsně předchozí znak. Musí to být + nebo *.
– ukaž si na těsně předchozí znak. Není-li to 0 ani 1, musí to být pravá
závorka. V tom případě si ukaž na k ní příslušnou levou závorku.
– ukaž si na těsně předchozí znak. Musí to být levá závorka.
Je-li přečtena koncová značka, pak
– ukaž si na těsně předchozí znak. Není-li to 0 ani 1, musí to být pravá
závorka. V tom případě si ukaž na k ní příslušnou levou závorku.
– zkontroluj, že ukazatel nyní ukazuje na nulté pole vstupní pásky, a skonči.
Má-li náš algoritmus (tj. program z obr. 2.1.8) zpracovat vstup délky n, pak
při každém přečtení pravé závorky, což nastane řádově n-krát, musí vykonat řádově
n kroků, aby nalezl k ní příslušnou levou závorku. Program tedy pracuje
v čase O(n2
). Program užívá pouze tři paměťové buňky, jejichž obsah závisí na n,
totiž buňky Inp, Aux a Dp. Na zápis těchto tří čísel je tedy třeba nejvýše 3 (n) + 3
znaků. Program z obr. 2.1.8 tedy pracuje v prostoru O( (n)). Říká se také, že
pracuje v logaritmickém prostoru. Místo našeho O( (n)) se často píše O(log n).
Nyní máme jednu z více příležitostí doložit tezi, že algoritmicky zajímavé úlohy
se často vyskytují v logice. Vezměme v úvahu následující úlohy.
Pravdivostní hodnota výrokové formule
Dáno: Výroková formule A a pravdivostní ohodnocení v.
Úkol: Určit, zda ohodnocení v splňuje formuli A.
Sat
Dáno: Výroková formule A.
Úkol: Určit, zda formule A je splnitelná.
Taut
Dáno: Výroková formule A.
Úkol: Určit, zda formule A je výroková tautologie.
U těchto úloh bychom mohli uvažovat tři hodnoty. Například u úlohy Sat by to
byly hodnoty „A není výroková formule , „A je splnitelná výroková formule a „A je
nesplnitelná výroková formule . Tak ale nepostupujeme, dvě z těchto hodnot vždy
ztotožňujeme. Všechny tři úlohy deﬁnujeme jako dvouhodnotové. Odpověď NE
tedy například opět v případě úlohy Sat znamená „A není výroková formule nebo
2.1 Programování v jazyce RASP 73
A je nesplnitelná výroková formule . Takovéto ztotožnění si můžeme dovolit proto,
že nijak neuzavírá ani nekomplikuje cestu zpátky ke třem hodnotám. Kdybychom
trvali na tom, že chceme vědět, co konkrétně znamená NE (například zda „A není
výroková formule či „A je nesplnitelná výroková formule ), neznamenalo by to
(jak se dále ukáže) žádné podstatně větší časové ani paměťové nároky.
Než budeme uvažovat o algoritmech počítajících tyto úlohy, je třeba zvolit abecedu
Σ a stanovit, v jakém formátu budeme na vstupní pásku počítače RASP
zapisovat výrokové formule a případně pravdivostní ohodnocení. V kapitole 1 jsme
vystačili s tím, že výrokové formule jsou sestaveny pomocí logických spojek z výrokových
atomů, přičemž výrokové atomy tvoří abstraktní množinu, na kterou neklademe
žádné zvláštní požadavky a která může být i nespočetná. Pro tento okamžik
a pro všechny situace, kdy budeme uvažovat o algoritmech zpracovávajících výrokové
formule, přijměme dodatečnou úmluvu, že množina všech výrokových atomů
je nekonečná spočetná a že a0, a1, a2, . . . je prostá posloupnost všech jejích prvků.
Protože abeceda Σ musí být konečná, ale výrokových atomů je nekonečně mnoho,
nemůžeme výrokové atomy považovat za jednotlivé (dále nedělitelné) symboly a
musíme se i u nich rozhodnout, jak je budeme zapisovat. Nejjednodušší je zapisovat
atom ai jako znak a následovaný zápisem čísla i. Přitom může být stanoveno,
že zápis čísla i je dekadický, binární, unární (kdy číslo i je zapsáno pomocí
i stejných znaků) nebo ještě jiný. Například atom a9 je při dekadickém zapisování
indexů reprezentován slovem a9, při binárním slovem a1001 a při unárním
slovem a|||||||||.
Lze snadno zdůvodnit, že mezi binárním a dekadickým zapisováním indexů není
vlastně žádný rozdíl, neboť existují rychlé a paměťově úsporné algoritmy, které převedou
zápis formule A, v němž jsou indexy zapsány dekadicky (nebo binárně), na
zápis téže formule, v němž jsou zapsány naopak binárně (resp. dekadicky). V situacích,
které uvažujeme v této knize, by dokonce ani volba unárního zapisování
indexů nic podstatného neměnila. Nicméně pro určitost se domluvme, že indexy
(u atomů ve výrokových formulích a v dalších kapitolách také u proměnných v predikátových
formulích) se zapisují binárně. Kdykoliv tedy uvažujeme o algoritmickém
zpracování syntaktických objektů, výroková formule je pro nás slovem sestaveným
z pomocných symbolů (, ) a a, logických spojek →, ¬, & a ∨ a z číslic 0 a 1.
Než popíšeme algoritmus pro výpočet pravdivostní hodnoty formule při daném
pravdivostním ohodnocení, musíme také stanovit způsob zapisování pravdivostních
ohodnocení. Máme-li jen jednu formuli A, má každé pravdivostní ohodnocení jen
konečně mnoho důležitých hodnot, tj. takových hodnot, které mají vliv na pravdivostní
hodnotu formule A. Můžeme se tedy domluvit, že pravdivostní ohodnocení v
je pro nás konečný seznam dvojic tvaru [i, k], kde k ∈ {0, 1}. Význam dvojice [i, k]
je „atom ai má hodnotu k . O atomech, kterým hodnota není explicitně přiřazena,
se rozumí, že mají hodnotu 0. Zápis dvojice [i, k] sestává z binárních zápisů čísel
i a k oddělených středníkem. Jednotlivé dvojice od sebe navzájem i od formule A
oddělujeme rovněž středníkem. Například obsah vstupní pásky tvaru
( ( a 1 1 0 → a 1 ) → a 1 ) ; 1 1 0 ; 1 · · · (∗)
74 2 Algoritmy a úlohy
reprezentuje otázku, zda výroková formule ((a6→a1)→a1) je splněna ohodnocením,
které výrokový atom a6 ohodnocuje jedničkou a všechny ostatní atomy nulou. Jak
už bylo dohodnuto, plný obdélník označuje koncovou značku. Tři tečky naznačují,
že ve všech ostatních polích vstupní pásky jsou také koncové značky.
Ukážeme si dva různé algoritmy počítající úlohu Pravdivostní hodnota výrokové
formule. Oba začínají svou činnost tím, že vstup tvaru (∗) celý přečtou,
převedou jej do paměti a přepracují jej přitom na tvar
· · · 12 ‘( ‘( ‘a 6 ‘→ ‘a 1 ‘) ‘→ ‘a 1 ‘) 2 1 0 6 1 · · · (∗∗)
Číslo 12 říká, že paměťová reprezentace vstupní formule A je uložena v následujících
dvanácti paměťových buňkách. Paměťová reprezentace se v podstatě shoduje s původní
formulí až na to, že znaky jsou převedeny na číselné kódy (to je naznačeno
levými apostrofy) a binární zápisy indexů jsou převedeny (konvertovány) na čísla.
Zbývající pětice paměťových buněk obsahující čísla 2, 1, 0, 6 a 1 reprezentuje informaci,
že v pravdivostním ohodnocení v jsou dvě důležité hodnoty: atom a1 je ohodnocen
nulou a atom a6 jedničkou. Datová struktura, která zaujímá souvislou část
paměti a v níž první paměťová buňka obsahuje informaci o počtu zbývajících paměťových
buněk, se zpravidla nazývá záznam. O datové struktuře (∗∗) tedy můžeme
mluvit jako o dvou (bezprostředně za sebou následujících) záznamech. První reprezentuje
vstupní formuli A, druhý reprezentuje vstupní pravdivostní ohodnocení v.
Jednoduchý příklad, jak může nějaký program P pracovat se strukturou tvaru (∗∗),
je tento: ukazuje-li buňka X na začátek této struktury (tj. na pole obsahující údaj o
délce prvního záznamu), pak po provedení instrukcí mov X,Y a add @(Y)+,Y ukazuje
buňka Y na druhý záznam, tj. na reprezentaci pravdivostního ohodnocení.
Formulujme první z našich dvou algoritmů, které počítají úlohu Pravdivostní
hodnota výrokové formule.
Přečti ze vstupní pásky vstupní data A a v a zkontroluj jejich formát. Je-li
nesprávný, řekni NE a skonči. Jinak přepracuj vstupní data na datovou strukturu
dohodnutého tvaru (sestávající ze dvou na sebe navazujících záznamů) a zapiš
ji do volné paměti za koncem programu.
Kontrolou formátu rozumíme ověření, že A je skutečně výrokovou formulí a že
ohodnocení v neobsahuje sporné údaje, tj. že pro žádné i neobsahuje současně
dvojice [i, 0] a [i, 1]. Zápis výrokové formule se velmi podobá booleovskému výrazu,
jen místo znamének + a * obsahuje logické spojky →, & a ∨, místo symbolů 0 a 1
obsahuje zápisy výrokových atomů a před výrokovým atomem (čili před znakem a)
a před levou závorkou může obsahovat libovolné množství znaků ¬. To znamená,
že kontrolu, zda A je výrokovou formulí, lze provést algoritmem, který získáme
přizpůsobením některého z našich programů zpracovávajících booleovské výrazy
(z obr. 2.1.5 nebo 2.1.8), a na tuto kontrolu je potřeba čas O(n) nebo O(n2
) a
prostor O(n) nebo O( (n)), kde n je délka vstupních dat. Řekněme, že druhý
záznam naší datové struktury, tj. přepis vstupního ohodnocení v, si přejeme mít
ve tvaru r, i1, k1, . . , ir, kr, kde i1, . . , ir je rostoucí posloupnost přirozených čísel
2.1 Programování v jazyce RASP 75
taková, že ai1 , . . , air je seznam všech atomů vyskytujících se ve formuli A. Na
vytvoření tohoto záznamu také postačuje čas O(n2
). Celá právě utvořená struktura
má velikost O(n). Po této úvodní fázi, čili po přečtení vstupu a inicializaci datových
struktur, náš algoritmus pokračuje analogicky jako program z obr. 2.1.5:
Čti z prvního záznamu právě utvořené datové struktury znaky jeden po druhém.
Znaky (, →, ¬, & a ∨ ukládej beze změny do zásobníku.
Přečteš-li znak a, přečti i celý zbytek zápisu výrokového atomu ai a nalezni
v druhém záznamu dvojici [i, k], tj. nalezni hodnotu k, kterou ohodnocení v
přiřazuje atomu ai. Odstraň ze zásobníku všechny negace bezprostředně předcházející
zápis atomu ai. Ulož k do zásobníku. Byl-li počet odstraněných negací
lichý, nahraď pravdivostní hodnotu k právě uloženou do zásobníku hodnotou k ní
opačnou.
Přečteš-li pravou závorku, pak tato závorka spolu se čtyřmi nejvyššími položkami
v zásobníku tvoří „výraz (sestávající ze dvou pravdivostních hodnot spojených
logickou spojkou a obklopených závorkami), jehož hodnotu k určuje pravdivostní
tabulka příslušné logické spojky. Odstraň ze zásobníku tyto čtyři položky, odstraň
všechny bezprostředně předcházející negace a ulož do zásobníku pravdivostní
hodnotu k nebo hodnotu k ní opačnou podle toho, zda počet odstraněných
negací byl sudý nebo lichý.
Po přečtení celé formule musí být v zásobníku jediná položka, výsledná pravdivostní
hodnota. Podle toho, je-li to jednička nebo nula, řekni ANO nebo NE a
skonči.
Přitom můžeme předpokládat, že ANO nebo NE se řekne zapsáním jednoznakového
slova a či n na výstupní pásku. V této druhé části algoritmu, kde jsou postupně
čteny znaky z datové struktury umístěné za koncem programu, je časově
nejnáročnější ten případ, kdy je přečten výrokový atom. Tehdy program potřebuje
O(n) kroků, aby v paměťové reprezentaci ohodnocení v vyhledal příslušnou
hodnotu, a tento případ může nastat řádově n-krát. Vidíme, že program postupně
provádí několik akcí, z nichž na každou stačí čas O(n2
); pracuje tedy v čase O(n2
).
Protože paměťová reprezentace vstupních dat i maximální velikost prostoru použitého
v zásobníku je O(n), program pracuje v prostoru O(n).
Druhý z našich dvou algoritmů pro počítání úlohy Pravdivostní hodnota
výrokové formule využívá rekurzívní volání podprogramu:
Přečti ze vstupní pásky vstupní data A a v. Zkontroluj jejich formát, a je-li
nesprávný, řekni NE a skonči. Zapiš je v domluveném tvaru (tj. ve tvaru dvou
záznamů) do zásobníku. Volej podprogram Eval. Podle toho, vrátí-li výsledek
ano nebo ne, řekni ANO nebo NE a skonči.
Tato část programu je podobná tomu, co se dělo v posledních pěti řádcích programu
z obr. 2.1.6. Rozdíl je v tom, že podprogram Get měl za úkol zpracovat jistý
podvýraz výrazu umístěného na vstupní pásce, kdežto náš podprogram Eval má za
76 2 Algoritmy a úlohy
úkol vyhodnotit data (formuli plus ohodnocení), která jsou umístěna v zásobníku.
Tato data podprogram nazývá „A a „v . Jedná se ale o „lokální označení v tom
smyslu, že každá kopie podprogramu Eval má na vrcholu zásobníku svá vlastní data
A a v. Předpokládáme, že během určování, zda ohodnocení v splňuje formuli A,
podprogram Eval tato data ze zásobníku odstraní a že výsledek ano nebo ne vrátí
tak, jak jsme zvyklí, uložením výstupního parametru ‘0 nebo ‘1 do zásobníku.
Podprogram Eval pracuje takto:
Pokud formule A, čili první ze dvou záznamů uložených v zásobníku, je reprezentací
atomu ai, nalezni v druhém záznamu hodnotu k, kterou ohodnocení v
přiřazuje atomu ai. Odstraň A a v ze zásobníku a vrať výsledek ano nebo ne
podle toho, zda k = 1 nebo k = 0.
Pokud formule A začíná levou závorkou, může mít jeden z tvarů (B&C), (B∨C)
nebo (B→C). Má-li tvar (B&C), pak: ulož do zásobníku data B a v, volej
podprogram Eval a zapamatuj si výsledek, ulož do zásobníku data C a v, znovu
volej podprogram Eval, zapamatuj si výsledek. Odstraň A a v ze zásobníku a
vrať výsledek ano, byly-li oba zapamatované výsledky ano, jinak vrať výsledek ne.
Pokud formule A má tvar (B∨C) nebo (B→C), postupuj analogicky, jen místo
pravdivostní tabulky konjunkce užij pravdivostní tabulku disjunkce resp. impli-
kace.
Pokud formule A má tvar ¬B, postupuj rovněž analogicky, podprogram Eval
volej na data B a v a užij pravdivostní tabulku negace.
U tohoto programu lze opět snadno odhadnout, že pracuje v čase O(n2
). Víme, že
výpočet takovéhoto podprogramu rekurzívně volajícího sama sebe lze chápat jako
průchod stromem, v němž vrcholy odpovídají jednotlivým kopiím podprogramu, a
že prostor potřebný pro výpočet lze odhadnout jako součet velikostí lokálních dat
všech kopií podél jedné větve stromu. Každá větev má délku nejvýše n a lokální
data každé kopie (tj. formule A a ohodnocení v v zásobníku) mají velikost O(n).
Algoritmus tedy pracuje v prostoru O(n2
).
Máme tedy dva různé algoritmy pro určování pravdivostní hodnoty dané formule
při daném pravdivostním ohodnocení. Význam prvního je v tom, že na něm lze
založit algoritmy pro počítání úloh Sat a Taut. Význam druhého je v tom, že
jeho modiﬁkací lze získat algoritmus pro počítání úlohy QBF, kterou popíšeme za
chvíli. Algoritmus pro úlohu Sat vypadá takto:
Přečti ze vstupní pásky formuli A. Zkontroluj její formát, a je-li nesprávný,
řekni NE a skonči. Zapiš ji v domluveném tvaru do volné paměti za koncem
programu. Za ni zapiš (v dohodnutém formátu reprezentaci) ohodnocení v,
které všem atomům formule A přiřazuje nuly.
Zjisti, zda ohodnocení v splňuje formuli A. Pokud ano, řekni ANO, formule A
je splnitelná, a skonči. Jinak nalezni v ohodnocení v poslední dvojici tvaru [i, 0].
Pokud taková dvojice neexistuje, tj. všem atomům je přiřazena hodnota 1,
2.1 Programování v jazyce RASP 77
řekni NE, formule A není splnitelná, a skonči. Jinak nahraď dvojici [i, 0] dvojicí
[i, 1], druhé členy všech následujících dvojic změň na nuly a pokračuj znovu
od zjišťování, zda ohodnocení v splňuje formuli A.
Tento algoritmus tedy probírá všechna pravdivostní ohodnocení v a zjišťuje, zda
některé splňuje formuli A. Počet všech pravdivostních ohodnocení, tj. všech funkcí
z množiny, která má nejvýše n prvků, do množiny {0, 1}, lze odhadnout číslem 2n
.
Protože na zpracování každého ohodnocení je potřeba čas O(n2
), náš algoritmus
pracuje v čase O(n2
·2n
). Lze také říci, že pracuje v čase 2O(n)
, protože funkce n2
·2n
je v O(22n
). Algoritmus pracuje v prostoru O(n), v každém okamžiku totiž drží
v paměti pouze jedno pravdivostní ohodnocení.
Algoritmus počítající úlohu Taut lze získat naprosto analogicky a bude to algoritmus,
pro který budou platit stejné odhady na čas i prostor.
Kvantiﬁkované výrokové formule jsou výrokové formule, ve kterých se kromě
logických spojek připouštějí také výrokové kvantiﬁkátory ∀p a ∃p. Každá výroková
formule je tedy zároveň kvantiﬁkovanou výrokovou formulí. Navíc je-li A kvantiﬁkovaná
výroková formule a p libovolný výrokový atom, pak i ∀pA a ∃pA jsou
kvantiﬁkované výrokové formule. Je-li v pravdivostní ohodnocení, pak v(p/0) označuje
ohodnocení, které atomu p přiřazuje hodnotu 0 a na všech ostatních atomech
se shoduje s ohodnocením v. Podobně v(p/1) je ohodnocení, které atomu p přiřazuje
hodnotu 1 a jinak se shoduje s ohodnocením v. V dvojici v(p/0) a v(p/1) se
ovšem pouze (a právě) jedno ohodnocení liší od původního ohodnocení v.
Formule ∀pA je splněna ohodnocením v, právě když formule A je splněna oběma
ohodnoceními v(p/0) a v(p/1). Formule ∃pA je splněna ohodnocením v, právě
když formule A je splněna některým z ohodnocení v(p/0) a v(p/1). Ostatní logické
symboly (logické spojky) vyskytující se v kvantiﬁkovaných výrokových formulích
mají obvyklý význam.
Například kvantiﬁkovaná výroková formule ∃q(p&q) je splněna ohodnocením v,
právě když v(p) = 1. Formule ∃p(p ∨ q) a ∀p∃q((p → q) & (q → p)) jsou splněny
každým ohodnocením v.
Nesnažíme se tvrdit, že výrokové kvantiﬁkátory mají zřejmý intuitivní význam
ani že jsou důležité pro logiku. Postupně si ale ozřejmíme, že úloha QBF (quantiﬁed
boolean formulae) má dost velký význam v teoretické informatice:
QBF
Dáno: Kvantiﬁkovaná výroková formule A a pravdivostní ohodnocení v.
Úkol: Určit, zda ohodnocení v splňuje formuli A.
Užijeme-li značení z cvičení 12 oddílu 1.1, můžeme říci, že každá formule ∀pA
je ekvivalentní s formulí Ap( ) & Ap(⊥), kdežto formule ∃pA je ekvivalentní s formulí
Ap( ) ∨ Ap(⊥). To znamená, že každá kvantiﬁkovaná výroková formule je
ekvivalentní s formulí neobsahující výrokové kvantiﬁkátory, a lze si rozmyslet, že je
tomu tak bez ohledu na to, zda symboly a ⊥ byly přijaty mezi základní logické
symboly. Potíž je ale v tom, že odstraněním výrokových kvantiﬁkátorů se formule
může až exponenciálně prodloužit. Algoritmus, který by úlohu QBF počítal tak,
78 2 Algoritmy a úlohy
boolean function E(A, v)
if A = (B & C) then return [E(B, v) and E(C, v)]
if A = (B ∨ C) then return [E(B, v) or E(C, v)]
if A = (B → C) then return [not E(B, v) or E(C, v)]
if A = ¬B then return [not E(B, v)]
if A = ∀aiB then return [E(B, v(i/1)) and E(B, v(i/0))]
if A = ∃aiB then return [E(B, v(i/1)) or E(B, v(i/0))]
if A = ai then return v(i)
endfunction
Obrázek 2.1.9: Algoritmus pro úlohu QBF
že by danou formuli nejprve převedl na ekvivalentní formuli bez výrokových kvantiﬁkátorů,
by tudíž měl vysoké nároky na paměťový prostor. Existuje ale úspornější
algoritmus pro počítání úlohy QBF a lze jej získat tak, že k našemu druhému (rekurzívnímu)
algoritmu pro určování pravdivostní hodnoty výrokové formule přidáme
část, která se zabývá výrokovými kvantiﬁkátory:
Pokud formule A má jeden z tvarů ∀aiB nebo ∃aiB, pak: ulož do zásobníku data
B a v(i/0), volej podprogram Eval a zapamatuj si výsledek, ulož do zásobníku
data B a v(i/1), znovu volej podprogram Eval, zapamatuj si výsledek. Odstraň
A a v ze zásobníku. Měla-li formule A tvar ∀aiB, vrať výsledek ano, byly-li oba
zapamatované výsledky ano, jinak vrať výsledek ne. Měla-li tvar ∃aiB, vrať
výsledek ano, byl-li alespoň jeden ze zapamatovaných výsledků ano, jinak vrať
výsledek ne.
V zápisu algoritmu píšeme v(i/0) a v(i/1) místo důslednějšího v(ai/0) a v(ai/1), což
je snad přijatelné vzhledem k tomu, jak jsme deﬁnovali reprezentaci pravdivostního
ohodnocení. Tato modiﬁkace původního algoritmu má stejné nároky na paměťový
prostor. Úlohu QBF lze tedy počítat v prostoru O(n2
). Pro znalce dodejme, že
jsou známy ještě úspornější algoritmy; to však pro náš text nemá význam.
Na obrázku 2.1.9 jsme podstatnou část našeho algoritmu, totiž jeho podprogram
Eval, přejmenovali na „E a zapsali jsme jej ve smyšleném vyšším programovacím
jazyce, tj. pomocí dosud nepoužitých programových konstruktů (maker).
Zápis E(A, v) v prvním řádku udává, jak se podprogram jmenuje (tj. jaké návěští
se má vygenerovat) a jaké vstupní parametry má podprogram očekávat v zásobníku.
Slovem function je řečeno, že zápis E(. .) se v místech, odkud je podprogram
volán, může vyskytnout ve výrazech. Protože podprogram v některých případech
volá sám sebe, vyskytují se i v něm samém takové výrazy (vymezené hranatými
závorkami), například [not E(B, v)]. Slovo boolean znamená, že zápis E(. .) se
může s jinými takovými výrazy kombinovat pomocí and, or a not. Zápis return V
znamená ulož do zásobníku na patřičné místo hodnotu výstupního parametru V a
pokračuj těsně za místem, odkud byl podprogram E volán. Za místem, odkud byl
podprogram E volán, se musí počítat s tím, že v zásobníku je jedna nová položka,
výsledek činnosti podprogramu E.
2.1 Programování v jazyce RASP 79
Máme tedy algoritmus, který počítá úlohu Pravdivostní hodnota výrokové
formule a který pracuje v čase O(n2
) a v prostoru O(n2
). Dále máme jeho
rozšířenou verzi, která počítá úlohu QBF, pracuje v čase 2O(n)
(cvičení), ale rovněž
vystačí s prostorem O(n2
). Nejdůležitější částí obou algoritmů je podprogram,
který rekurzívně volá sám sebe a který jsme v obou případech pojmenovali Eval.
Všimněme si ještě, že každá kopie podprogramu Eval má v zásobníku vlastní lokální
data sestávající ze dvou záznamů, totiž formuli A a ohodnocení v. V případě prvního
algoritmu se ale ohodnocení v nikdy nemění, všechny kopie podprogramu Eval
mají v zásobníku totéž ohodnocení v. V případě úlohy QBF se ohodnocení v mění.
Formule A se ovšem mění v obou případech, v obou programech je formule A dělena
na jednodušší a jednodušší formule, dokud se nedospěje k výrokovým atomům.
Nechť Σ je konečná abeceda a nechť g je funkce deﬁnovaná na množině Σ∗
všech
slov v abecedě Σ. Má-li funkce g pouze dvě hodnoty (ANO či NE), mluvíme o ní jako
o rozhodovací úloze. Úlohy Pravdivostní hodnota výrokové formule, Sat
a Taut jsou příklady rozhodovacích úloh. Také úlohy Hodnota booleovského
výrazu a Prvočíselnost lze chápat jako rozhodovací úlohy. Rozhodovací úlohu g
můžeme ztotožnit s množinou všech těch w ∈ Σ∗
, pro která g(w) je ANO. Například
úlohu Taut lze považovat buď za dvouhodnotovou funkci deﬁnovanou na množině
{→, ¬, &, ∨, a, 0, 1, (, )}∗
(která každému w přiřazuje hodnotu ANO nebo NE podle
toho, je-li w tautologií), nebo za množinu všech slov w ∈ {→, ¬, &, ∨, a, 0, 1, (, )}∗
,
která jsou tautologiemi. Podobně Prvočíselnost lze chápat jako množinu všech
slov v abecedě {0, 1}, která jsou zápisem prvočísla. Řekneme, že program P rozhoduje
úlohu A ⊆ Σ∗
, jestliže pro libovolné slovo w ∈ Σ∗
platí, že program P se
dopočítá při zpracování vstupu w a navíc skončí svou činnost rozsvícením zeleného
světla právě tehdy, platí-li w ∈ A. Jinak řečeno, rozhoduje-li program P určitou
úlohu, pak jakýkoliv jeho výstup interpretujeme jako ANO, kdežto neposkytnutí
výstupu interpretujeme jako NE. Program se ale na žádném vstupu nesmí zacyklit.
Je zřejmé, že program, který ANO či NE řekne rozsvícením zeleného či červeného
signálního světla, lze snadno upravit na program, který vždy dospěje k rozsvícení
zeleného světla a ANO či NE dá najevo příslušným zápisem na výstupní pásku (čili
na program, který dle naší deﬁnice počítá funkci deﬁnovanou na množině všech slov
dané abecedy). Opačná úprava je také možná, ale nebudeme ji potřebovat.
Rozhodovací úloha je rozhodnutelná (na počítači RASP), jestliže existuje program,
který ji rozhoduje. Ve zřejmém smyslu mluvíme také o rozhodnutelnosti
v čase a o rozhodnutelnosti v prostoru. Rozhodovacím úlohám se v literatuře často
také říká jazyky. My ale budeme termín „jazyk od příští kapitoly používat v jiném
významu.
Naše dosavadní úvahy o algoritmické rozhodnutelnosti úloh vyskytujících se ve
výrokové logice a o jejich složitosti můžeme shrnout do následující věty.
Věta 2.1.1 Úlohy Sat, Taut a QBF jsou algoritmicky rozhodnutelné. Existují
programy pro počítač RASP, které rozhodují úlohu Sat resp. Taut a které pracují
v čase 2O(n)
a v prostoru O(n). Existuje program, který rozhoduje úlohu QBF a
který pracuje v čase 2O(n)
a v prostoru O(n2
).
80 2 Algoritmy a úlohy
Algoritmus, jehož časové nároky rostou exponenciálně s délkou vstupu, nelze
považovat za příliš efektivní ani za prakticky užitečný. O otázce, zda pro úlohy
Sat, Taut a QBF existují lepší algoritmy, a o významu všech tří úloh se zmíníme
v oddílu 2.3. V tomto oddílu ještě naznačíme, jak může vypadat úloha, která na
počítači RASP není rozhodnutelná, tj. kterou nelze rozhodovat žádným programem
bez ohledu na efektivnost.
Řekneme, že program P přijímá rozhodovací úlohu A ⊆ Σ∗
, jestliže pro libovolné
slovo w ∈ Σ∗
platí, že P poskytne výstup při zpracování vstupu w, právě
když w ∈ A. Program, který přijímá úlohu A, má tedy povinnost skončit provedením
instrukce error nebo se zacyklit (nedopočítat se) při zpracování libovolného
slova w ∈ Σ∗
− A, a naopak dopočítat se a dát nějaký (libovolný) výstup při zpracování
libovolného slova w ∈ A.
Lemma 2.1.2 (a) Nechť rozhodovací úloha A ⊆ Σ∗
je rozhodnutelná na počítači
RASP. Pak i její komplement Σ∗
− A je rozhodnutelný na počítači RASP.
(b) Je-li úloha A ⊆ Σ∗
rozhodnutelná na počítači RASP, pak existuje program
v jazyce RASP, který úlohu A přijímá.
Důkaz je zřejmý. V programu, který se dopočítá na každém vstupu, totiž můžeme
zaměnit instrukce halt a error, a získat tak program, který rozhoduje komplement
dané úlohy. Dále je zřejmé, že program, který určitou úlohu rozhoduje, tutéž úlohu
současně i přijímá. QED
Zvolme minimální abecedu Σ0, která postačuje k zapsání libovolného programu
v jazyce RASP. Mysleme si na chvíli, že programy píšeme bez komentářů a že
tedy znaku středník můžeme dát nový význam. Dále si mysleme, že překladač
jazyka RASP nerozlišuje mezi malými a velkými písmeny. Do abecedy Σ0 tedy
zahrňme znaky @, #, -, +, (, ), dále čárku, levý apostrof, tečku a středník, číslice
0 až 9 a konečně všechna malá latinská písmena a mezeru. Znak tečka slouží
k oddělení instrukcí v zápisu programu, tj. stojí všude tam, kde by se v „normálním
zápisu programu přešlo na nový řádek. Deﬁnujme úlohu
Problém zastavení
Dáno: Program P (zapsaný bez maker a komentářů a tak, že jednotlivé instrukce
jsou odděleny tečkou) a slovo w v abecedě Σ0 − {;}.
Úkol: Rozhodnout, zda program P se dopočítá (zastaví), je-li mu ke zpracování
předložen vstup w.
Domluvme se, že program P a slovo w jsou na vstupní pásce počítače odděleny
znakem středník. Komplement úlohy Problém zastavení tedy obsahuje slova
v abecedě Σ0, která neobsahují středník, dále slova, která obsahují více než jeden
středník, pak slova tvaru P;w, kde P a w neobsahují středník a P není zápisem
programu, a konečně (hlavně) slova P;w, kde P je zápisem programu (takže neobsahuje
středník) a w je takové slovo v abecedě Σ0 − {;}, při jehož zpracování se
program P zacyklí.
2.1 Programování v jazyce RASP 81
Věta 2.1.3 (a) Existuje program v jazyce RASP, který přijímá úlohu Problém
zastavení.
(b) Neexistuje program v jazyce RASP, který přijímá komplement úlohy Problém
zastavení. Úloha Problém zastavení tedy není na počítači RASP rozhodnu-
telná.
K tvrzení (b) poznamenejme, že jeho druhá část plyne z první, využijeme-li
lemma 2.1.2. Větu 2.1.3 ponecháváme bez důkazu, něco k ní ale ještě řekneme
v oddílu 2.2. Podrobný důkaz tvrzení 2.1.3(a), ale pro jiný výpočtový model, totiž
pro Turingovy stroje, je uveden ve skriptech [15].
Některé úlohy tedy nejsou rozhodnutelné (počitatelné) na počítači RASP. Pokud
nějaká rozhodovací úloha rozhodnutelná není, může se stát, že existuje program,
který ji alespoň přijímá. O takovém programu samozřejmě netvrdíme, že je
užitečný v programátorské praxi. Za zajímavý ale pokládáme fakt, že některé úlohy
nemají ani to, tj. že o dané úloze je někdy možné dokázat, že nejenže není rozhodnutelná,
ale že dokonce ani neexistuje program, který ji přijímá. „Přijímatelnost
tedy považujeme za důležitý teoretický nástroj pro klasiﬁkaci (nerozhodnutelných)
úloh.
Cvičení
1. Booleovský výraz v preﬁxovém formátu je deﬁnován takto: 0 a 1 jsou booleovské
výrazy v preﬁxovém formátu, a dále jsou-li u a v booleovské výrazy
v preﬁxovém formátu, pak i +uv a *uv jsou výrazy v preﬁxovém formátu. Například
výrazům (1+(1*0)) a ((1+0)+((1+1)*0)) odpovídají výrazy +1*10
a ++10*+110 v preﬁxovém formátu. Při zapisování výrazů v preﬁxovém formátu
se tedy neužívají závorky a operační znaménko se píše před operandy
místo mezi ně. Napište program v jazyce RASP pro určování hodnoty booleovského
výrazu v preﬁxovém formátu.
2. Zdůvodněte bez programování detailů, že existuje program pro počítač RASP,
který počítá dělení dvou přirozených čísel a který pracuje v čase O(n).
3. Eukleidův algoritmus pro výpočet největšího společného dělitele přirozených
čísel pracuje tak, že konstruuje posloupnost d0 ≥ d1 > d2 > . . . přirozených
čísel. Iniciálně je d0 větší a d1 menší z čísel, ke kterým má být nalezen největší
společný dělitel. Jsou-li již sestrojena čísla d0 ≥ d1 > d2 > . . > di+1 a di+1 = 0,
algoritmus končí a di je výsledek. Je-li di+1 = 0, k posloupnosti je přidán nový
člen di+2 deﬁnovaný jako zbytek po dělení čísla di číslem di+1. Zdůvodněte, že
tento algoritmus pro každou dvojici čísel správně určí jejich největší společný
dělitel.
4. Zdůvodněte na základě předchozích dvou cvičení, že existuje program pro počítač
RASP, který počítá největší společný dělitel dvou přirozených čísel a který
pracuje v prostoru O(n) a čase O(n2
).
82 2 Algoritmy a úlohy
Návod. Zdůvodněte, že pro každé tři po sobě jdoucí členy di, di+1, di+2 v posloupnosti
deﬁnované v předchozím cvičení platí di ≥ di+1 + di+2 a di ≥ 2di+2.
5. Navrhněte program pro počítač RASP, který pro každé přirozené číslo x určí,
zda x je prvočíslem (tj. který počítá úlohu Prvočíselnost). Stanovte prostorové
a časové nároky vašeho programu.
Návod. Spokojte se s tímto výsledkem: prostor O(n), čas 2O(n)
.
6. Jsou-li u a v booleovské výrazy a w1 a w2 slova v abecedě {(, ), +, *, 0, 1} taková,
že w1u = w2v nebo uw1 = vw2, pak u = v a w1 = w2. Dokažte.
Návod. Postupujte indukcí podle součtu počtu znaků ve výrazech u a v. Užijte
opakovaně fakt, že jsou-li w1, w2 a w slova taková, že w1w = w2w, pak w1 = w2.
7. Nechť w a v jsou slova v {(, ), +, *, 0, 1} taková, že wv) a v jsou booleovské
výrazy. Pak slovo w má délku alespoň 3, jeho prvním znakem je levá závorka,
posledním znakem je + nebo *, předposledním znakem je 0, 1, nebo ). Dokažte.
8. V komentáři k programu z obr. 2.1.8 bylo deﬁnováno, co je levá závorka příslušná
k dané pravé závorce. Zdůvodněte, že (i) ke každé pravé závorce libovolného
slova w v abecedě {(, ), +, *, 0, 1} existuje nejvýše jedna k ní příslušná levá
závorka, (ii) je-li navíc w booleovským výrazem, pak ke každé pravé závorce
slova w existuje (právě jedna) k ní příslušná levá závorka, a (iii) je-li navíc w
výrazem různým od 0 a 1, pak poslední znak slova w je pravá závorka a první
znak k ní příslušná levá závorka.
9. Napište (jinak neužitečný) program, který pracuje v čase O(n), ale při zpracování
libovolného vstupu délky n použije paměť velikosti nejméně 2n
.
Návod. Každá konﬁgurace při naší deﬁnici udává obsah souvislého pole paměťových
buněk. Paměťové buňky, do kterých program během své činnosti něco
zapíše, nemusí tvořit souvislé pole.
10. Zdůvodněte, že každá z funkcí n → nk
· 2n
je v O(22n
).
11. Zdůvodněte, že náš program pro rozhodování úlohy QBF pracuje v čase 2O(n)
.
2.2 Základní pojmy z teorie rekurzívních funkcí
V tomto oddílu se budeme zabývat funkcemi, jejichž argumenty i funkční hodnoty
jsou přirozená čísla. Začněme dvěma jednoduchými příklady. Snadno lze ukázat
(indukcí podle x), že existuje právě jedna funkce f, splňující (pro všechna x) pod-
mínky
f(0) = 1, f(x + 1) = (x + 1) · f(x). (1)
Jde o funkci x → x!, tj. o funkci faktoriál. Také podmínky
f(0) = 1, f(1) = 1, f(x + 2) = f(x + 1) + f(x) (2)
2.2 Základní pojmy z teorie rekurzívních funkcí 83
jednoznačně určují funkci z N do N. Její hodnoty například v bodech 0 až 5 jsou
1, 1, 2, 3, 5 a 8 a říká se jí Fibonacciho funkce. Společnou vlastností předpisů
(1) a (2) je to, že nedávají přímou odpověď na otázku, jaká je hodnota funkce f
v určitém bodě x, nýbrž převádějí ji na otázku, jaká je hodnota funkce f v nějakém
jiném bodě nebo bodech. Chceme-li na základě předpisu (2) určit hodnotu funkce f
například v bodě 17, potřebujeme znát její hodnoty v bodech 15 a 16; tyto hodnoty
pak máme sečíst. Přitom je důležité, že tyto nové otázky, na které je převedena
původní otázka po hodnotě v bodě x, se vždy týkají čísel menších než x. Díky tomu
můžeme předpis tvaru (1) nebo (2) užít k výpočtu hodnoty funkce v libovolném
bodě x: máme-li určit hodnotu například opět v bodě 17, určíme nejprve postupně
hodnoty ve všech bodech 0 až 16.
Předpisům tvaru (1) a (2) se obecně říká rekurzívní deﬁnice funkce a o funkci,
která je takovým předpisem určena, se říká, že je deﬁnována (odvozena) rekurzí.
Náš plán je deﬁnovat přesně jednu z variant rekurze, totiž primitivní rekurzi, a pak
deﬁnovat částečně rekurzívní funkce jako funkce, které lze odvodit opakovaným
užitím primitivní rekurze a ještě dalších dvou operací. Částečně rekurzívní funkce
budou naším druhým výpočtovým modelem.
Domluvme se, že platí-li ψ : X → Y , tj. zobrazuje-li funkce ψ množinu X do
množiny Y , množině X říkáme deﬁniční obor funkce ψ a píšeme X = Dom(ψ). Pro
pozdější použití deﬁnujme množinu Rng(ψ), obor hodnot funkce ψ, jako množinu
{ z ; ∃x(ψ(x) = z) }. Dále se domluvme, z jakého univerza funkcí chceme vyčlenit
částečně rekurzívní funkce:
Deﬁnice 2.2.1 Funkce ψ je částečná funkce k proměnných, platí-li ψ : X → N,
kde X ⊆ Nk
. Částečná funkce ψ, která je funkcí k proměnných, je totální, jestliže
platí Dom(ψ) = Nk
.
Místo [x1, . . , xk] ∈ Dom(ψ) budeme psát !ψ(x1, . . , xk). Zápis !ψ(x1, . . , xk)
čteme „funkce ψ je deﬁnována v bodě [x1, . . , xk] nebo také „funkce ψ konverguje
v bodě [x1, . . , xk] . V souladu s tím se zápis ¬!ψ(x1, . . , xk) někdy čte „funkce ψ
diverguje v bodě [x1, . . , xk] . Za částečnou funkcí ψ se často budeme snažit vidět
nějaký program, který ji počítá, a je-li z její funkční hodnota v bodě [x1, . . , xk],
bude užitečné si představovat, že z je výstup, který onen program vydal, jestliže
mu byl mu ke zpracování předložen vstup [x1, . . , xk]. Zápis !ψ(x1, . . , xk) se proto
čte také „funkce ψ se dopočítá v bodě [x1, . . , xk] , kdežto zápis ¬!ψ(x1, . . , xk) se
čte „funkce ψ se zacyklí v bodě [x1, . . , xk] .
Domluvme se, že je-li počet k členů nějaké k-tice zřejmý nebo nepodstatný,
nebudeme jej vyznačovat a k-tici označíme podtrženým písmenem. Tuto úmluvu
budeme vydatně využívat v celém zbývajícím textu. Je-li tedy například ψ částečná
funkce k proměnných, pak ψ je totální, platí-li ∀x1 . . ∀xk!ψ(x).
Uvidíme, že je-li ψ částečně rekurzívní funkce k proměnných a deﬁnujeme-li
totální funkci f předpisem f(x) = ψ(x) pro [x1, . . , xk] ∈ Dom(ψ) a f(x) = 0 pro
[x1, . . , xk] /∈ Dom(ψ) (tj. dodeﬁnujeme-li funkci ψ nulou), pak funkce f nemusí být
částečně rekurzívní. Může se dokonce stát, že funkce ψ (jako množina (k + 1)-tic)
84 2 Algoritmy a úlohy
není podmnožinou žádné totální částečné rekurzívní funkce stejného počtu k proměnných.
Toto je důvod, proč uvažujeme i netotální částečné funkce.
Částečné funkce značíme malými latinskými písmeny f, g, h, . . . nebo malými
řeckými písmeny. Nebude-li ale o funkci označené latinským písmenem řečeno jinak,
rozumí se, že jde o totální funkci.
Řekneme, že funkce ϕ, která má k + 1 proměnných, je odvozena z funkcí
ψ a χ, které mají k resp. k + 2 proměnných, operací primitivní rekurze, jestliže
pro všechna x, y1, . . , yk a z platí
ϕ(0, y) = z ⇔ ψ(y) = z,
ϕ(x + 1, y) = z ⇔ !ϕ(x, y) & χ(ϕ(x, y), x, y) = z.
(3)
Příklad 2.2.2 Sčítání přirozených čísel, tj. funkce f(x, y) = x + y s deﬁničním
oborem N2
, je odvozena primitivní rekurzí z funkcí g a h, o kterých platí g(y) = y
a h(v, x, y) = v + 1.
Indukcí lze snadno dokázat, že jsou-li ϕ, ψ a χ jako v (3) a platí-li !ϕ(x, y), pak
platí i !ϕ(v, y) pro všechna v < x.
Zápis ψ(y) = z v (3) znamená, že funkce ψ je deﬁnována v bodě [y1, . . , yk] a její
hodnota v tomto bodě je z. Stejný význam mají i ostatní rovnosti v (3) a dále. Zápis
ψ(y) = z by tedy znamenal, že funkce ψ buď není deﬁnována v bodě [y1, . . , yk],
nebo že její hodnota v tomto bodě je jiná než z.
Řekneme, že funkce ϕ, která má k proměnných, je odvozena z funkce χ, která
má m proměnných, a z funkcí ψ1, . . , ψm, které mají shodně k proměnných, operací
substituce, jestliže pro všechna x1, . . , xk a z platí
ϕ(x) = z ⇔ !ψ1(x) & . . & !ψm(x) & χ(ψ1(x), . . , ψm(x)) = z. (4)
Funkce ϕ je tedy deﬁnována v bodě [x1, . . , xk] právě tehdy, jsou-li v [x1, . . , xk] deﬁnovány
všechny funkce ψi a je-li navíc funkce χ deﬁnována v bodě [ψ1(x), . . , ψm(x)].
Pro operaci substituce (říká se také operace dosazení nebo operace skládání
funkcí) se užívá znak ◦. Fakt, že ϕ je z χ a ψ1, . . , ψm odvozena substitucí, se
zapisuje ϕ = χ ◦ [ψ1, . . , ψm]. Je-li m = 1, tj. je-li ϕ odvozena substitucí z funkce χ
jedné proměnné a z jedné funkce ψ, píšeme ϕ = χ ◦ ψ.
Běžně užívaný zápis pro podmínku (4) je
ϕ(x) χ(ψ1(x), . . , ψm(x)),
přičemž znak má tento význam: levá strana je deﬁnována jako hodnota výrazu
na pravé straně, pokud je tento výraz deﬁnován; není-li deﬁnován, ani levá strana
není deﬁnována.
Řekneme, že funkce ϕ, která má k proměnných, je z funkce ψ, která má k + 1
proměnných, odvozena operací minimalizace, jestliže pro všechna x1, . . , xk a z platí
ϕ(x) = z ⇔ ψ(x, z) = 0 & ∀y<z (!ψ(x, y) & ψ(x, y) = 0). (5)
2.2 Základní pojmy z teorie rekurzívních funkcí 85
Běžně užívaný zápis pro podmínku (5) je
ϕ(x) µy(ψ(x, y) = 0),
písmeno µ odkazuje ke slovu „minimum .
Příklad 2.2.3 Předpokládejme, že pro totální funkci g dvou proměnných platí
g(x, y) = 0, je-li x < 2y
, a g(x, y) = 0 jinak. Užijeme-li na funkci g operaci
minimalizace, dostaneme tutéž funkci, kterou jsme v minulém oddílu označili a
nazvali celočíselným logaritmem.
Příklad 2.2.4 Předpokládejme, že pro funkci ψ, která je funkcí k proměnných, a
určitou k-tici [x1, . . , xk] platí ψ(x, 0) = 1, ¬!ψ(x, 1) a ψ(x, 2) = 0. Je-li ϕ odvozena
z ψ operací minimalizace, platí ¬!ϕ(x).
Vidíme tedy, že µy(ψ(x, y) = 0) nemusí být totéž co min{ y ; ψ(x, y) = 0 }.
V situaci z příkladu 2.2.4 platí ¬!µy(ψ(x, y) = 0), ale min{ y ; ψ(x, y) = 0 } = 2.
Je-li ϕ odvozena z ψ minimalizací a platí-li ϕ(x) = z, deﬁnice operace minimalizace
požaduje, aby platilo i !ψ(x, v) pro všechna v ≤ z. Tento požadavek je
v souladu s naší snahou vidět za každou částečnou funkcí nějaký program a za
kteroukoliv její hodnotou z vidět výpočet onoho programu, jehož výstupem je z.
Výpočet funkce ϕ odvozené z ψ minimalizací se může zacyklit tak, že není nalezeno
z splňující ψ(x, z) = 0, ale také tak, že výpočet funkce ψ se zacyklí na nějakém
vstupu [x, v] dříve, než by bylo nalezeno takové z.
Deﬁnice 2.2.5 (a) Základní funkce jsou funkce s, z a ik
j pro 1 ≤ j ≤ k, kde
s(x) = x + 1, z(x) = 0, ik
j (x1, . . , xk) = xj
pro každé x resp. pro každou k-tici [x1, . . , xk].
(b) Částečná funkce je částečně rekurzívní, jestliže ji lze odvodit ze základních
funkcí pomocí operací primitivní rekurze, substituce a minimalizace.
(c) Částečná funkce je rekurzívní (nebo obecně rekurzívní), jestliže je částečně rekurzívní
a totální.
(d) Částečná funkce je primitivně rekurzívní, jestliže ji lze odvodit ze základních
funkcí pomocí operací primitivní rekurze a substituce.
(e) Množinu všech částečně rekurzívních, rekurzívních a primitivně rekurzívních
funkcí značíme FPartR, FOR resp. FPR.
Operace minimalizace je jediná z našich tří operací, jejíž užití na totální funkci
může dát netotální funkci. Výsledkem užití primitivní rekurze nebo substituce
na totální funkce je vždy opět totální funkce. Protože základní funkce jsou totální,
všechny primitivně rekurzívní funkce jsou automaticky totální a platí inkluze
FPR ⊆ FOR ⊆ FPartR. Když je funkce f odvozena z (totálních) funkcí g a h primitivní
rekurzí nebo když je f odvozena z (totálních) funkcí h a g1, . . , gm substitucí,
86 2 Algoritmy a úlohy
můžeme podmínky (3) a (4) přepsat na
f(0, y) = g(y), f(x + 1, y) = h(f(x, y), x, y), (3’)
f(x) = h(g1(x), . . , gm(x)). (4’)
Primitivně rekurzívní funkce jsou tedy ty funkce, které jsou ze základních odvoditelné
pomocí „totálních variant operací primitivní rekurze a substituce vyjádřených
podmínkami (3 ) a (4 ).
Příklad 2.2.6 Funkce s ◦ (z ◦ i2
1) je konstanta dvou proměnných s hodnotou 1.
Funkce s◦(s◦(s◦z)) je konstanta jedné proměnné s hodnotou 3. Obě tyto funkce jsou
primitivně rekurzívní. Podobně lze zdůvodnit, že konstanta s libovolnou hodnotou
a s libovolným počtem proměnných je primitivně rekurzívní.
Příklad 2.2.7 Pro funkce g a h z příkladu 2.2.2 platí g = i1
1 a h = s ◦ i3
1. Platí
tedy g ∈ FPR a h ∈ FPR. Protože funkce f(x + y) = x + y je z g a h odvozena
primitivní rekurzí, platí i f ∈ FPR. Sčítání přirozených čísel je tedy primitivně
rekurzívní funkcí.
Podobně bychom mohli zdůvodnit, že také funkce [x, y] → x·y a [x, y] → yx
jsou
primitivně rekurzívní. Pro zdůvodnění, že třeba také funkce x → x! je primitivně
rekurzívní, je výhodné užít následující variantu (6) primitivní rekurze.
Lemma 2.2.8 Nechť h je primitivně rekurzívní funkce dvou proměnných a nechť
pro číslo c a pro každé x platí
f(0) = c, f(x + 1) = h(f(x), x). (6)
Pak f je primitivně rekurzívní funkce.
Důkaz Deﬁnujme funkci h předpisem h (v, x, y) = h(v, x). Platí h = h ◦ [i3
1, i3
2],
tedy h je primitivně rekurzívní. Označme g konstantu jedné proměnné s hodnotou
c. Pro funkci f , která je z g a h odvozena primitivní rekurzí, platí
f (0, y) = c, f (x + 1, y) = h (f (x, y), x, y) = h(f (x, y), x).
Funkci f lze z f odvodit například takto: f = f ◦ [i1
1, z]. QED
Operace primitivní rekurze umožňuje pro m ≥ 1 odvodit funkci m + 1 proměnných
ze dvou funkcí, z nichž jedna je funkcí m proměnných a druhá je funkcí
m + 2 proměnných. Lemma 2.2.8 říká, že omezení m ≥ 1 není příliš podstatné.
Snadno lze také dokázat (podobným důkazem nebo převedením na tvrzení lemmatu
2.2.8), že je-li h primitivně rekurzívní funkce jedné proměnné a splňuje-li f
podmínky
f(0) = c, f(x + 1) = h(f(x)), (7)
pak f je primitivně rekurzívní. Podmínky (6) a (7) jsou tedy korektní varianty
primitivní rekurze. Také omezení v deﬁnici operace substituce požadující, aby
2.2 Základní pojmy z teorie rekurzívních funkcí 87
všechny vnitřní funkce měly stejný počet k proměnných, je nepodstatné. Je-li
například f odvozena z g a h (dvou proměnných) předpisem
f(x, y, z) = h(g(x, y), z), (8)
pak platí f = h◦[g◦[i3
1, i3
2], i3
3], a jsou-li g a h primitivně rekurzívní nebo rekurzívní,
pak i f je primitivně rekurzívní resp. rekurzívní.
Postupu, kterým byla v důkazu lemmatu 2.2.8 odvozena funkce h z funkce h, říkejme
přidání jalové proměnné a postupu, kterým byla funkce f získána z funkce f
říkejme dosazení konstanty. Další podobně jednoduchou operací je ztotožnění proměnných:
víme-li například, že funkce h(x, y) = x · y je primitivně rekurzívní, pak
i funkce f(x) = x2
je primitivně rekurzívní, protože f = h ◦ [i1
1, i1
1]. Množina všech
primitivně rekurzívních funkcí je tedy uzavřená na operace přidání jalové proměnné,
dosazení konstanty a ztotožnění proměnných, na varianty primitivní rekurze tvaru
(6) a (7) a na různé varianty substituce podobné tvaru (8). Totéž je pravda i o
množině všech rekurzívních funkcí a o množině všech částečně rekurzívních funkcí.
Tyto fakty budeme v dalším užívat bez upozorňování.
Příklad 2.2.9 Nechť y ·− x je deﬁnováno jako y − x pro y ≥ x a jako 0 pro y < x.
Této funkci říkejme podmíněné odčítání. Funkce y → y ·−1 je primitivně rekurzívní:
0 ·− 1 = 0, (y + 1) ·− 1 = y,
a z funkce y → y ·− 1 lze odvodit funkci [x, y] → y ·− x:
y ·− 0 = 0, y ·− (x + 1) = (y ·− x) ·− 1.
Podmíněné odčítání je tedy primitivně rekurzívní funkcí.
Příklad 2.2.10 Víme-li již, že mocnina a podmíněné odčítání jsou primitivně rekurzívní
funkce, můžeme tvrdit, že také funkce g(x, y) = (x + 1) ·− 2y
je primitivně
rekurzívní. Funkce g splňuje podmínku g(x, y) = 0 ⇔ x < 2y
. Z příkladu 2.2.3
plyne, že funkce , tj. celočíselný logaritmus, je rekurzívní funkcí.
K příkladu 2.2.10 je nutno poznamenat, že dá-li se nějaká funkce odvodit s použitím
minimalizace, není to ještě důkaz, že užití operace minimalizace bylo k jejímu
odvození nutné. O funkci později zjistíme, že ji lze odvodit bez užití minimalizace,
a že je tedy dokonce primitivně rekurzívní. Uvést příklad funkce, která je obecně
rekurzívní, ale není primitivně rekurzívní, není zcela snadné. Je ale snadné uvést
příklad funkce, která je částečně rekurzívní a není obecně rekurzívní; například
funkce x → µy(i2
1(x, y) = 0) je netotální částečně rekurzívní funkcí.
Deﬁnice 2.2.11 Nechť A ⊆ Nk
. (a) Množina A je rekurzívně spočetná, jestliže
existuje částečně rekurzívní funkce ψ taková, že A = Dom(ψ).
(b) Charakteristická funkce množiny A je funkce cA, která je deﬁnovaná předpisem
cA(x) = 1 pro [x1, . . , xk] ∈ A a cA(x) = 0 jinak.
88 2 Algoritmy a úlohy
(c) Množina A je (obecně) rekurzívní, jestliže cA je rekurzívní funkce.
(d) Množina A je primitivně rekurzívní, jestliže cA je primitivně rekurzívní funkce.
(e) Množinu všech rekurzívně spočetných, rekurzívních a primitivně rekurzívních
množin značíme RS, OR resp. PR.
Snadno lze ověřit, že deﬁnujeme-li funkci g předpisem g(x, y) = 1 ·− cA(x)
a odvodíme-li z funkce g funkci ψ minimalizací: ψ(x) µy(g(x, y) = 0), platí
Dom(ψ) = A. Navíc je-li cA ∈ FOR, pak ψ ∈ FPartR. Tím je zdůvodněno, že každá
rekurzívní množina je rekurzívně spočetná. Platí tedy inkluze PR ⊆ OR ⊆ RS.
Domluvme se, že je-li A ⊆ Nk
, symbolem A značíme komplement množiny A,
tj. množinu Nk
− A.
Lemma 2.2.12 (a) Sjednocení, průnik a komplement rekurzívních množin je opět
rekurzívní množina.
(b) Sjednocení, průnik a komplement primitivně rekurzívních množin je opět primitivně
rekurzívní množina.
Důkaz Pro každou k-tici [x1, . . , xk] platí
cA∩B(x) = cA(x) · cB(x),
cA(x) = 1 ·− cA(x),
cA∪B(x) = 1 ·− (1 ·− (cA(x) + cB(x))).
Tyto funkce jsou rekurzívní, jsou-li cA a cB rekurzívní, a jsou primitivně rekurzívní,
jsou-li cA a cB primitivně rekurzívní. QED
Snadno lze ověřit, že každá jednoprvková podmnožina množiny Nk
je primitivně
rekurzívní. Z toho a z lemmatu 2.2.12 plyne, že všechny konečné množiny a také
jejich komplementy jsou primitivně rekurzívní.
Místo [x1, . . , xk] ∈ A budeme často psát A(x1, . . , xk) nebo A(x). Je-li k = 2,
místo [x, y] ∈ A nebo A(x, y) se také píše x A y (tuto konvenci jsme už použili
v kapitole 1).
Je-li A ⊆ Nk+1
, pak zápis µyA(x, y) značí funkci, jejíž hodnota v [x1, . . , xk]
je min{ y ; A(x, y) } v případech, kdy ∃yA(x, y), a jejíž hodnota není deﬁnovaná
v ostatních případech. Je lehké ověřit, že je-li množina A rekurzívní, pak funkce
[x1, . . , xk] → µyA(x, y) je částečně rekurzívní.
Místo o množinách k-tic nebo o množinách čísel budeme často mluvit o podmínkách
a o vlastnostech. Řekneme-li například, že „podmínka x < y je primitivně rekurzívní
, znamená to, že množina {[x, y]; x < y} je primitivně rekurzívní. (Snadno
lze dokázat, že opravdu ano, podmínka x < y, a také podmínky x ≤ y a x = y
jsou primitivně rekurzívní.) Lemma 2.2.12 lze také formulovat takto: jak rekurzívní,
tak primitivně rekurzívní podmínky jsou uzavřeny na disjunkci, konjunkci a
negaci. Řeč podmínek a vlastností je výhodná v tom, že snadno umožňuje vzít do
hry také kvantiﬁkaci.
2.2 Základní pojmy z teorie rekurzívních funkcí 89
Nejprve uvažujme jen jistý druh kvantiﬁkace, totiž omezenou kvantiﬁkaci. Zápis
∀v<xA(v, y), kde A je (k + 1)-ární podmínka, znamená ∀v(v < x ⇒ A(v, y)).
Zápis ∃v<xA(v, y) znamená ∃v(v < x & A(v, y)). Analogický význam mají podmínky
∀v≤xA(v, y) a ∃v≤xA(v, y). Je-li B kterákoliv z (k + 1)-árních podmínek
∀v<xA(v, y), ∃v<xA(v, y), ∀v≤xA(v, y) a ∃v≤xA(v, y), říkáme, že podmínka B
je z podmínky A odvozena omezenou kvantiﬁkací.
Lemma 2.2.13 Je-li podmínka B odvozena z podmínky A omezenou kvantiﬁkací
a je-li A rekurzívní, pak B je rekurzívní. Je-li A primitivně rekurzívní, pak B je
primitivně rekurzívní.
Důkaz Nechť například B je podmínka ∃v<xA(v, y), tj. platí
B = { [x, y] ; ∃v<x([v, y] ∈ A) }.
Označme sg (jako signum) funkci deﬁnovanou předpisem sg(x) = 1 ·− (1 ·− x). Platí
sg(0) = 0 a sg(x) = 1 pro x = 0. Charakteristickou funkci množiny B lze odvodit
primitivní rekurzí z funkce sg a z charakteristické funkce množiny A:
cB(0, y) = 0, cB(x + 1, y) = sg(cB(x, y) + cA(x, y)).
Je-li A rekurzívní, pak i B je rekurzívní, a je-li A primitivně rekurzívní, pak i B je
primitivně rekurzívní. Zbývající případy ponecháváme za cvičení. QED
Příklad 2.2.14 Obě funkce [v, x, y] → v · x a [v, x, y] → y jsou primitivně rekurzívní.
Jejich substitucí do charakteristické funkce relace { [u, t] ; u = t },
tj. do charakteristické funkce rovnosti, dostaneme charakteristickou funkci relace
{[v, x, y]; v ·x = y }. Podle lemmatu 2.2.13 také relace {[z, x, y]; ∃v≤z (v ·x = y)}
je primitivně rekurzívní. Protože proměnné z a y můžeme ztotožnit, je primitivně
rekurzívní i relace {[x, y]; ∃v≤y(v·x = y)}. Kdybychom to měli zdůvodnit stručně,
řekneme, že podmínka x | y („x dělí y ) je primitivně rekurzívní, protože rovnost
je primitivně rekurzívní relace, násobení je primitivně rekurzívní funkce a omezená
kvantiﬁkace je primitivně rekurzívní operace.
Příklad 2.2.15 Nechť Prime(x) je zkratka pro „x je prvočíslo , tj. Prime je množina
všech prvočísel. Platí
Prime(x) ⇔ 1 < x & ∀v<x(v | x ⇒ v = 1).
Protože <, | a = jsou primitivně rekurzívní relace, omezená kvantiﬁkace a konjunkce
jsou primitivně rekurzívní operace a implikaci lze přepsat pomocí negace a
disjunkce, které jsou primitivně rekurzívními operacemi, množina všech prvočísel
je primitivně rekurzívní.
Na tomto místě se hodí poznamenat, že (konstantní) jména objektů, například
Prime, z, Dom nebo At, většinou zapisujeme užitím běžného písma (tj. nikoliv
například kurzívy). Chceme-li ale zdůraznit, že jde o jméno úlohy, užíváme tzv.
90 2 Algoritmy a úlohy
kapitálky, neboli malá velká písmena, například Sat nebo Prvočíselnost. Prime
a Prvočíselnost jsou dvě různá označení pro tutéž množinu, totiž pro množinu
všech prvočísel. Fakt, že tato množina je (primitivně) rekurzívní, znamená, že úloha
Prvočíselnost je rozhodnutelná, prohlásíme-li formalismus částečně rekurzívních
funkcí za základní výpočtový model, tj. deﬁnujeme-li pojem algoritmu pomocí částečně
rekurzívních funkcí.
Lemma 2.2.16 Nechť A ⊆ Nk
, nechť g1 a g2 jsou funkce k proměnných a nechť
f je deﬁnována předpisem
f(x) =
g1(x) když A(x)
g2(x) jinak.
Jsou-li g1, g2 a A rekurzívní, pak i f je rekurzívní. Jsou-li primitivně rekurzívní,
pak i f je primitivně rekurzívní.
Důkaz Platí f(x) = g1(x) · cA(x) + g2(x) · (1 ·− cA(x)). QED
Jsou-li f, g1, g2 a A jako v lemmatu 2.2.16, říkáme, že funkce f je (z funkcí
g1 a g2) odvozena větvením (podle podmínky A).
Lemma 2.2.17 Nechť g je funkce k + 1 proměnných a nechť f je deﬁnována
předpisem
f(z, x) =
µy(g(x, y) = 0) když ∃y<z (g(x, y) = 0)
z jinak.
Je-li g rekurzívní, pak i f je rekurzívní. Je-li g primitivně rekurzívní, pak i f je
primitivně rekurzívní.
Důkaz Platí
f(0, x) = 0,
f(z + 1, x) =
f(z, x) když ∃y≤z (g(x, y) = 0)
z + 1 jinak.
Funkce f je tedy odvozena primitivní rekurzí z funkce h, kde
h(v, z, x) =
v když ∃y≤z (g(x, y) = 0)
z + 1 jinak.
Vzhledem k lemmatům 2.2.13 a 2.2.16 je funkce h rekurzívní, je-li g ∈ FOR, a je
primitivně rekurzívní, je-li g ∈ FPR. QED
Jsou-li f a g jako v tvrzení lemmatu 2.2.17, říkáme, že f je z g odvozena
omezenou minimalizací a píšeme f(z, x) = µy < z(g(x, y) = 0). Omezená minimalizace
je primitivně rekurzívní operací. Ve zřejmém smyslu budeme psát také
µy ≤ z(g(x, y) = 0). Protože µy ≤ z(g(x, y) = 0) = µy < (z + 1)(g(x, y) = 0), je i
tato varianta omezené minimalizace primitivně rekurzívní operací.
2.2 Základní pojmy z teorie rekurzívních funkcí 91
Příklad 2.2.18 Platí (x) = µy < x((x + 1) ·− 2y
= 0). Celočíselný logaritmus je
tedy primitivně rekurzívní funkcí.
Příklad 2.2.19 Nechť y je libovolné přirozené číslo. Číslo y! je dělitelné všemi čísly
od dvojky do y. Číslo y! + 1 tedy není dělitelné žádným z čísel 2 až y. Rozložíme-li
číslo y! + 1 na prvočísla, dostaneme součin prvočísel, z nichž každé je větší než y a
jejichž počet je alespoň 1. Tím jsme si připomněli (klasický Eukleidův) důkaz, že
pro každé y existuje prvočíslo v takové, že y < v ≤ y! + 1, a že tedy množina všech
prvočísel je nekonečná. Na základě vědomosti, že za každým prvočíslem y existují
další prvočísla v taková, že v ≤ y! + 1, lze odvodit rostoucí posloupnost p všech
prvočísel:
p(0) = 2, p(x + 1) = µv ≤ (p(x)! + 1)(Prime(v) & p(x) < v).
Hodnoty funkce p v bodech 0, 1, 2, 3, 4, . . . jsou 2, 3, 5, 7, 11 atd. Podmínka
Prime(v) & y < v je primitivně rekurzívní, a lze ji tedy převést na podmínku
tvaru g(y, v) = 0. Funkce p je tedy odvozena primitivní rekurzí z funkce, která je
odvozena dosazením primitivně rekurzívní funkce y → y! + 1 do funkce, která je
z g odvozena omezenou minimalizací. Rostoucí posloupnost všech prvočísel je tedy
primitivně rekurzívní funkcí. V dalším výkladu pišme px místo p(x), tj. argument
funkce p pišme jako dolní index.
Kdybychom chtěli na základě dosavadních znalostí zdůvodnit, že Fibonacciho
funkce zmíněná na začátku tohoto oddílu je primitivně rekurzívní, narazili bychom
na tuto potíž: je-li x > 1, podmínky (2) převádějí otázku po hodnotě v bodě x
na dvě otázky, totiž na otázky po hodnotách v bodech x − 1 a x − 2. Přitom je
myslitelná ještě složitější situace, kdy hodnota (nějaké jiné) funkce f v bodě x je
nějakým předpisem převáděna na blíže neurčený (tj. měnící se s x) počet dalších
otázek po hodnotách v bodech menších než x. Představme si například, že chceme
zdůvodnit, že ke každé rekurzívní funkci g jedné proměnné s nekonečným oborem
hodnot existuje prostá rekurzívní funkce f s týmž oborem hodnot. V tom případě
je přirozené odvodit funkci f z funkce g předpisem
f(x) = g(µy(g(y) /∈ {f(0), . . , f(x − 1)})); (9)
lze ověřit, že takto deﬁnovaná funkce f je opravdu prostá a má stejný obor hodnot
jako funkce g. Předpis (9) umožňuje určit hodnotu f(x), známe-li všechny předchozí
hodnoty f(0), . . , f(x − 1). Program, který počítá funkci f s užitím podprogramu
pro výpočet funkce g, potřebuje datovou strukturu, která při zpracování vstupu x
obsahuje x číselných hodnot f(0) až f(x − 1). Velikost této datové struktury nelze
určit v době psaní programu; jedná se tedy o dynamickou datovou strukturu. Nyní se
budeme zabývat kódováním konečných posloupností (přirozených čísel přirozeným
číslem), které nám mimo jiné pomůže zdůvodnit, že funkce f odvozená z funkce g
na základě podmínky (9) je rekurzívní, je-li g rekurzívní. Chceme-li se na formalismus
rekurzívních funkcí dívat jako na svého druhu programovací jazyk, kódování
konečných posloupností v tomto jazyce reprezentuje dynamické datové struktury.
92 2 Algoritmy a úlohy
Z více druhů kódování konečných posloupností vyskytujících se v literatuře si
volíme následující. Kód posloupnosti x0, . . , xn−1 značíme x0, . . , xn−1 a deﬁnujeme
jako číslo w = 2x0+1
· 3x1+1
· . . · p
xn−1+1
n−1 . Platí tedy například
2, 1, 3 = 23
· 32
· 54
= 45000.
Fakt, že w je kódem posloupnosti, značíme Seq(w). Platí Seq(45000) a dále například
Seq(6), Seq(1), ¬Seq(10) a ¬Seq(0). Obecně platí
Seq(w) ⇔ w = 0 & ∀x≤w∀y≤w(Prime(x)
& Prime(y) & y | w & x ≤ y ⇒ x | w),
vlastnost „býti kódem posloupnosti je tedy primitivně rekurzívní. Místo „w je
kódem posloupnosti říkáme také „w je posloupnost .
Počet členů posloupnosti w neboli délku posloupnosti w značíme Lh(w). Protože
chceme tvrdit, že funkce Lh je primitivně rekurzívní, a protože primitivně rekurzívní
funkce musí být totální, musí funkce Lh přisuzovat nějakou (jinak nedůležitou)
hodnotu i těm w, pro která platí ¬Seq(w). Předpis
Lh(w) = µy < w(¬(py | w))
evidentně deﬁnuje primitivně rekurzívní funkci a lze ověřit, že tato funkce má správnou
hodnotu ve všech bodech w splňujících Seq(w). Například čísla 0, 1 a 9 mají
shodně délku 0, čísla 6 a 42 mají délku 2.
Člen s indexem x posloupnosti w značíme (w)x. Lze psát
(w)x = µy < w(¬(py+1
x | w)) ·− 1.
Opět platí, že funkce [w, x] → (w)x je primitivně rekurzívní a že přisuzuje správnou
hodnotu všem dvojicím [w, x] splňujícím podmínky Seq(w) a x < Lh(w). Funkci
[w, x] → (w)x můžeme říkat dekódovací funkce. V dalších úvahách nesmíme zapomenout,
že členy posloupností indexujeme od nuly a že posloupnost w má členy
s indexy 0 až Lh(w) ·− 1.
Platí-li w1 = x0, . . , xn−1 a w2 = y0, . . , ym−1 , pak zápis w1 ∗ w2 značí číslo
x0, . . , xn−1, y0, . . , ym−1 , tj. kód posloupnosti vzniklé konkatenací (spojením) posloupností
x0, . . , xn−1 a y0, . . , ym−1. Platí
w1 ∗ w2 = w1 ·
v<Lh(w2)
p
(w2)v+1
Lh(w1)+v.
Protože funkci [x, y] → v<x g(v, y) lze z libovolné funkce g snadno odvodit primitivní
rekurzí, je funkce [w1, w2] → w1 ∗ w2 odvozena ze samých primitivně rekurzívních
funkcí, a je tedy primitivně rekurzívní.
Nechť h je totální funkce k + 1 proměnných. Deﬁnujme funkci ˜h předpisem
˜h(x, y) = h(0, y), . . , h(x − 1, y) .
Číslo ˜h(x, y) je údaj o hodnotách funkce h ve všech bodech [v, y] pro v < x, a
můžeme na ně nahlížet jako na onu výše zmíněnou dynamickou datovou strukturu.
2.2 Základní pojmy z teorie rekurzívních funkcí 93
Lemma 2.2.20 Nechť h je totální funkce k + 1 proměnných. Pak existuje jediná
funkce f, která je funkcí k + 1 proměnných a která pro každé x a y1, . . , yk splňuje
podmínku
f(x, y) = h( ˜f(x, y), y). (10)
Navíc je-li h rekurzívní, pak i f je rekurzívní, a je-li primitivně rekurzívní, pak i
f je primitivně rekurzívní.
Důkaz Snadno lze dokázat indukcí podle z, že pro danou k-tici y1, . . , yk a pro
každé z existuje právě jedna funkce ψ splňující Dom(ψ) = {0, . . , z − 1} a splňující
dále ψ(x, y) = h( ˜ψ(x, y), y) pro všechna x < z. Z toho plyne existence právě jedné
funkce f splňující podmínku (10); funkce f (jako množina (k+2)-tic) je sjednocením
všech takových funkcí ψ. Funkci ˜f lze odvodit z funkce h a z primitivně rekurzívní
funkce [w, v] → w ∗ v obyčejnou primitivní rekurzí:
˜f(0, y) = = 1, ˜f(x + 1, y) = ˜f(x, y) ∗ h( ˜f(x, y), y) .
Funkci f lze dále odvodit z funkce ˜f a z primitivně rekurzívní funkce [w, v] → (w)v:
f(x, y) = ( ˜f(x + 1, y))x.
Funkce f je tedy opravdu rekurzívní nebo primitivně rekurzívní, je-li h rekurzívní
resp. primitivně rekurzívní. QED
Variantě primitivní rekurze popsané v lemmatu 2.2.20 se v anglické literatuře
říká course of values recursion. Protože podmínka (10) se podobá variantě rekurze
užívané v teorii množin, říkejme jí ordinální rekurze.
Příklad 2.2.21 Deﬁnujme funkci h předpisem
h(w) =
(w)Lh(w) ·−1 + (w)Lh(w) ·−2 když Lh(w) ≥ 2
1 jinak.
Funkce h tedy považuje svůj vstup w za posloupnost a pracuje tak, že sečte dva
poslední členy posloupnosti w, pokud w má alespoň dva členy, a vydá výsledek 1,
je-li w kratší. Pro funkci f odvozenou z funkce h pomocí ordinální rekurze platí
f(0) = h( ˜f(0)) = h( ) = 1,
f(1) = h( ˜f(1)) = h( f(0) ) = 1,
f(x + 1) = h( ˜f(x + 2)) = h( f(0), . . , f(x + 1) ) = f(x + 1) + f(x).
Tím je zdůvodněno, že Fibonacciho funkce je primitivně rekurzívní.
Máme-li kódování konečných posloupností, můžeme zavést také kódování syntaktických
objektů pomocí přirozených čísel a o libovolné množině syntaktických
objektů pak uvažovat, zda množina všech číselných kódů oněch objektů je například
primitivně rekurzívní. Ukažme si to podrobněji na množině všech výrokových
94 2 Algoritmy a úlohy
formulí. V oddílu 2.1 jsme se domluvili, že indexy u výrokových atomů se zapisují
binárně a že každá výroková formule je slovem v abecedě Σ = {→, ¬, &, ∨, (, ), 0, 1, a}.
Máme kódovou tabulku, která znakům přiřazuje číselné kódy. Řekněme, že prvkům
abecedy Σ jsou číselné kódy přiřazeny takto:
→ ¬ & ∨ ( ) 0 1 a
0 1 2 3 12 13 32 33 70.
Každé slovo v abecedě Σ tedy můžeme pokládat za konečnou posloupnost sestavenou
z čísel 0, 1, 2, 3, 12, 13, 32, 33 a 70. A díky kódování konečných posloupností
pak každé takové slovo můžeme pokládat za jediné přirozené číslo. Můžeme si myslet,
že slova v abecedě Σ jsou přirozená čísla, tj. že nerozlišujeme mezi slovem a
jeho číselným kódem. Nechť zápis Atom(w) znamená, že w je výrokový atom, tj.
že w je číselný kód zápisu výrokového atomu. Platí
Atom(w) ⇔ Seq(w) & Lh(w) ≥ 2 & (Lh(w) = 2 ⇒ (w)1 = 32) &
& (w)0 = 70 & ∀x<Lh(w)(x = 0 ⇒ 32 ≤ (w)x ≤ 33).
Posloupnost w je výrokovým atomem, jestliže má délku alespoň 2, začíná znakem a
a pokračuje binárním zápisem přirozeného čísla, tj. posloupností nul a jedniček,
která může začínat nulou pouze v případě, kdy nula je jejím jediným členem. Je
zřejmé, že podmínka Atom je primitivně rekurzívní.
Nechť dále VForm(w) je zkratka pro „w je výroková formule . Platí
VForm(w) ⇔ Atom(w) ∨
∨ ∃w1 <w∃w2 <w(VForm(w1) & VForm(w2) &
& w = 12 ∗ w1 ∗ 0 ∗ w2 ∗ 13 )
∨ ( . . . podobně pro spojky ¬, & a ∨ . . . ).
(11)
Slovo w je tedy výrokovou formulí, je-li je výrokovým atomem, nebo je-li je utvořeno
ze dvou jednodušších formulí pomocí závorek a některé binární logické spojky,
nebo je-li je utvořeno z jedné jednodušší formule pomocí negace. Jinak řečeno,
charakteristická funkce množiny všech výrokových formulí má v bodě w hodnotu 1,
právě když tato funkce má hodnotu 1 v jistých bodech, které jsou menší než w, jejichž
počet je nejvýše dva a které vůči w splňují další podmínku. Ekvivalence (11)
je tedy odvozením charakteristické funkce množiny všech výrokových formulí pomocí
ordinální rekurze. Množina všech (číselných kódů všech) výrokových formulí
je primitivně rekurzívní.
Podobně lze zdůvodnit, že také funkce [A, v] → v(A), přiřazující dané výrokové
formuli A její pravdivostní hodnotu při daném pravdivostním ohodnocení v, je
primitivně rekurzívní. Lze také říci, že úloha Pravdivostní hodnota výrokové
formule je primitivně rekurzívní.
Připomeňme si, že v minulém oddílu jsme přijali úmluvu, že pravdivostní ohodnocení
přiřazující atomům ai1 , . . , air hodnoty k1, . . , kr zapisujeme jako posloupnost
2.2 Základní pojmy z teorie rekurzívních funkcí 95
Z: mov #0,@1(SP)
ret
S: add #1,@1(SP)
ret
I52: mov @2(SP),@5(SP) ; a, x1, x2, x3, x4, x2
mov @(SP)+,@3(SP) ; x1, x2, x3, a, x2
add #3,SP ; a, x2
ret
F: mov @(SP),-@(SP) ; a, a, x
mov #0,@1(SP) ; a, 0, x
loop ; a, y, x
mov @1(SP),-@(SP) ; y, a, y, x
mov @3(SP),-@(SP) ; x, y, a, y, x
call G ; g(x,y), a, y, x
if @(SP)+ eq #0 then exit
add #1,@1(SP) ; a, y+1, x
endloop
mov @1(SP),@2(SP) ; a, y, y
mov @(SP)+,@(SP) ; a, y
ret
Obrázek 2.2.1: Počítání rekurzívních funkcí na počítači RASP
zápisů čísel i1, k1, . . , ir, kr oddělených středníky a že atomy, kterým není hodnota
explicitně přiřazena, mají pravdivostní hodnotu 0. Za těchto okolností lze snadno
zdůvodnit (indukcí podle složitosti výrokové formule A), že je-li formule A splnitelná,
pak existuje ohodnocení v, které ji splňuje a pro jehož délku (tj. pro počet
znaků |v| jeho zápisu) navíc platí |v| ≤ |A| + 2. K zapisování pravdivostních ohodnocení
potřebujeme znaky 0, 1 a ;, jimž jsou v kódové tabulce přiřazeny kódy
32, 33 a 17. Posloupnost, která má délku Lh(A) + 2 a jejíž všechny členy jsou
nejvýše 33, má při našem kódování posloupností číselný kód nejvýše p
34(Lh(A)+2)
Lh(A)+1 .
Formule (číslo) A je tedy splnitelnou výrokovou formulí, platí-li
VForm(A) & ∃v≤p
34(Lh(A)+2)
Lh(A)+1 (v(A) = 1).
Protože funkce w → p
34(Lh(w)+2)
Lh(w)+1 je primitivně rekurzívní, množina všech splnitelných
výrokových formulí, čili množina Sat, je primitivně rekurzívní.
Analogickými úvahami lze zdůvodnit, že také množiny Taut a QBF jsou primitivně
rekurzívní.
Věta 2.2.22 Ke každé částečně rekurzívní funkci existuje program v jazyce RASP,
který ji počítá.
Důkaz Ke každé částečně rekurzívní funkci ϕ, která je funkcí k proměnných, existuje
podprogram, který ji počítá v tom smyslu, že je-li zavolán s parametry x1, . . , xk
v zásobníku, dopočítá se, právě když !ϕ(x), a pokud to nastane, odstraní ze zásob-
96 2 Algoritmy a úlohy
F: mov @2(SP),-@(SP) ; y, a, x, y
if @2(SP) eq #0 then ; y, a, 0, y
call G ; f(0,y), a, 0, y
else
sub #1,@2(SP) ; y, a, x-1, y
mov @2(SP),-@(SP) ; x-1, y, a, x-1, y
call F ; f(x-1,y), a, x-1, y
mov @2(SP),-@(SP) ; x-1, f(x-1,y), a, ...
mov @1(SP),-@(SP) ; f(x-1,y), x-1, ...
mov @5(SP),@2(SP) ; f(x-1,y), x-1, y, ...
call H ; f(x,y), a, x-1, y
endif
mov @(SP)+,@2(SP) ; a, ?, f(x,y)
mov @(SP)+,@(SP) ; a, f(x,y)
ret
Obrázek 2.2.2: Počítání funkce odvozené primitivní rekurzí
níku položky x1, . . , xk a místo nich tam uloží jednu položku ϕ(x). Toto tvrzení
se snadno dokáže indukcí podle počtu kroků, kterými je funkce ϕ odvozena ze základních
funkcí. Podprogramy, které v tomto smyslu počítají některé ze základních
funkcí, jsou na obrázku 2.2.1 nahoře. Podprogram I52 počítá funkci i5
2.
V komentáři za středníkem je u každé instrukce uvedeno, co je v zásobníku po
provedení oné instrukce, písmeno a označuje návratovou adresu. S parametry v zásobníku
se zachází stejně jako v podprogramech z obrázků 2.1.3 a 2.1.6. Je zřejmé,
jak by vypadal podprogram pro výpočet kterékoliv jiné funkce ik
j .
Na obrázku 2.2.1 dole je uveden podprogram F pro výpočet funkce ϕ jedné proměnné,
která je odvozena z funkce ψ dvou proměnných operací minimalizace, a
to za předpokladu, že podprogram G počítá funkci ψ. A na obrázku 2.2.2 je podprogram
opět pojmenovaný F, který počítá funkci ϕ dvou proměnných odvozenou
z funkcí ψ a χ operací primitivní rekurze, a to za předpokladu, že podprogramy
G a H počítají funkce ψ a χ. Ponecháváme na čtenáři, aby uvážil, zda by podprogram
z obrázku 2.2.2 nešlo napsat jednodušeji (s využitím cyklu). Také úvahy, jak
je třeba naše podprogramy modiﬁkovat pro funkce většího počtu proměnných, a
úvahy týkající se operace substituce ponecháváme za cvičení.
Máme-li podprogram F počítající danou funkci ϕ, snadno napíšeme kompletní program
P, který počítá tutéž funkci ϕ: před a za volání podprogramu F je třeba vložit
vstupní a výstupní konverze, které přečtou vstup ze vstupní pásky, a potom naopak
zapíší výsledek na výstupní pásku. QED
Čtyři z pěti podprogramů z obrázků 2.2.1 a 2.2.2 jsou na obrázku 2.2.3 zapsány
v témže smyšleném vyšším programovacím jazyce, který je použit také v zápisech
programů na obrázcích 2.1.9 a 5.1.3.
2.2 Základní pojmy z teorie rekurzívních funkcí 97
function Z(x) function I(x1, x2, x3, x4, x5)
return 0 return x2
endfunction endfunction
; ;
function S(x) function F(x, y)
return x + 1 if x eq #0 then return G(y)
endfunction return H(F(x − 1, y), x − 1, y)
endfunction
Obrázek 2.2.3: Zápis programů ve vyšším programovacím jazyce
Věta 2.2.23 Každá funkce, kterou počítá libovolný program v jazyce RASP, je
částečně rekurzívní.
Náznak důkazu Nechť P je daný program, který počítá funkci ψ, která je funkcí
k proměnných. V oddílu 2.1 jsme deﬁnovali konﬁguraci jako jisté slovo v abecedě
{-, ,, 0, 1}, které lze interpretovat jako informaci o okamžitém stavu počítače
RASP. Dále jsme deﬁnovali výpočet programu P ze vstupu w jako jistou
posloupnost konﬁgurací. Domluvíme-li se, že konﬁgurace oddělujeme od sebe znakem
středník, pak každý výpočet je slovem v abecedě {-, ,, 0, 1, ;}. Díky kódování
konečných posloupností je každý výpočet zároveň přirozeným číslem. Nechť
R(x, w) označuje podmínku „w je výpočet programu P ze vstupu [x1, . . , xk] a
nechť f je funkce, která z výpočtu w určí jeho výsledek, tj. to číslo, jehož zápis
je po skončení výpočtu w na výstupní pásce. Lze zdůvodnit (v případě funkce f
podobně, jako jsme to udělali s množinou všech výrokových formulí; v případě relace
R jednodušeji, neboť relace R není deﬁnována pomocí rekurze), že funkce f
i relace R jsou primitivně rekurzívní. Máme-li čísla x1, . . , xk, trpělivým probíráním
všech přirozených čísel lze najít číslo w, které je kódem výpočtu programu P
ze vstupu [x1, . . , xk], pokud ovšem takový výpočet existuje. To znamená, že
funkce [x1, . . , xk] → µwR(x, w) se dopočítá, právě když !ψ(x), a pokud to nastane,
jejím výsledkem je výpočet programu P ze vstupu [x1, . . , xk]. Pro funkci ψ
pak platí ψ(x) f(µwR(x, w)); funkce ψ je odvoditelná užitím minimalizace a
pak substituce z funkcí cR a f, které jsou primitivně rekurzívní, a je tedy částečně
rekurzívní. QED
Částečně rekurzívní funkce jsou tedy přesně ty funkce, které jsou počitatelné na
počítači RASP. Oba naše výpočtové modely jsou tedy v tomto smyslu ekvivalentní.
V literatuře se vyskytují ještě další výpočtové modely (Turingovy stroje, vývojové
diagramy, . . . ); o všech dosavadních výpočtových modelech ale bylo dokázáno, že
jsou navzájem ekvivalentní. Nikomu se nepodařilo navrhnout žádný obecnější (silnější)
model a nikomu se také nepodařilo podat neformální algoritmus, který by se
nedal přepsat do formalismu (kteréhokoliv) výpočtového modelu. Tvrzení, že nic
takového se nepodaří ani v budoucnu, neboť všechny rozumné výpočtové modely
správně vystihují pojem algoritmu, který je pojmem absolutním a na zvoleném formalismu
nezávislým, je známé jako Churchova teze. Zájemce o podrobnější úvahy
98 2 Algoritmy a úlohy
o Churchově tezi, o jejích interpretacích a o jejích ﬁlozoﬁckých a přírodovědných
souvislostech odkazujeme na oddíl I.8 knihy [61].
Z vět 2.2.22 a 2.2.23 plyne, že množina A ⊆ Nk
je rekurzívní, právě když existuje
program pro počítač RASP, který ji rozhoduje, a je rekurzívně spočetná, právě když
existuje program pro počítač RASP, který ji přijímá.
Věta 2.2.24 (o normální formě) Existuje primitivně rekurzívní funkce U a pro
každé k ≥ 1 existuje (k + 2)-ární primitivně rekurzívní relace Tk taková, že pro
každou částečně rekurzívní funkci ψ, která je funkcí k proměnných, existuje číslo e
takové, že
∀x1 . . ∀xk(ψ(x) U(µwTk(e, x, w))).
Náznak důkazu V důkazu věty 2.2.23 se pracovalo s tvrzením, že relace
{ [x, w] ; w je výpočet programu P ze vstupu [x1, . . , xk] }
je primitivně rekurzívní. Toto tvrzení znamená, že na základě znalosti programu P
můžeme napsat několik podprogramů, mezi nimi například takový, který rozhoduje,
zda konﬁgurace D je konﬁgurace odvozená z konﬁgurace C, a z těchto podprogramů
pak sestavit program R, který rozhoduje, zda w je výpočet ze vstupu [x1, . . , xk].
Nyní, tj. pro důkaz věty o normální formě, je důležité toto pozorování: není nutné,
aby program P byl znám předem, čili v době psaní programu R; stačí, bude-li znám
až za běhu, tj. bude-li sdělen spolu s parametry [x1, . . , xk] a w. Přesněji řečeno,
kromě kódování konﬁgurací a výpočtů lze zavést také kódování programů tak, aby
vlastnost „e je kód programu byla primitivně rekurzívní. Za relaci Tk pak lze vzít
podmínku „e je kód programu a w je výpočet téhož programu ze vstupu [x1, . . , xk]
a zdůvodnit, že tato relace je primitivně rekurzívní. Za funkci U lze vzít tutéž
funkci, která byla v důkazu věty 2.2.23 označena f. QED
Poznamenejme ještě pro úplnost, že není-li číslo e kódem programu, pak pro
žádné w neplatí Tk(e, x, w), a funkce [x1, . . , xk] → U(µwTk(e, x, w)) má prázdný
deﬁniční obor.
Libovolnou funkci ψ, která je částečně rekurzívní funkcí k proměnných, lze tedy
získat dosazením vhodné konstanty e do jisté částečně rekurzívní funkce k + 1 proměnných,
totiž do funkce [e, x] → U(µwTk(e, x, w)). Funkci k + 1 proměnných,
ze které lze získat všechny funkce z jisté množiny F (které všechny mají týž počet
k proměnných) dosazením konstanty za první proměnnou, se říká univerzální
funkce pro množinu F. Věta 2.2.24 tedy tvrdí, že pro každé k má množina všech
částečně rekurzívních funkcí k proměnných univerzální funkci, která přitom sama
je částečně rekurzívní. Z věty 2.2.24 navíc plyne, že mezi více odvozeními dané
částečně rekurzívní funkce lze nalézt takové, v němž je operace minimalizace užita
právě jednou.
V knize [61] lze nalézt podrobnější důkaz věty o normální formě, který se neodvolává
na kódování programů, nýbrž vystačí s úvahami o částečně rekurzívních
funkcích. I tam deﬁnovanou relaci Tk(e, x, w) lze ale číst „w je výpočet programu e
2.2 Základní pojmy z teorie rekurzívních funkcí 99
ze vstupu [x1, . . , xk] . Přitom za „program počítající funkci ψ se považuje (číselný
kód) odvození funkce ψ a „výpočet funkce ψ ze vstupu [x1, . . , xk] je zhruba
to, co by zůstalo na papíře, kdybychom na základě odvození funkce ψ počítali
hodnotu ψ(x) funkce ψ v bodě [x1, . . , xk] s tužkou v ruce.
Existuje tedy více způsobů, jak deﬁnovat relace Tk a funkci U, a tedy také
více způsobů, jak dokázat větu 2.2.24. Nadále budeme využívat pouze vlastnosti
relací Tk a funkce U dané zněním věty 2.2.24, nebudeme se spoléhat na vlastnosti,
jejichž platnost lze vyvodit z jejího důkazu (z důkazu věty 2.2.24 lze například
usoudit, že pro každou k-tici [x1, . . , xk] a číslo e existuje nejvýše jedno w splňující
Tk(e, x, w)). Větu 2.2.24 a větu 2.2.40 uvedenou dále lze pokládat za jakési
základní kameny teorie rekurzívních funkcí. Relaci Tk(e, x, w) se říká Turingův
predikát (pro částečně rekurzívní funkce k proměnných). Místo T1(e, x, w) píšeme
jen T(e, x, w).
Pro každé e a každé k ≥ 1 deﬁnujme částečně rekurzívní funkci ϕ(k)
e předpisem
ϕ(k)
e (x1, . . , xk) U(µwTk(e, x, w)).
Věta 2.2.24 tvrdí, že v posloupnosti ϕ(k)
0 , ϕ(k)
1 , . . . se vyskytuje každá částečně
rekurzívní funkce k proměnných a navíc že funkce [e, x] → ϕ(k)
e (x) je částečně
rekurzívní funkcí k +1 proměnných. Posloupnosti ϕ(k)
0 , ϕ(k)
1 , . . . říkejme enumerace
částečně rekurzívních funkcí k proměnných. Místo ϕ(1)
e pišme jen ϕe. Někteří autoři
píší {e}k
a {e} místo ϕ(k)
e resp. ϕe. Dále deﬁnujme množiny W(k)
e :
W(k)
e = Dom(ϕ(k)
e ).
Platí
!ϕ(k)
e (x) ⇔ !µwTk(e, x, w) ⇔ ∃wTk(e, x, w),
a tedy také
W(k)
e = { [x1, . . , xk] ; ∃wTk(e, x, w) }.
Posloupnosti W(k)
0 , W(k)
1 , . . . říkejme enumerace rekurzívně spočetných k-árních
relací. Je zřejmé, že v této posloupnosti se vyskytuje každá k-ární rekurzívně
spočetná relace a že (k+1)-ární relace {[e, x]; [x1, . . , xk] ∈ W(k)
e } je také rekurzívně
spočetná. Opět pišme jen We místo W(1)
e . Číslu e v zápisu ϕ(k)
e a W(k)
e se říká
index funkce ϕ(k)
e resp. index množiny W(k)
e . Místo index se také říká Kleeneho
číslo funkce ϕ(k)
e nebo množiny W(k)
e .
Věta 2.2.25 (o projekci) Množina A ⊆ Nk
je rekurzívně spočetná, právě když
existuje rekurzívní relace R ⊆ Nk+1
taková, že A = { [x1, . . , xk] ; ∃yR(x, y) }.
Důkaz Je-li A rekurzívně spočetná, pak A má nějaký index, tj. platí A = W(k)
e
pro jisté e. Víme, že W(k)
e = { [x1, . . , xk] ; ∃wTk(e, x, w) }. Můžeme tedy položit
R = { [x1, . . , xk, y] ; Tk(e, x, y) }. Takto deﬁnovaná relace R je dokonce primitivně
rekurzívní. Na druhou stranu, platí-li A = { [x1, . . , xk] ; ∃yR(x, y) }, kde R
je rekurzívní relace, pak pro částečně rekurzívní funkci ψ deﬁnovanou předpisem
ψ(x) µyR(x, y) platí Dom(ψ) = A, a tedy A je rekurzívně spočetná množina.
QED
100 2 Algoritmy a úlohy
Operaci, kterou byla množina A ve větě 2.2.25 odvozena z relace R, se říká projekce
(množiny R). Projekce jako operace na relacích je totéž, co existenční kvantiﬁkátor
jako operace na podmínkách. Věta 2.2.25 tvrdí, že rekurzívně spočetné
podmínky (relace) jsou právě ty, které lze získat z rekurzívních pomocí projekce
(jedné existenční kvantiﬁkace).
Deﬁnujme množiny K a K0:
K = { x ; x ∈ Wx }, K0 = { x, v ; v ∈ Wx }.
Připomeňme, že lomené závorky značí kód (v tomto případě dvouprvkové) posloupnosti.
Množina K0 je tedy (stejně jako množina K) množinou čísel, nikoliv
množinou dvojic.
Věta 2.2.26 Množiny K a K0 jsou rekurzívně spočetné nerekurzívní množiny.
Důkaz Protože Wx = { v ; ∃wT(x, v, w) }, platí rovnosti K = { x ; ∃wT(x, x, w) }
a K0 = { x, v ; ∃wT(x, v, w) }. Z věty 2.2.25 plyne, že obě množiny jsou rekurzívně
spočetné. Kdyby K byla rekurzívní, dle 2.2.12(a) by byl rekurzívní i její
komplement K. Zdůvodníme sporem, že množina K není ani rekurzívně spočetná.
Nechť tedy K je rekurzívně spočetná. Pak K = We pro jisté e. Uvažujme, zda e je
nebo není ve We. Když e ∈ We, pak e ∈ K, což je ve sporu s rovností K = We.
Když e /∈ We, pak e /∈ K, což je také spor s rovností K = We. Zbývá zdůvodnit, že
K0 není rekurzívní. Platí
x ∈ K ⇔ x, x ∈ K0.
Funkci x → x, x na chvíli označme g. Z podmínky x ∈ K ⇔ g(x) ∈ K0 plyne
ekvivalence cK(x) = 1 ⇔ cK0 (g(x)) = 1. Platí tedy cK = cK0 ◦ g. Funkce g je
rekurzívní. Kdyby cK0 byla rekurzívní, i cK by byla rekurzívní. QED
Protože index e funkce ϕe nebo množiny We lze chápat jako kód programu,
který počítá funkci ϕe resp. přijímá množinu We, je fakt, že množina K0 není
rekurzívní, vlastně reformulací tvrzení, že Problém zastavení je algoritmicky nerozhodnutelný,
a fakt, že množina K0 je rekurzívně spočetná, je reformulací tvrzení,
že existuje algoritmus, který Problém zastavení přijímá. Větu 2.2.26 lze tedy
chápat jako rekurzívně teoretickou variantu věty 2.1.3. Dále tvrzení z 2.2.12(a), že
rekurzívní množiny jsou uzavřeny na komplement, se předtím již objevilo v 2.1.2(a),
a inkluze OR ⊆ RS je v 2.1.2(b).
Vidíme tedy, že neplatí rovnost OR = RS. Některé rekurzívně spočetné množiny
nejsou rekurzívní, a některé dokonce mají komplement, který není ani rekurzívně
spočetný. Rekurzívně spočetné množiny nejsou uzavřeny na komplement a rekurzívní
množiny nejsou uzavřeny na projekci.
Věta 2.2.27 (Postova) Nechť A ⊆ Nk
je rekurzívně spočetná množina taková,
že i její komplement A je rekurzívně spočetný. Pak A (a ovšem i A) je rekurzívní.
2.2 Základní pojmy z teorie rekurzívních funkcí 101
Důkaz Máme dva různé algoritmy, z nichž jeden přijímá množinu A a druhý přijímá
množinu A. Potřebujeme jeden algoritmus, který množinu A rozhoduje. Je-li
dána k-tice [x1, . . , xk], můžeme oba algoritmy nechat pracovat současně na tomtéž
vstupu [x1, . . , xk]. To, který z nich se dopočítá, pak určuje, zda [x1, . . , xk] je nebo
není v A. Na této úvaze lze založit přesný důkaz.
Nechť tedy A ∈ RS a A ∈ RS. Dle věty 2.2.25 existují (k+1)-ární obecně rekurzívní
relace P a Q takové, že A = {[x1, . . , xk]; ∃yP(x, y)} a A = {[x1, . . , xk]; ∃yQ(x, y)}.
Protože A ∪ A = N, platí ∀x∃y(P(x, y) ∨ Q(x, y)). Podmínka P ∨ Q je rekurzívní
dle tvrzení 2.2.12(a). Předpis
f(x) = µy(P(x, y) ∨ Q(x, y))
tedy deﬁnuje rekurzívní funkci. Platí-li P(x, f(x)), pak [x1, . . , xk] ∈ A. Neplatí-li
P(x, f(x)), musí platit Q(x, f(x)), a v tom případě [x1, . . , xk] ∈ A. Funkce g
deﬁnovaná předpisem
g(x) =
1 když P(x, f(x))
0 jinak
je tedy charakteristickou funkcí množiny A a je to rekurzívní funkce díky lemmatu
2.2.16. QED
Bylo tedy poněkud zavádějící, když jsme v komentáři za důkazem věty 2.2.26
řekli, že některé rekurzívně spočetné množiny, které nejsou rekurzívní, dokonce
mají komplement, který není ani rekurzívně spočetný. Rekurzívně spočetná množina,
která není rekurzívní, má vždycky tu vlastnost, že její komplement není rekurzívně
spočetný. V následujících kapitolách uvidíme, že Postova věta má zajímavé
důsledky v logice.
Věta 2.2.28 Nechť k ≥ 1 a nechť Q ⊆ Nk+1
je rekurzívně spočetná. Pak existuje
částečně rekurzívní funkce ψ, která je funkcí k proměnných a která pro každou
k-tici x1, . . , xk splňuje podmínky
◦ !ψ(x) ⇔ ∃yQ(x, y),
◦ !ψ(x) ⇒ Q(x, ψ(x)).
Důkaz Dle věty 2.2.25 k relaci Q existuje rekurzívní relace R ⊆ Nk+2
taková, že
∀x∀y(Q(x, y) ⇔ ∃vR(x, y, v)). Odvoďme funkci ψ předpisem
ψ(x) (µw(Seq(w) & Lh(w) = 2 & R(x, (w)0, (w)1)))0.
Takto deﬁnovaná funkce je částečně rekurzívní a snadno lze ověřit, že má požadované
vlastnosti. QED
K předchozímu důkazu poznamenejme, že je-li Q ⊆ Nk+1
rekurzívně spočetná,
předpis ψ(x) µyQ(x, y) nedeﬁnuje částečně rekurzívní funkci (viz cvičení 24).
V našem důkazu bylo podstatné hledat najednou dvojici [y, v] takovou, že R(x, y, v),
tj. hledat současně funkční hodnotu y a „svědka v pro fakt, že Q(x, y). Je-li taková
dvojice reprezentovaná číslem w nalezena, y = (w)0 je hledaná funkční hodnota a
svědek (w)1 je už nedůležitý.
102 2 Algoritmy a úlohy
Věta 2.2.29 Nechť A ⊆ N. Pak následující podmínky jsou ekvivalentní:
(i) A je rekurzívně spočetná.
(ii) A = ∅ nebo A je obor hodnot jisté rekurzívní funkce.
(iii) A je konečná nebo A je obor hodnot jisté prosté rekurzívní funkce.
Důkaz (i) ⇒ (ii) Nechť A je rekurzívně spočetná a neprázdná. Nechť a ∈ A
je její pevně zvolený prvek. Zvolme rekurzívní relaci R takovou, že R ⊆ N2
a
A = { x ; ∃yR(x, y) }. Deﬁnujme funkci f předpisem
f(z) =
(z)0 když R((z)0, (z)1)
a jinak.
Kdykoliv platí R((z)0, (z)1), pak ∃yR((z)0, y) a (z)0 ∈ A. Tedy Rng(f) ⊆ A. Když
naopak x ∈ A, pak existuje y takové, že R(x, y). Pro z = x, y platí f(z) = x.
Tedy A ⊆ Rng(f).
(ii) ⇒ (iii) Nechť A je nekonečná a nechť A = Rng(f), kde f ∈ FOR. V souvislosti
s úvahami o zobecněné (ordinální) rekurzi jsme zdůvodnili, že funkce g deﬁnovaná
z funkce f předpisem
g(x) = f(µy(f(y) /∈ {g(0), . . , g(x − 1)}))
je obecně rekurzívní. Lze zdůvodnit, že g je prostá a platí Rng(g) = Rng(f).
(iii) ⇒ (i) Nechť A = Rng(g), kde g ∈ FOR. Pak A = { y ; ∃x(g(x) = y) }. Protože
podmínka g(x) = y je rekurzívní, je množina A rekurzívně spočetná dle věty 2.2.25.
QED
K této větě poznamenejme, že nelze požadovat, aby prostá rekurzívní funkce g
taková, že Rng(g) = A, byla dokonce rostoucí. Některé rekurzívně spočetné množiny
(cvičení 8 tvrdí, že všechny nerekurzívní) nejsou oborem hodnot žádné rostoucí
rekurzívní funkce.
Řekneme, že množina A ⊆ N je m-převeditelná na množinu B ⊆ N, a píšeme
A ≤m B, existuje-li rekurzívní funkce g taková, že
∀x(x ∈ A ⇔ g(x) ∈ B).
Jinak řečeno, A ≤m B platí právě tehdy, existuje-li g ∈ FOR taková, že cA = cB ◦g.
Písmeno „m pochází od anglického „many-one . V literatuře se totiž studuje
také 1-převeditelnost: množina A je 1-převeditelná na množinu B, jestliže existuje
prostá rekurzívní funkce g splňující podmínku ∀x(x ∈ A ⇔ g(x) ∈ B). Prostá se
anglicky řekne „one-one ; písmeno „m v naší deﬁnici tedy naznačuje, že g nemusí
být prostá. Platí-li cA = cB ◦ g, říkáme také, že A je m-převeditelná na B via g.
Příklad 2.2.30 V důkazu věty 2.2.26 jsme zdůvodnili, že platí K ≤m K0.
Lemma 2.2.31 (a) Relace ≤m je tranzitivní a reﬂexivní relace na množině P(N)
všech podmnožin množiny N.
2.2 Základní pojmy z teorie rekurzívních funkcí 103
(b) Když A ≤m B a B ∈ OR, pak A ∈ OR.
(c) Když A ≤m B a B ∈ RS, pak A ∈ RS.
(d) Když A ≤m B, pak A ≤m B.
(e) Když A ∈ OR a B není ∅ ani N, pak A ≤m B.
(f) Když (A − B) ∪ (B − A) je konečná a B není ∅ ani N, pak A ≤m B.
Důkaz Když A ≤m B via g1 a B ≤m C via g2, pak A ≤m C via g2 ◦ g1. Dále
A ≤m A via x → x.
Nechť A ≤m B via g a B ∈ RS. Dle věty o projekci k B existuje relace R taková, že
B = { x ; ∃yR(x, y) }. Platí A = { x ; ∃yR(g(x), y) }. Protože podmínka R(g(x), y)
je rekurzívní, množina A je rekurzívně spočetná dle věty o projekci užité opačným
směrem. Důkaz tvrzení (b) a (d) ponecháváme za cvičení.
V (e) zvolme čísla c a d taková, že c ∈ B a d /∈ B. Deﬁnujeme-li g(x) = c pro x ∈ A
a g(x) = d jinak, je funkce g rekurzívní dle lemmatu 2.2.16 a platí A ≤m B via g.
V (f) opět zvolme c ∈ B a d /∈ B. Dále označme E = A−B a F = B −A. Množiny
E a F jsou konečné, tedy rekurzívní. Deﬁnujme g(x) = c pro x ∈ E, dále g(x) = d
pro x ∈ F a konečně g(x) = x jinak. Funkce g je rekurzívní, protože ji lze odvodit
(dvojím) užitím lemmatu 2.2.16, a platí A ≤m B via g. QED
Příklad 2.2.32 Protože K /∈ RS a K ∈ RS, z (c) plyne K ≤m K. Z toho a z (d)
plyne K ≤m K. Množiny K a K jsou tedy vůči relaci ≤m nesrovnatelné.
Na m-převeditelnosti je důležité, že pro určité množiny A a B lze někdy dokázat,
že platí A ≤m B, i když o žádné z množin A a B nevíme, je-li rekurzívní
nebo rekurzívně spočetná. Zjistí-li se později například, že A není rekurzívní, podle
tvrzení 2.2.31(a) to znamená, že ani B není rekurzívní. Analogicky lze užít tvrzení
2.2.31(b) k důkazu, že nějaká množina není rekurzívně spočetná. Příklady na
tyto situace ještě uvidíme. Intuitivní význam podmínky A ≤m B je „úloha A je
z algoritmického hlediska jednodušší nebo stejně obtížná jako úloha B . Relaci ≤m
můžeme tedy chápat jako uspořádání množin přirozených čísel podle algoritmické
složitosti.
Řekneme, že množina B je kompletní, jestliže je rekurzívně spočetná a jestliže
navíc platí A ≤m B pro každou rekurzívně spočetnou množinu A.
Příklad 2.2.33 Podmínka ∀x(x ∈ Wa ⇔ a, x ∈ K0) platí pro každou rekurzívně
spočetnou množinu Wa. Protože funkce x → a, x je rekurzívní, znamená to
∀a(Wa ≤m K0). Množina K0 je tedy kompletní.
Je-li množina B kompletní, pak není rekurzívní, a navíc máme plnou informaci
o tom, jaké m-převeditelnosti platí mezi ní a ostatními rekurzívně spočetnými množinami:
na množinu B jsou m-převeditelné všechny rekurzívně spočetné množiny,
naopak B je m-převeditelná právě na ty rekurzívně spočetné množiny, které jsou
kompletní.
104 2 Algoritmy a úlohy
Nechť n ≥ 1. Řekneme, že množina A ⊆ Nk
je Σn-množina, jestliže existuje
rekurzívní relace R ⊆ Nk+n
taková, že
A = { [x1, . . , xk] ; ∃v1∀v2∃ . . vnR(x, v) }.
Podmínka A je tedy Σn-podmínkou, jestliže ji lze získat z rekurzívní podmínky
pomocí n střídajících se kvantiﬁkátorů, z nichž první (zleva) je existenční. Přitom
poslední (neuvedený) kvantiﬁkátor je existenční nebo univerzální podle toho, zda n
je liché nebo sudé. Řekneme, že množina A ⊆ Nk
je Πn-množina, jestliže existuje
rekurzívní relace R ⊆ Nk+n
taková, že
A = { [x1, . . , xk] ; ∀v1∃v2 . . vnR(x, v) }.
Podmínka A je tedy Πn-podmínkou, jestliže ji lze získat z rekurzívní podmínky
pomocí n střídajících se kvantiﬁkátorů, z nichž tentokrát první je univerzální a
poslední je existenční nebo univerzální podle toho, zda n je sudé nebo liché. Označení
Σn a Πn budeme užívat i samostatně: Σn je množina všech Σn-relací, Πn je
množina všech Πn-relací.
Příklad 2.2.34 Platí K = { x ; ∀y¬T(x, x, y) }. Množina K je tedy Π1-množinou.
Lemma 2.2.35 (a) RS = Σ1, OR = Σ1 ∩ Π1.
(b) A ∈ Σn ⇔ A ∈ Πn, a dále A ∈ Πn ⇔ A ∈ Σn.
(c) Sjednocení a průnik k-árních Σn relací nebo k-árních Πn-relací je opět Σn-relace
nebo Πn-relace. Jinými slovy, Σn-podmínky i Πn-podmínky jsou uzavřeny na
konjunkci a disjunkci.
(d) Σn-podmínky i Πn-podmínky jsou uzavřeny na omezenou kvantiﬁkaci.
(e) Σn-podmínky jsou uzavřeny na existenční kvantiﬁkaci, Πn-podmínky jsou uzavřeny
na univerzální kvantiﬁkaci.
(f) Σn ∪ Πn ⊆ Σn+1 ∩ Πn+1.
(g) Když A ≤m B a B ∈ Σn, pak A ∈ Σn. Když A ≤m B a B ∈ Πn, pak A ∈ Πn.
Důkaz Tvrzení RS = Σ1 je věta o projekci. A i A je rekurzívně spočetná, právě
když A je současně Σ1 i Π1. Tvrzení OR = Σ1 ∩ Π1 je tedy vlastně Postova věta.
Má-li podmínka A(x) tvar ∀v1∃ . . vnR(x, v), pak podmínka ¬A(x) je ekvivalentní
s ∃v1∀ . . vn¬R(x, v). Stejně lze zdůvodnit i zbývající tři implikace v (b).
Tvrzení (c), (d) a (e) dokážeme najednou indukcí podle n. Nechť tedy n ≥ 1
je dáno. Předpokládejme, že je-li n ≥ 2, pak Σn−1-podmínky jsou uzavřeny
na konjunkci, disjunkci, omezenou kvantiﬁkaci a existenční kvantiﬁkaci, kdežto
Πn−1-podmínky jsou uzavřeny na konjunkci, disjunkci, omezenou kvantiﬁkaci a
univerzální kvantiﬁkaci. Uvažujme o n. Nechť A je (k + 1)-ární Σn-podmínka
tvaru ∃vP(x, y, v), kde P je rekurzívní v případě, kdy n = 1, a P je Πn−1 jinak.
Podmínka ∃y∃vP(x, y, v), která vznikne z podmínky A existenční kvantiﬁkací, je
ekvivalentní s podmínkou ∃w∃y≤w∃v≤wP(x, y, v). Je-li n = 1, pak podmínka
∃y≤w∃v≤wP(x, y, v) je rekurzívní dle 2.2.13. Je-li n > 1, tato podmínka je Πn−1
2.2 Základní pojmy z teorie rekurzívních funkcí 105
dle indukčního předpokladu pro tvrzení (d). Úvaha pro druhou část tvrzení (e),
uzavřenost Πn-podmínek na univerzální kvantiﬁkaci, je analogická, podmínka P je
v tom případě rekurzívní nebo Σn−1 a existenční kvantiﬁkátory je třeba nahradit
univerzálními. Nechť nyní ∃vP(x, v) a ∃vQ(x, v) jsou dvě Σn-podmínky, přičemž
opět P a Q jsou rekurzívní, je-li n = 1, jinak jsou Πn−1. Jejich konjunkce je
ekvivalentní s ∃v1∃v2(P(x, v1) & P(x, v2)). Přitom podmínka P(x, v1) & P(x, v2)
je rekurzívní dle 2.2.12 resp. je Πn−1 dle indukčního předpokladu pro tvrzení (c),
podmínka ∃v1∃v2(. .) je Σn dle již dokázaného tvrzení (e). Zbývající úvahy v (c)
jsou podobné či zřejmé. Nechť konečně ∃vP(x, y, v) je Σn-podmínka, uvažujme
podmínky ∃y<z ∃vP(x, y, v) a ∀y<z ∃vP(x, y, v). První z nich je ekvivalentní
s ∃v∃y<z P(x, y, v), druhá je ekvivalentní s ∃w∀y<z ∃v<wP(x, y, v). Opět platí,
že obě tyto podmínky jsou Σn vzhledem k tvrzení 2.2.13 či díky indukčnímu předpokladu
pro tvrzení (d). Úvahy pro kvantiﬁkátory ∃y≤z a ∀y≤z a pro Πn-podmínky
jsou opět analogické.
Když A je Σn-podmínka tvaru ∃v1∀ . . vnR(x, v) a v rekurzívní podmínce R se nic
nepraví o y, pak A je ekvivalentní s podmínkou ∀y∃v1∀ . . vnR(x, v), která je Πn+1,
s podmínkou ∃v1∀ . . vn∃yR(x, v), která je Σn+1 pro n sudé, a také s podmínkou
∃v1∀ . . vn∀yR(x, v), která je Σn+1 pro n liché. Zbývající úvahy včetně důkazu
tvrzení (g) ponecháváme za cvičení. QED
Příklad 2.2.36 Pokusme se pro množinu Unb = { x ; Wx je nekonečná } stanovit
její aritmetickou klasiﬁkaci, tj. najít pokud možno minimální n takové, že Unb ∈ Σn
nebo Unb ∈ Πn. Platí
Wx je nekonečná ⇔ ∀v1∃v2(v1 < v2 & v2 ∈ Wx).
Podmínka v1 < v2 je primitivně rekurzívní, tedy rekurzívně spočetná. Podmínka
v závorce je rekurzívně spočetná díky 2.2.35(c). Podmínka ∃v2(. .) je Σ1 vzhledem
k tvrzení 2.2.35 (a) a (e). Platí tedy Unb ∈ Π2.
Příklad 2.2.37 Dále položme Rec = { x ; Wx je rekurzívní } a pokusme se i pro
tuto množinu stanovit její aritmetickou klasiﬁkaci. Platí
Wx je rekurzívní ⇔ ∃y(Wy = Wx)
⇔ ∃y∀v((v ∈ Wy & v /∈ Wx) ∨ (v /∈ Wy & v ∈ Wx)).
Podmínka v ∈ Wy je Σ1, podmínka v /∈ Wx je Π1. Jejich konjunkce je vzhledem
k 2.2.35 (f) a (c) současně Σ2 i Π2. Totéž platí o podmínce v /∈ Wy & v ∈
Wx. Disjunkce těchto dvou podmínek je tedy také současně Σ2 i Π2. Výhodnější
je prohlásit, že je Π2. V tom případě, díky 2.2.35(e), i ∀v(. .) je Π2, a tudíž
množina Rec je Σ3.
Inkluze mezi množinami OR, Σn a Πn pro n ≥ 1 jsou na obrázku 2.2.4 znázorněny
šipkami. Tento diagram je jedním z nejdůležitějších v celé logice. Například
v příručce [4] jej lze nalézt nejméně na třech různých místech.
106 2 Algoritmy a úlohy
Lemma 2.2.38 Když Σn ⊆ Πn nebo Πn ⊆ Σn, pak pro každé m ≥ n platí
Σm = Πm = Σn.
Důkaz Předpokládejme Σn ⊆ Πn. Nechť A ∈ Πn. Pak A ∈ Σn dle (b) lemmatu
2.2.35. Z předpokladu Σn ⊆ Πn plyne A ∈ Πn. Opětovné užití tvrzení
2.2.35(b) dává A ∈ Σn. Tedy Σn = Πn. Nechť A je libovolná Σn+1-podmínka
tvaru ∃vP(x, v), kde P ∈ Πn. Z inkluze Πn ⊆ Σn a z 2.2.35(e) plyne A ∈ Σn.
Toto platí pro každou A ∈ Σn+1, tedy Σn+1 ⊆ Σn = Πn. A tak dále. QED
OR
Σ1 Σ2 Σ3
Π1 Π2
¨¨B
rrj ¨¨¨¨
¨¨B
¨¨¨¨¨¨Brrrrrrj
rr
rrrrj
rrrrrrj
E E
E E E
· · ·
· · ·
Obrázek 2.2.4: Aritmetická hierarchie
Pokud tedy kterákoliv z inkluzí znázorněných na obrázku 2.2.4 je ve skutečnosti
rovností, tj. platí-li pro kterékoliv n některá z podmínek Σn = Σn+1, Πn = Πn+1,
Σn = Πn+1 nebo Πn = Σn+1, pak Σn+1 i Πn+1 je sjednocením všech množin
Σm a Πm. Takové situaci se říká kolaps aritmetické hierarchie. Dále budeme
směřovat k důkazu, že nic takového nenastává, aritmetická hierarchie nekolabuje.
Množina B je Σn-kompletní, platí-li B ∈ Σn a navíc A ≤m B pro každou
množinu A ∈ Σn. Analogicky deﬁnujeme, že množina B je Πn-kompletní, platí-li
B ∈ Πn a navíc A ≤m B pro každou A ∈ Πn. Relace Q ⊆ N2
je Σn-univerzální,
jestliže Q ∈ Σn a jestliže pro každou Σn-množinu A ⊆ N existuje číslo a takové,
že A = {v ; Q(a, v)}. Analogicky deﬁnujeme, že relace Q je Πn-univerzální, jestliže
Q ∈ Πn a pro každou A ∈ Πn existuje a takové, že A = { v ; Q(a, v) }. Deﬁnujme
následující posloupnost relací a dvě posloupnosti množin:
Q1 = { [x, v] ; v ∈ Wx },
Qn+1 = { [x, v] ; ∃y¬Qn(x, v, y ) },
Hn = { x, v ; Qn(x, v) },
Dn = { x ; Qn(x, x) }.
Evidentně platí H1 = K0 a D1 = K. Dále lze snadno ukázat (indukcí), že Qn ∈ Σn.
Platí tedy i Hn ∈ Σn a Dn ∈ Σn.
Věta 2.2.39 (a) Každá Qn je Σn-univerzální, každá Qn je Πn-univerzální.
(b) Hn je Σn-kompletní, Hn je Πn-kompletní.
(c) Dn ∈ Σn − Πn a Dn ∈ Πn − Σn.
Důkaz Platí { v ; Q1(a, v) } = Wa. Každá rekurzívně spočetná množina je tedy
jednou z množin {v ; Q1(a, v)} pro a ∈ N. Relace Q1 je tudíž Σ1-univerzální. Dále
postupujme indukcí. Nechť Qn je Σn-univerzální a nechť A = { v ; ∃yP(v, y) },
2.2 Základní pojmy z teorie rekurzívních funkcí 107
kde P ∈ Πn, je daná Σn+1-množina. Množina C = { v, y ; ¬P(v, y) } je Σn.
Vzhledem k Σn-univerzálnosti relace Qn tedy existuje a takové, že
∀v∀y( v, y ∈ C ⇔ Qn(a, v, y )).
Platí tedy
∀v∀y(¬P(v, y) ⇔ Qn(a, v, y )),
∀v(∃yP(v, y) ⇔ ∃y¬Qn(a, v, y )).
Tedy A = { v ; Qn+1(a, v) }. Relace Qn+1 je Σn+1-univerzální.
Nechť je dána libovolná Σn množina A. Víme A = { v ; Qn(a, v) } pro jisté a. Platí
A ≤m Hn via v → a, v . Množina Hn je tedy Σn-kompletní.
Předpokládejme Dn ∈ Πn. Pak Dn ∈ Σn. Existuje tedy a takové, že
∀v(v /∈ Dn ⇔ Qn(a, v)).
Zvolme v = a. Ekvivalence a /∈ Dn ⇔ Qn(a, a) znamená spor.
Důkazy druhých částí všech tří tvrzení (a), (b) a (c) jsou analogické a ponecháváme
je za cvičení. QED
Z tvrzení (c) věty plyne, že neplatí žádná z inkluzí Σn ⊆ Πn či Πn ⊆ Σn.
Aritmetická hierarchie tedy nekolabuje, všechny inkluze v obrázku 2.2.4 jsou ostré.
V každé množině Σn i Πn existují nejsložitější množiny, totiž Σn-kompletní resp.
Πn-kompletní množiny.
Obraťme nyní pozornost zpět k částečně rekurzívním funkcím a k rekurzívně
spočetným množinám. Poslední problematika tohoto oddílu je věta o parametrech.
Nechť ψ je částečná funkce n + m proměnných. Zápis λv1, . . , vmψ(x, v) označuje
funkci [v1, . . , vm] → ψ(x, v), tj. funkci, která je z funkce ψ odvozena dosazením
konstant za prvních n proměnných. Je-li ψ částečně rekurzívní, pak ovšem i každá
z funkcí λv1, . . , vmψ(v, x) je částečně rekurzívní. Následující věta tvrdí, že (ně- E
který) index funkce λv1, . . vmψ(x, v) lze stanovit algoritmem na základě vstupů
e, x1, . . , xn, kde e je libovolný index původní funkce ψ.
Věta 2.2.40 (o parametrech) Pro každou dvojici nenulových čísel n a m existuje
rekurzívní funkce sm
n , která je funkcí n + 1 proměnných, taková, že pro každé
e a x1, . . , xn platí
ϕ(m)
sm
n (e,x) = λv1, . . , vm(ϕ(n+m)
e (x, v)).
Náznak důkazu Víme, že index e funkce ϕ(n+m)
e můžeme považovat za kód programu
P, který počítá funkci ϕ(n+m)
e . Program P, kdykoliv je spuštěn, požaduje (čte
ze vstupní pásky) n+m vstupů x1, . . , xn a v1, . . , vm. Jsou-li vstupy x1, . . , xn konstantní,
tj. známe-li je předem v době programování, můžeme program P upravit
na program P , který čísla x1, . . , xn „zná a požaduje pouze vstupy v1, . . , vm. Tato
úprava například v jazyce Pascal znamená některé příkazy read nebo readln nahradit
deklaracemi konstant; v jazyce RASP znamená některé instrukce read nahradit
108 2 Algoritmy a úlohy
instrukcemi mov. Program P je ovšem jiný pro každou volbu konstant x1, . . , xn.
Úprava, kterou vznikne program P z programu P a čísel x1, . . , xn, je zcela mechanická
a může ji provádět nějaký program S. Funkce, kterou počítá program S, je
hledanou funkcí sm
n . QED
Věta o parametrech tedy tvrdí, že existuje program, který do daného programu
zapracuje dané konstanty, takže výsledný program pak požaduje menší množství
vstupů. Podrobný důkaz věty 2.2.40 lze nalézt v knize [61]. Někteří autoři větu o
parametrech nazývají „věta s-n-m .
Věta 2.2.41 (a) Nechť ψ je částečně rekurzívní funkce n + m proměnných. Pak
existuje obecně rekurzívní funkce g, která je funkcí n proměnných a která pro každá
x1, . . , xk splňuje
ϕ(m)
g(x) = λv1, . . , vmψ(x, v).
(b) Nechť Q je rekurzívně spočetná (n + m)-ární relace. Pak existuje rekurzívní
funkce g, která je funkcí n proměnných a která pro každá x1, . . , xn splňuje
W(m)
g(x) = { [v1, . . , vm] ; Q(x, v) }.
Důkaz Tvrzení (a) plyne bezprostředně z věty 2.2.40, stačí zvolit nějaký index e
funkce ψ a za funkci g vzít funkci [x1, . . , xn] → sm
n (e, x). V (b) stačí k dané relaci Q
zvolit funkci ψ takovou, že Dom(ψ) = Q, a užít tvrzení (a). QED
Příklad 2.2.42 Nechť A ⊆ N je libovolná Π2-množina. Víme, že k A existuje
rekurzívní relace R ⊆ N3
taková, že A = { x ; ∀v∃yR(x, v, y) }. Deﬁnujme funkci ψ
dvou proměnných předpisem ψ(x, v) µyR(x, v, y). Platí-li x ∈ A, pak ∀v!ψ(x, v)
a funkce λvψ(x, v) je totální. Platí-li x /∈ A, pak naopak funkce λvψ(x, v) není
totální. Nyní užijme větu 2.2.41(a) a vezměme funkci g takovou, že g(x) je index
funkce λvψ(x, v). Platí
x ∈ A ⇔ ϕg(x) je totální.
Označme Tot množinu { x ; ϕx je totální }. Právě jsme zjistili, že A ≤m Tot platí
pro každou množinu A ∈ Π2. Protože lze snadno ověřit, že Tot ∈ Π2, dokázali jsme
tím, že Tot je Π2-kompletní. To dále znamená Tot /∈ Σ2, Tot /∈ Π1 a Tot /∈ Σ1.
Vidíme tedy, že chceme-li podmínku „ϕx je totální vyjádřit pomocí rekurzívní
podmínky a kvantiﬁkátorů, nestačí jeden kvantiﬁkátor; dva kvantiﬁkátory stačí,
ale první musí být univerzální a druhý musí být existenční.
Příklad 2.2.43 Nechť B = {x; Wx = ∅} = {x; ∃y(y ∈ Wx)}. Podmínka y ∈ Wx
je rekurzívně spočetná, díky tvrzení (e) lemmatu 2.2.35 tedy platí B ∈ RS. Nechť
A je libovolná rekurzívně spočetná množina. Deﬁnujme relaci Q jako množinu
{[x, v]; x ∈ A}. Relace Q je rekurzívně spočetná. Když x ∈ A, pak {v; Q(x, v)} = N,
jinak { v ; Q(x, v) } = ∅. Užijme na relaci Q tvrzení 2.2.41(b): existuje g ∈ FOR
taková, že x ∈ A ⇔ Wg(x) = ∅. Platí A ≤m B via g. Protože množina A byla
libovolná, dokázali jsme, že B je kompletní množina. Platí tedy B /∈ OR a B /∈ RS.
2.2 Základní pojmy z teorie rekurzívních funkcí 109
Příklad 2.2.44 Nechť B je pevně zvolená rekurzívně spočetná množina. Ověříme,
že existuje rekurzívní funkce g taková, že pro každé x platí Wg(x) = B∪Wx. K tomu
stačí užít tvrzení 2.2.41(b) na relaci Q = { [x, v] ; v ∈ B ∨ v ∈ Wx }; platí Q ∈ RS
a { v ; Q(x, v) } = B ∪ Wx.
V příkladu 2.2.43 jsme dokázali, že ke každé množině A ∈ RS existuje rekurzívní
funkce g taková, že Wg(x) = N pro x ∈ A a Wg(x) = ∅ pro x /∈ A. Z toho plyne
x ∈ A ⇔ g(x) ∈ Wg(x), a tedy x ∈ A ⇔ g(x) ∈ K. Tím je dokázáno, že
množina K, čili množina D1, je Σ1-kompletní. Složitější, ale podobnou úvahou by
bylo možno ověřit, že množina Dn je Σn-kompletní pro každé n.
Předpokládejme, že B je nějaká rekurzívně spočetná nerekurzívní množina.
Z věty 2.2.27 plyne, že B /∈ RS. Množina B se tedy liší od všech množin Wx.
Platí tedy
∀x∃y((y /∈ B & y /∈ Wx) ∨ (y ∈ B & y ∈ Wx)).
To lze přepsat na
∀x∃y(y ∈ B ⇔ y ∈ Wx).
Někdy se může stát, že (některé) číslo y splňující podmínku y ∈ B ⇔ y ∈ Wx, čili
dosvědčující, že B = Wx, lze z čísla x určit algoritmem. V tom případě řekneme,
že množina B je efektivně nerekurzívní.
Deﬁnice 2.2.45 Množina B je efektivně nerekurzívní, jestliže B ∈ RS a jestliže
navíc existuje rekurzívní funkce f taková, že ∀x(f(x) ∈ B ⇔ f(x) ∈ Wx).
Efektivně nerekurzívní množina samozřejmě není rekurzívní. Platí ale víc.
Věta 2.2.46 Množina B ⊆ N je efektivně nerekurzívní, právě když je kompletní.
Důkaz Nechť B je efektivně nerekurzívní a nechť rekurzívní funkce f splňuje podmínku
∀x(f(x) ∈ B ⇔ f(x) ∈ Wx). Nechť libovolná rekurzívně spočetná množina
A je dána. Zvolme k A rekurzívní funkci g takovou, že Wg(x) = N pro x ∈ A
a Wg(x) = ∅ pro x /∈ A. Existenci takové funkce jsme dokázali v příkladu 2.2.43.
Platí
x ∈ A ⇔ Wg(x) = N ⇒ f(g(x)) ∈ Wg(x) ⇔ f(g(x)) ∈ B,
x /∈ A ⇔ Wg(x) = ∅ ⇒ f(g(x)) /∈ Wg(x) ⇔ f(g(x)) /∈ B.
Takže A ≤m B via f ◦ g.
Nechť naopak B je kompletní. Tedy A ≤m B pro každou A ∈ RS. Zvolme A = K:
existuje rekurzívní funkce f taková, že ∀x(x ∈ K ⇔ f(x) ∈ B). Zvolme funkci
g ∈ FOR, která splňuje podmínku ∀x(Wg(x) = { v ; f(v) ∈ Wx }). Existenci takové
funkce g zaručuje tvrzení 2.2.41(b) (cvičení). Platí
f(g(x)) ∈ B ⇔ g(x) ∈ K ⇔ g(x) ∈ Wg(x) ⇔ f(g(x)) ∈ Wx.
Funkce f ◦ g tedy dosvědčuje, že B je efektivně nerekurzívní. QED
110 2 Algoritmy a úlohy
Věta 2.2.47 Existují rekurzívně spočetné množiny A a B takové, že A ∩ B = ∅, a
navíc každá rekurzívně spočetná množina C splňující podmínky A ⊆ C a C∩B = ∅
nebo podmínky B ⊆ C a A ∩ C = ∅ je efektivně nerekurzívní, tedy kompletní.
Důkaz Deﬁnujme množiny A a B takto:
A = { z ; ∃w(T((z)0, z, w) & ∀v<w¬T((z)1, z, v)) },
B = { z ; ∃w(T((z)1, z, w) & ∀v≤w¬T((z)0, z, v)) }.
Množina A je tedy množinou takových z, že začneme-li od nuly a probíráme-li větší
a větší svědky w, někdy se zjistí z ∈ W(z)0
, a to ne později, než by se zjistilo
z ∈ W(z)1
. Množina B je naopak množinou takových z, že z ∈ W(z)1
se zjistí dříve
než z ∈ W(z)0
.
Nechť množina C je taková, že A ⊆ C a C ∩ B = ∅. Zvolme pevně nějaký index c
množiny C. Tedy Wc = C. Zvolme k množině B funkci g splňující podmínku
∀x(Wg(x) = B ∪ Wx). Existenci takové funkce g jsme dokázali v příkladu 2.2.44.
Ověřme, že funkce f deﬁnovaná předpisem f(x) = g(x), c dosvědčuje, že C je
efektivně nerekurzívní. Nechť f(x) ∈ C. Protože C ∩ B = ∅, máme f(x) /∈ B.
Dokažme sporem, že f(x) ∈ Wx. Když ne, pak f(x) /∈ B ∪ Wx, čili f(x) /∈ Wg(x).
Platí (f(x))0 = g(x), (f(x))1 = c, událost f(x) ∈ W(f(x))1
má nějakého svědka w, a
každý takový svědek w je menší než jakýkoliv svědek pro f(x) ∈ W(f(x))0
, protože
f(x) ∈ W(f(x))0
neplatí. Tedy f(x) ∈ B, spor. Nechť naopak f(x) ∈ Wx. Pak
f(x) ∈ Wx ∪ B, tedy f(x) ∈ Wg(x) = W(f(x))0
. Dokažme sporem, že f(x) ∈ C.
Kdyby ne, pak událost f(x) ∈ W(f(x))0
má svědka, událost f(x) ∈ W(f(x))1
jej
nemá, tedy f(x) ∈ A, a to je spor s A ⊆ C.
Druhý případ, kdy B ⊆ C a A ∩ B = ∅, je analogický. QED
Nápad vyskytující se v předchozím důkazu, totiž uvažovat, která ze dvou slučitelných
událostí má menšího svědka, pochází od Rossera a ještě se s ním setkáme
v kapitole 4.
Na závěr poznamenejme, že věty 2.2.46 a 2.2.47 jsme formulovali tak, abychom
se obešli bez řady důležitých pojmů. Množiny A a B z důkazu věty 2.2.47 jsou
efektivně neoddělitelné. Jsou-li A a B libovolné efektivně neoddělitelné množiny,
pak každá nadmnožina jedné z nich, která je disjunktní s druhou, je kreativní, a dále
kreativní množiny jsou přesně ty, které jsou kompletní. Zájemce o tuto nesmírně
zajímavou problematiku odkazujeme na knihy [71] a [61]. V kapitole 4 vystačíme
s materiálem z tohoto oddílu.
Existují rekurzívně spočetné množiny, které nejsou rekurzívní ani kompletní?
Existují rozumně deﬁnované pojmy převeditelnosti odlišné od pojmu m-převeditelnosti?
Asi by měly existovat, například proto, že některé množiny nejsou
m-převeditelné na svůj komplement, ale z intuitivního hlediska je rozhodování o
náležení do libovolné množiny A stejně obtížné jako rozhodování o náležení do
jejího komplementu A. O těchto otázkách si také lze přečíst v [71] a [61].
2.2 Základní pojmy z teorie rekurzívních funkcí 111
Cvičení
1. Dokažte podrobně, že funkce [x, y] → x · y je primitivně rekurzívní.
2. Odvoďte násobení tří činitelů, tj. funkci [x, y, z] → x · y · z, několikerým užitím
operace substituce (bez užití operace primitivní rekurze) z funkce [x, y] → x·y.
3. Nechť A ⊆ Nk+1
je rekurzívní množina a nechť ψ(x) je min{ y ; A(x, y) },
když ∃yA(x, y), a ψ(x) je nedeﬁnováno v ostatních případech. Zdůvodněte, že
funkce ψ je částečně rekurzívní.
4. Dokažte, že každá jednoprvková podmnožina množiny Nk
je primitivně rekurzívní.
Dokažte, že podmínky x < y, x ≤ y a x = y jsou primitivně rekurzívní.
5. Nechť ψ je částečná funkce k proměnných. Deﬁnujme graf funkce ψ jako
množinu Graf(ψ) = { [x, z] ; ψ(x) = z }. Množina Graf(ψ) je tedy totéž co
funkce ψ chápaná způsobem obvyklým v teorii množin, tj. chápaná jako množina
(k + 1)-tic. Dokažte, že graf primitivně rekurzívní funkce je primitivně
rekurzívní množina. Dále dokažte, že totální funkce je rekurzívní, právě když
její graf je rekurzívní množina.
6. Zdůvodněte užitím lemmatu 2.2.13, že vlastnosti „x je sudé a „x je mocnina
dvojky a podmínka „x a y jsou nesoudělná jsou primitivně rekurzívní.
7. Dokažte, že je-li f libovolná obecně rekurzívní funkce k proměnných, pak její
obor hodnot Rng(f) je rekurzívně spočetná množina.
8. Je-li f rostoucí rekurzívní nebo primitivně rekurzívní funkce jedné proměnné,
pak Rng(f) je rekurzívní resp. primitivně rekurzívní množina. Dokažte.
Návod. Nejprve dokažte indukcí podle x, že pro každé x platí x ≤ f(x). Pak
užijte lemma 2.2.13 a cvičení 5.
9. Musí být funkce f primitivně rekurzívní, jestliže má primitivně rekurzívní graf,
je totální a platí Rng(f) ⊆ {0, 1}?
Návod. Odvoďte funkci f větvením, tj. užijte lemma 2.2.16.
10. Nechť pro funkce f a g jedné proměnné platí ∀x(f(x) ≤ g(x)), nechť f má primitivně
rekurzívní graf a nechť g je primitivně rekurzívní. Pak i f je primitivně
rekurzívní. Dokažte.
Návod. Užijte lemma 2.2.17.
11. Dokažte, že částečná funkce má rekurzívní graf, právě když ji lze odvodit jedním
užitím operace minimalizace z jisté obecně rekurzívní funkce.
12. Nechť pro funkce ψ a f jedné proměnné platí ∀x(!ψ(x) ⇒ ψ(x) ≤ f(x)), nechť
f je rekurzívní a nechť ψ má rekurzívní graf. Musí funkce ψ mít rekurzívní
deﬁniční obor?
112 2 Algoritmy a úlohy
13. Každá nekonečná rekurzívní množina je oborem hodnot jisté rostoucí obecně
rekurzívní funkce. Dokažte.
Návod. Přizpůsobte důkaz o tom, že rostoucí posloupnost všech prvočísel je
primitivně rekurzívní.
14. Je-li g totální funkce jedné proměnné s nekonečným oborem hodnot a platí-li
pro každé x, že f(x) = g(µy(g(y) /∈ {f(0), . . , f(x − 1)})), pak funkce f je
totální, prostá a má stejný obor hodnot jako funkce g. Dokažte.
Návod. Dokažte indukcí podle y, že platí-li |{g(0), . . , g(y − 1)}| = x, pak
{g(0), . . , g(y − 1)} = {f(0), . . , f(x − 1)}.
15. Dokažte podrobně pomocí lemmatu 2.2.20, že jsou-li funkce f a g jako v předchozím
cvičení a je-li g rekurzívní, pak i f je rekurzívní. Na jakou funkci h se
přitom aplikuje lemma 2.2.20?
16. Změnila by se třída všech funkcí odvoditelných ze základních funkcí pomocí
primitivní rekurze, substituce a minimalizace, kdybychom přijali omezení, že
primitivní rekurzi a minimalizaci je povoleno použít jen na totální funkce?
Návod. Použijte větu o normální formě.
17. Rozhodněte, zda graf a deﬁniční obor funkcí α a β deﬁnovaných předpisem
α(x) µyT(x, x, y), β(x) z(µyT(x, x, y)),
kde z je konstantní funkce s hodnotou nula, jsou obecně rekurzívní.
18. Uvažujte třídu všech funkcí, které mají odvození, v němž jsou všechny tři operace
použity vždy jen na totální funkce. Obsahuje tato třída i nějaké netotální
funkce? Obsahuje tato třída všechny obecně rekurzívní funkce? Obsahuje tato
třída všechny částečně rekurzívní funkce?
Návod. Zdůvodněte, že má-li netotální funkce ψ odvození, v němž jsou všechny
operace použity pouze na totální funkce, pak ψ splňuje podmínku z cvičení 11,
a má tedy rekurzívní graf. V předchozím cvičení se ale vyskytla částečně rekurzívní
funkce, která nemá rekurzívní graf.
19. Dokažte, že funkce ψ deﬁnovaná předpisem ψ(x) 1 ·−ϕx(x) je částečně rekurzívní
funkce, která nemá žádné rekurzívní prodloužení, tj. která (jako množina
dvojic) není podmnožinou žádné rekurzívní funkce jedné proměnné.
Návod. Nechť f je rekurzívní prodloužení funkce ψ a nechť e je některý index
funkce f. Uvažujte o hodnotách f(e) a ψ(e).
20. Řekneme, že množiny A a B jsou rekurzívně oddělitelné, jestliže existuje rekurzívní
množina D taková, že A ⊆ D a D ∩ B = ∅. V opačném případě jsou
rekurzívně neoddělitelné. Dokažte, že existují disjunktní rekurzívně spočetné
množiny, které jsou rekurzívně neoddělitelné.
Návod. Položte A = { x ; ψ(x) 0 } a B = { x ; ψ(x) 1 }, kde ψ je funkce
z předchozího cvičení.
2.2 Základní pojmy z teorie rekurzívních funkcí 113
21. Když A a B jsou rekurzívně spočetné množiny takové, že A ∩ B = ∅ a A ∪ B
je rekurzívní, pak A i B je rekurzívní.
22. Nechť A a B jsou rekurzívně spočetné množiny takové, že A∪B = N. Dokažte,
že existuje rekurzívní množina D taková, že A − B ⊆ D a B − A ⊆ D.
Zobecněte důkaz Postovy věty.
23. Dokažte tvrzení, které je v knize [61] nazváno věta o redukci: ke každým dvěma
rekurzívně spočetným množinám A a B existují disjunktní rekurzívně spočetné
množiny A a B takové, že A − B ⊆ A , B − A ⊆ B a A ∪ B = A ∪ B.
Návod. Buď zobecněte Postovu větu ještě dále, a místo funkcí f a g uvažovaných
v jejím důkazu užijte funkce γ a ψ deﬁnované předpisy
γ(x) µy(P(x, y) ∨ Q(x, y)),
ψ(x) cP (x, γ(x)) ·−cQ(x, γ(x)),
nebo užijte větu 2.2.28 na relaci { [x, 1] ; x ∈ A } ∪ { [x, 0] ; x ∈ B }.
24. Rozhodněte, zda platí: je-li A ⊆ N2
rekurzívně spočetná relace taková, že
∀x∃yA(x, y), pak existuje rekurzívní funkce g taková, že pro každé x platí
g(x) = min{ y ; A(x, y) }.
Návod. Uvažujte relaci A = { [x, y] ; x ∈ K ∨ y ≥ 1 }.
25. Vyvoďte z cvičení 22, že každé dvě disjunktní Π1-množiny jsou rekurzívně
oddělitelné.
26. Navrhněte aritmetickou klasiﬁkaci pro množiny
(a) { x ; Wx je konečná },
(b) { x ; Wx je konečná },
(c) { x ; Wx je kompletní }.
27. Dokažte, že množina Unb je Π2-kompletní.
2.3 Pár slov o výpočtové složitosti
Vezmeme-li do ruky libovolnou učebnici logiky (včetně této) a budeme-li listovat
v jejích úvodních kapitolách, pravděpodobně najdeme část věnovanou výrokovým
tautologiím, a tato část bude obsahovat příklady či cvičení na užití tabulkové metody.
Prohlédneme-li si tyto příklady a cvičení, asi zjistíme, že všechny formule,
které se v nich vyskytují, obsahují nejvýše tři výrokové atomy. Je nám přitom jasné,
proč tomu tak je: tabulka pravdivostních ohodnocení pro formuli s n výrokovými
atomy má 2n
řádků, což je pro n ≥ 4 nepříjemně vysoký počet.
114 2 Algoritmy a úlohy
V oddílu 2.1 jsme na tabulkové metodě založili programy pro počítač RASP,
které rozhodují úlohy Sat a Taut. Při tom jsme konstatovali, že lze ušetřit paměťový
prostor, protože tabulku pravdivostních ohodnocení není nutné držet v paměti
počítače celou najednou, prostor nutný k uložení jednoho pravdivostního ohodnocení
může být použit opakovaně. Nenalezli jsme ale způsob, jak ušetřit čas nutný
k výpočtu. Formule délky n může obsahovat řádově n různých výrokových atomů,
a čas, který náš algoritmus potřebuje na její zpracování, nelze omezit lépe než
funkcí n → 2n
.
Představme si, že na určitém (skutečném) počítači provozujeme určitý program
P a že po nějaké době získáme nový počítač, který je několikanásobně rychlejší.
Pracuje-li program P v čase 2O(n)
, několikanásobné zrychlení výpočtu nepřináší
vlastně žádnou výhodu, neboť neznamená nic víc, než že na novém počítači
můžeme za stejný časový úsek zpracovat vstup, který je o několik znaků delší. Tím
chceme znovu připomenout to, co jsme konstatovali za formulací věty 2.1.1 a co
bylo již předtím naznačeno v komentáři k tabulkové metodě: program pracující
v exponenciálním čase se těžko dá považovat za efektivní, a úlohy, které lze rozhodovat
pouze programem s tak vysokými časovými nároky, se z praktického hlediska
příliš neliší od algoritmicky nerozhodnutelných úloh.
Které z algoritmicky rozhodnutelných úloh tedy můžeme považovat za efektivně
rozhodnutelné, tj. za rozhodnutelné i z praktického hlediska?
Deﬁnujme TIME(f) jako množinu všech úloh, které jsou na počítači RASP rozhodnutelné
programem, který pracuje v čase O(f), a deﬁnujme dále FTIME(f)
jako množinu všech funkcí, které jsou na počítači RASP počitatelné programem,
který rovněž pracuje v čase O(f). Množinám jako TIME(f) a FTIME(f) se ve výpočtové
složitosti říká třída (rozhodovacích) úloh resp. třída funkcí. Mohli bychom
efektivně počitatelné funkce ztotožnit s funkcemi z vhodně zvolené třídy FTIME(f),
například s funkcemi z třídy FTIME(n)? Proti této volbě mluví několik argumentů.
Jeden z nich je ten, že třída FTIME(n) je neabsolutní v tom smyslu, že je závislá
na volbě výpočtového modelu a na detailech deﬁnice časových nároků. Například
funkce Násobení je sice na počítači RASP a při naší deﬁnici časových nároků počitatelná
v čase O(n), je ale otevřeným problémem, zda je v čase O(n) počitatelná
i na Turingově stroji.
Běžný přístup je přijmout za efektivní každý program pracující v čase O(nk
) pro
některé k. Je zřejmé, že pracuje-li program P v čase O(nk
), pak existují konstanty
c1, c2 ∈ N takové, že program P pracuje v čase c1nk
+c2. Na druhé straně, pracuje-li
program P v čase
k
i=0 cink−i
, tj. jsou-li jeho časové nároky omezeny polynomem
v n, pak P pracuje v čase O(nk
). Z tohoto důvodu se o programech, které pracují
v čase O(nk
) pro některé k ∈ N, říká, že pracují v polynomiálním čase. Za funkce či
rozhodovací úlohy, které jsou počitatelné či rozhodnutelné z praktického hlediska,
prohlašme funkce resp. úlohy, které jsou počitatelné (rozhodnutelné) programem,
který pracuje v polynomiálním čase:
FP =
c∈N
FTIME(nc
), P =
c∈N
TIME(nc
).
2.3 Pár slov o výpočtové složitosti 115
Třída FP je třída všech funkcí počitatelných v polynomiálním čase (polynomiálně
počitatelných funkcí) a třída P je třída všech úloh rozhodnutelných v polynomiálním
čase (polynomiálně rozhodnutelných úloh). K deﬁnici tříd FP a P poznamenejme,
že se situací, kdy „ta pravá třída je deﬁnována jako nekonečné sjednocení, jsme se
vlastně už setkali. Když jsme v oddílu 2.1 o nějaké úloze řekli, že je rozhodnutelná
v čase 2O(n)
, znamenalo to, že je prvkem sjednocení c∈N TIME(2cn
).
Třída P je pokládána za nejpřirozenějšího kandidáta při hledání deﬁnice, která
by vystihla intuitivní pojem efektivně rozhodnutelné úlohy. Třída P není závislá na
tom, který z běžných výpočtových modelů si vybereme. P. Odifreddi v [61] dokonce
tvrdí, že platí kvantitativní verze Churchovy teze: pojem polynomiálně rozhodnutelné
úlohy je absolutním pojmem, nelze navrhnout rozumný výpočtový model tak,
aby třída všech polynomiálně rozhodnutelných úloh pomocí něj deﬁnovaná se lišila
od třídy všech polynomiálně rozhodnutelných úloh deﬁnované pomocí kteréhokoliv
z užívaných výpočtových modelů (či pomocí počítače RASP). Z tohoto důvodu
můžeme mluvit nejen o programech pro počítač RASP pracujících v polynomiálním
čase, ale i o algoritmech pracujících v polynomiálním čase čili o polynomiálních
algoritmech. Také ostatní třídy, o kterých se zmíníme v tomto oddílu, jsou nezávislé
na volbě výpočtového modelu.
Dosud víme, že například úloha Pravdivostní hodnota výrokové formule
je v třídě P. O úlohách Sat, Taut a QBF není známo, jsou-li v P. O úlohách,
jako je Problém zastavení, je jasné, že v P nejsou.
Kromě tříd, jako je P nebo TIME(n), kterým se říká časové třídy, vezměme
v úvahu také prostorové třídy. Deﬁnujme FSPACE(f) a SPACE(f) jako množinu
všech funkcí či rozhodovacích úloh, které jsou (na počítači RASP) počitatelné resp.
rozhodnutelné programem, který pracuje v prostoru O(f). Dále položme
FLOG = FSPACE( ), LOG = SPACE( ), PSPACE =
c∈N
SPACE(nc
).
Třída FLOG či LOG je třída všech funkcí počitatelných (resp. úloh rozhodnutelných)
v logaritmickém prostoru. Tato terminologie je oprávněna faktem, že a také
každá funkce tvaru n → logc1
(n) , kde c1 > 1, je v O(f) pro libovolnou funkci f
tvaru n → logc2
(n) , kde opět c2 > 1. Můžeme tedy mluvit o logaritmu, aniž
bychom speciﬁkovali jeho bázi. Třída PSPACE je třída všech úloh rozhodnutelných
v polynomiálním prostoru.
V oddílu 2.1 jsme zjistili, že úlohy Sat, Taut a QBF jsou v PSPACE. Úloha rozhodnout,
zda dané slovo je booleovským výrazem, je příkladem úlohy ve třídě LOG.
Také úloha rozhodnout, zda dané slovo je (syntakticky správnou) výrokovou formulí,
je úlohou ve třídě LOG, neboť program z oddílu 2.1, který rozhoduje o syntaktické
správnosti booleovských výrazů a pracuje v logaritmickém prostoru, by se
dal upravit na program, který by místo toho rozhodoval o výrokových formulích.
Lze dokázat (cvičení), že úlohy Hodnota booleovského výrazu a Pravdivostní
hodnota výrokové formule jsou také ve třídě LOG. Součet a součin
přirozených čísel jsou příklady funkcí ve třídě FLOG.
116 2 Algoritmy a úlohy
Rozšiřme nyní naši zásobu zajímavých úloh. Připomeňme, že literál je výrokový
atom nebo negovaný výrokový atom a že klauzule je disjunkce literálů. Deﬁnujme,
že literál je negativní nebo pozitivní podle toho, je-li negovaným atomem nebo atomem
bez negace. Hornovská klauzule je klauzule obsahující nejvýše jeden pozitivní
literál. Hornovská formule je výroková formule, která je konjunkcí hornovských
klauzulí. Hornovská formule je tedy zvláštním případem formule v konjunktivním
normálním tvaru. Nyní jsme připraveni deﬁnovat několik úloh vztahujících se
k výrokové logice.
HornSat
Dáno: Hornovská výroková formule A.
Úkol: Zjistit, zda A je splnitelná.
2Sat
Dáno: Výroková formule A v konjunktivním normálním tvaru, v níž každá klauzule
obsahuje nejvýše dva literály.
Úkol: Zjistit, zda A je splnitelná.
3Sat
Dáno: Výroková formule A v konjunktivním normálním tvaru, v níž každá klauzule
obsahuje nejvýše tři literály.
Úkol: Zjistit, zda A je splnitelná.
Analogicky bychom mohli deﬁnovat také úlohy 4Sat, 5Sat atd. Nebudeme je
ale potřebovat. Kromě uvedených tří úloh se zmíníme také o úlohách CNFSat a
DNFSat (zjistit, zda daná formule v konjunktivním resp. disjunktivním normálním
tvaru je splnitelná).
Je zřejmé, že pomocí tabulkové metody lze rozhodovat kteroukoliv z právě uvedených
tří úloh. Nyní ale zdůvodníme, že pro úlohu HornSat lze navrhnout mnohem
účinnější algoritmus, než je tabulková metoda. Výsledkem bude tvrzení, že
úloha HornSat je v P. Úvahy, zda něco podobného platí i pro zbývající dvě úlohy
či pro úlohu Sat, odložme na později.
Uvědomme si, že je-li C hornovská klauzule tvaru ¬q1 ∨ . . ∨ ¬qk ∨ p, tj.
obsahuje-li klauzule C nějaký pozitivní literál, pak C je výrokově ekvivalentní s formulí
q1& . . &qk →p. Domluvme se proto, že hornovským klauzulím obsahujícím pozitivní
literál budeme chvíli říkat „implikace , kdežto ostatním (sestávajícím pouze
z negativních literálů) budeme říkat „disjunkce . Například hornovská formule
¬p & (¬r ∨ ¬s ∨ p) & (¬q ∨ s) & (¬r ∨ q) & r
je konjunkcí pěti klauzulí, z nichž první je disjunkce, ostatní jsou implikace. Nyní
můžeme popsat algoritmus, o kterém pak dokážeme, že je polynomiálním algoritmem
pro úlohu HornSat:
1. Přijmi vstup A a zkontroluj, že A je opravdu hornovskou formulí. Utvoř
seznam r1, . . , rn všech atomů vyskytujících se v A. Vyhraď paměťový
2.3 Pár slov o výpočtové složitosti 117
prostor pro pravdivostní ohodnocení v atomů r1, . . , rn. Iniciálně zvol v
tak, že všem atomům r1, . . , rn jsou přiřazeny nuly.
2. Zjisti, zda mezi klauzulemi, ze kterých je sestavena formule A, je nějaká
implikace, kterou ohodnocení v nesplňuje. Pokud ne, pokračuj bodem 4.
3. Zvol implikaci ¬q1 ∨ . . ∨ ¬qk ∨ p, kterou ohodnocení v nesplňuje. Polož
v(p) = 1 a pokračuj bodem 2.
4. Když v splňuje všechny disjunkce, řekni ANO. Jinak řekni NE.
Ohodnocení v zpočátku obsahuje pouze nuly. Některé nuly mohou být v průběhu
výpočtu změněny na jedničky; opačná změna ale možná není. Tento algoritmus
nejprve pomíjí všechny disjunkce a zabývá se pouze implikacemi. Každá implikace
může být příčinou, že některá nula ohodnocení v je změněna na jedničku. Tuto
„potíž ale každá implikace C tvaru ¬q1 ∨. .∨¬qk ∨p může způsobit nejvýše jednou:
poté, co jsme položili v(p) = 1, další přidání jedniček už nic nezmění na tom,
že v(C) = 1. Bod 3 je tedy prováděn nejvýše tolikrát, kolik je ve formuli A implikací.
Tím je zdůvodněno, že algoritmus při zpracování libovolného vstupu A dospěje
k bodu 4, vydá nějakou odpověď a zastaví se. Zbývá zdůvodnit, že všechny jeho
odpovědi jsou správné. Důkaz se opírá o následující pomocné tvrzení. Nechť v je
libovolné pravdivostní ohodnocení, pro které platí v (A) = 1. Vždy, když je prováděn
bod 2, pro každý z atomů r1, . . , rn splňující podmínku v(ri) = 1 platí i v (ri) = 1.
Jinými slovy, každá hodnota 1 ohodnocení v je nutná v tom smyslu, že hodnotu 1
má v tomtéž bodě každé ohodnocení, které splňuje formuli A. Toto tvrzení lze
snadno dokázat indukcí podle počtu průchodů bodem 3. Když algoritmus dospěje
k bodu 4, má v ruce ohodnocení v, které splňuje všechny implikace. Zjistí-li nyní, že
v splňuje všechny disjunkce, a řekne-li následkem toho ANO, je to správná odpověď,
ohodnocení v splňuje všechny klauzule formule A (implikace i disjunkce), a A je
tedy splnitelnou formulí. Když naopak A je splnitelná, existuje ohodnocení v
takové, že v (A) = 1. Ohodnocení v splňuje všechny disjunkce a pomocné tvrzení
říká, že v vznikne z v změnou některých jedniček na nuly. Taková změna nemůže
nic pokazit na tom, že všechny disjunkce mají hodnotu 1. Algoritmus tedy při
provedení bodu 4 řekne ANO.
Zbývá uvážit, jak by vypadal přepis P našeho algoritmu do jazyka RASP a
jaké by byly jeho časové nároky. Řekněme, že program P požaduje, aby vstupní
formule A byla na vstupní pásku zapsána běžným způsobem, ale bez zbytečných
závorek určujících pořadí operací stejného druhu (několika konjunkcí nebo několika
disjunkcí). Dále řekněme, že formuli A a ohodnocení v budou v paměti počítače
reprezentovat dva na sebe navazující záznamy, tj. datová struktura, kterou
jsme na str. 74 označili dvěma hvězdičkami. Má-li program P zjistit, zda některá
implikace formule A je ohodnocením v nesplněna, znamená to kvůli každému
literálu projít ohodnocení v a vyhledat příslušnou pravdivostní hodnotu.
Nechť formule A má délku n. Protože literálů je řádově nejvýše n a délka pravdivostního
ohodnocení je také řádově n, na provedení bodu 3 program P potřebuje
čas O(n2
). Protože bod 3 se provádí ne více než n-krát, program pracuje
v čase O(n3
).
118 2 Algoritmy a úlohy
E
T T
E
T
'


Q 


se
f
g
h
p
q
r s
§ ¤
¥c
3
6
2
9




Obrázek 2.3.1: Příklad orientovaného a neorientovaného grafu
Ačkoliv tvrdíme, že algoritmicky zajímavé úlohy se často objevují v logice, je
pravda, že se často objevují také v teorii grafů. Orientovaný graf je dvojice G, R ,
kde G je neprázdná množina a R je binární relace na G. Prvkům množiny G říkáme
vrcholy nebo uzly grafu G, R , prvky množiny R jsou hrany. Na obrázku 2.3.1
vlevo je znázorněn orientovaný graf s osmi vrcholy, hrany jsou vyznačeny šipkami.
Hranám tvaru [a, a] (z nějakého vrcholu do téhož vrcholu) se říká smyčky. Neorientovaný
graf nebo jen graf jsme v oddílu 1.2 na str. 24 deﬁnovali jako dvojici G, R ,
kde R je antireﬂexivní a symetrická relace na neprázdné množině G. Příklad neorientovaného
grafu je znázorněn na obr. 2.3.1 vpravo. Hrany neorientovaného
grafu je užitečné si představovat či znázorňovat jako úsečky (obecně neorientované
spojnice), smyčky se v neorientovaném grafu nepřipouštějí. Posloupnost a0, . . , an
vrcholů (orientovaného nebo neorientovaného) grafu G, R je sled z vrcholu c do
vrcholu d, platí-li ∀i<n(ai R ai+1), a přitom a0 = c a an = d. Číslo n ≥ 0 je délka
sledu a0, . . , an. Sled a0, . . , an je cesta, platí-li ai = aj pro každé dva indexy i = j.
Cesta je tedy takový sled, v němž se neopakují vrcholy. Chceme-li zdůraznit, že
jde o sled nebo cestu v orientovaném či neorientovaném grafu, mluvíme o orientovaném
či neorientovaném sledu a o orientované či neorientované cestě. Vrchol d
je v grafu G, R dosažitelný z vrcholu c, jestliže v grafu G, R existuje sled z c
do d. Protože připouštíme i sledy a cesty délky nula, je každý vrchol c dosažitelný
sám ze sebe, a to bez ohledu na to, je-li [c, c] hranou. Snadno lze zdůvodnit, že
je-li vrchol d dosažitelný z vrcholu c, pak z c do d vede dokonce cesta. Cyklus je
orientovaný sled a0, . . , an takový, že a0, . . , an−1 je cesta a přitom n ≥ 1 a a0 = an.
Orientovaný graf G, R je acyklický, jestliže v něm neexistuje cyklus. Graf G, R
je orientovaný strom, jestliže v něm existuje vrchol c (zvaný kořen) takový, že do
každého vrcholu d ∈ G vede z vrcholu c právě jedna cesta. Vrcholu orientovaného
stromu, ze kterého nevedou hrany, říkáme list. Lze zdůvodnit, že každý orientovaný
strom je acyklickým grafem. O orientovaných stromech jsme již mluvili v oddílech
1.3 a 1.4 v souvislosti s deﬁnicí důkazu.
Řekneme, že podmnožina X množiny G je nezávislou množinou neorientovaného
grafu G, R , jestliže platí X2
∩R = ∅, tj. jestliže žádné dva prvky množiny X nejsou
spojeny hranou.
Dosažitelnost (v orientovaném grafu)
Dáno: Konečný orientovaný graf G, R a jeho dva vrcholy c a d.
Úkol: Zjistit, zda vrchol d je v grafu G, R dosažitelný z vrcholu c.
2.3 Pár slov o výpočtové složitosti 119
Nezávislá množina
Dáno: Konečný neorientovaný graf G, R a přirozené číslo k.
Úkol: Zjistit, zda v grafu G, R existuje nezávislá množina s alespoň k prvky.
Pro účely strojového zpracování se domluvme, že graf na vstupní pásku počítače
zapisujeme jako posloupnost vrcholů oddělených čárkami následovanou posloupností
hran rovněž oddělených čárkami. Hranu zapisujeme jako dvojici vrcholů
oddělených čárkou a uzavřenou mezi hranaté závorky, pro zapisování vrcholů jsme
předem zvolili konečnou abecedu neobsahující znaky [, ] a , (hranaté závorky a
čárku). Zapisujeme-li neorientovaný graf, stačí, zapíšeme-li na seznam hran pouze
jednu z hran [a, b] a [b, a], druhá se rozumí automaticky. Například domluvíme-li se,
že pro zapisování vrcholů jsme zvolili dvouprvkovou abecedu {0, 1}, graf z obr. 2.3.1
vpravo může být reprezentován zápisem
10,11,110,1001,[11,110],[11,1001],[1001,110],[10,11].
Když orientovaný graf G, R má n vrcholů a vrchol d je dosažitelný z vrcholu c,
pak existuje cesta z c do d, jejíž délka je nejvýše n − 1. Na tomto pozorování lze
založit jednoduchý postup, jak určit, je-li vrchol d dosažitelný z vrcholu c: utvořit
postupně seznam všech cest délky nejvýše n−1 začínajících v c, a podívat se potom,
jestli některá z nich vede do d. Potíž je v tom, že všech cest délky n − 1 může
být až n! — příliš mnoho pro polynomiální algoritmus. O algoritmu, který trpělivě
probírá všechny prvky nějakého konečného (ale velkého) oboru, se říká, že postupuje
hrubou silou. Rovněž tabulkovou metodu lze označit za rozhodování úlohy Sat
(nebo Taut) hrubou silou. A také pro úlohu Nezávislá množina bychom snadno
navrhli algoritmus, který ji rozhoduje hrubou silou, probíráním všech podmnožin
nosné množiny daného grafu. Naproti tomu v případě úlohy HornSat máme
k dispozici i něco lepšího, než je hrubá síla. Nyní uvidíme, že úloha Dosažitelnost
je podobného druhu jako HornSat. Ukážeme si dva různé algoritmy, které ji
rozhodují, jeden polynomiální, druhý trochu pomalejší, ale paměťově úspornější.
První z nich pracuje při zpracování vstupů G, R, c a d se dvěma množinami A a B
vrcholů:
1. Polož A := {c} a B := ∅.
2. Platí-li d ∈ A, řekni ANO a skonči. Platí-li B = A, řekni NE a skonči.
3. Zvol a ∈ A−B a urči seznam všech b1, . . , bk ∈ G takových, že [a, bi] ∈ R.
Polož A := A ∪ {b1, . . , bk}, B := B ∪ {a}. Opakuj od bodu 2.
Ponecháváme na čtenáři, aby domyslel, že toto je opravdu polynomiální algoritmus
pro úlohu Dosažitelnost.
Hlavní částí našeho druhého algoritmu pro úlohu Dosažitelnost je podprogram
T. Tento podprogram je volán s parametry a, b a k, kde a a b jsou vrcholy
daného grafu G, R a k je přirozené číslo. Jeho úkolem je zjistit, zda v grafu G, R
zapsaném na vstupní pásce vede z a do b nějaká cesta, jejíž délka je nejvýše k.
K nalezení odpovědi na tuto otázku podprogram T (někdy) volá (rekurzívně) sám
120 2 Algoritmy a úlohy
sebe. Připomeňme, že x označuje nejmenší celé číslo m takové, že x ≤ m. Nechť
r1, . . , rn je seznam všech vrcholů grafu G, R . Podprogram T pracuje takto:
Když k ≤ 1, vrať odpověď ano, je-li a = b nebo je-li [a, b] hrana. Jinak vrať
odpověď ne.
Když k ≥ 2, pak pro každé i ∈ {1, . . , n} volej T(a, ri, k/2 ) a T(ri, b, k/2 ).
Pokud pro některé i jsou obě odpovědi ano, vrať ano, jinak vrať ne.
Hlavní program P, tj. náš paměťově úsporný program pro úlohu Dosažitelnost,
pracuje podle očekávání:
Urči počet n vrcholů daného grafu. Volej T(c, d, n − 1). Řekni ANO nebo NE
podle toho, dostaneš-li odpověď ano nebo ne.
Korektnost tohoto programu je založena na faktech, že je-li k ≥ 2, pak k/2 < k,
a dále že z a do b vede cesta délky nejvýše k právě tehdy, když pro některé číslo
i ∈ {1, . . , n} z a do ri vede cesta délky nejvýše k/2 a současně z ri do b vede
cesta délky rovněž nejvýše k/2 .
Z oddílu 2.1 víme, že činnost programu P si lze představit jako průchod orientovaným
stromem, v němž vrcholy odpovídají jednotlivým voláním podprogramu T
a v němž vrcholy umístěné na téže větvi odpovídají kopiím podprogramu T, které
mohou být současně aktivní. Dále víme, že čas, který program P potřebuje, lze odhadnout
jako součet časů, které potřebují všechny kopie podprogramu T (a hlavní
program P), kdežto použitý prostor lze odhadnout jako maximální součet velikostí
lokálních dat kopií podprogramu T podél jedné větve stromu. Jdeme-li stromem
od kořene k některému listu, třetí parametr podprogramu T má zpočátku hodnotu
k = n − 1, v každém následujícím vrcholu má hodnotu k/2 místo k, v listu
má hodnotu 1. Operaci k → k/2 stačí opakovat nejvýše (n − 1)-krát, abychom
se od n − 1 dostali k jedničce. Maximální délka větve je tedy (n − 1), a maximální
počet současně rozpracovaných kopií podprogramu T je (n − 1) + 1, čili O( (n)).
Lokální data podprogramu T jsou a, b a ri a číslo k. S číslem k není problém,
jeho zápis má délku O( (n)). Poslední zápletka při stanovení paměťových nároků
programu P je toto: budeme-li vrchol grafu reprezentovat přirozeným číslem, které
udává pozici jeho nejlevějšího znaku na vstupní pásce, dosáhneme toho, že pro zápis
kteréhokoliv z vrcholů a, b a ri, a tedy i pro všechna lokální data podprogramu T,
vystačíme s prostorem O( (n)). Tím je zdůvodněno, že program P pracuje v prostoru
O( 2
(n)), a že tedy úloha Dosažitelnost je v třídě SPACE( 2
). Orientovaný
strom, jehož každý vrchol kromě listů má n následníků a jehož větve mohou mít
délku O( (n)), může mít až n (n)
vrcholů. Protože funkci n → n (n)
nelze omezit
polynomem, nemůžeme tvrdit, že program P pracuje v polynomiálním čase.
Lemma 2.3.1 (a) Když g ∈ FP a h ∈ FP, pak h ◦ g ∈ FP.
(b) FLOG ⊆ FP.
(c) Když g ∈ FLOG a h ∈ FLOG, pak h ◦ g ∈ FLOG.
2.3 Pár slov o výpočtové složitosti 121
Důkaz Nechť program P1 počítá funkci g a na každém vstupu délky n se dopočítá
za nejvýše p1(n) kroků. Nechť program P2 počítá funkci h a na každém
vstupu délky n se dopočítá za nejvýše p2(n) kroků. Utvořme z programů P1 a P2
program P, který pracuje tak, že na každém vstupu x nejprve simuluje činnost
programu P1, čímž získá g(x), a pak simuluje činnost programu P2 na vstupu g(x).
Simulace programu P1 znamená počítat úplně stejně jako program P1, ale výsledek
nezapsat na výstupní pásku, nýbrž uložit jej domluveným způsobem do paměti
počítače. Simulace programu P2 znamená pracovat úplně stejně jako program P2,
ale místo dat zapsaných na vstupní pásku použít data zapsaná domluveným způsobem
do paměti počítače. Má-li vstup x délku n, program P1 jej zpracuje za nejvýše
p1(n) kroků. Na simulaci této činnosti program P vystačí s O(p1(n)) kroky. Během
p1(n) kroků program P1 nestačí zapsat na výstupní pásku více než p1(n) symbolů.
Výsledek g(x) jeho činnosti má tedy délku nejvýše p1(n), programu P2 na jeho
zpracování stačí čas p2(p1(n)) a programu P na simulaci činnosti programu P2
stačí O(p2(p1(n))) kroků. Program P tedy pracuje v čase O(p1(n) + p2(p1(n))),
což znamená, že jsou-li p1 a p2 polynomy, pracuje v polynomiálním čase.
Nechť P je program, který pracuje v logaritmickém prostoru a počítá funkci f.
Připomeňme, že v oddílu 2.1 jsme deﬁnovali konﬁguraci počítače RASP jako údaj
o okamžitém obsahu všech paměťových buněk, o hodnotě všech tří podmínkových
bitů, o obsahu čítače instrukcí a o tom, zda svítí některé signální světlo. Dále
připomeňme, že konﬁgurací a obsahem vstupní pásky je jednoznačně určeno, co
počítač v daném okamžiku udělá, tj. do jaké konﬁgurace přejde provedením jednoho
kroku. Nechť posloupnost C0, . . , Cm konﬁgurací je výpočtem programu P
ze vstupu, který má délku n. Protože program P pracuje v prostoru O( ), zápis
každé konﬁgurace Ci má délku O( (n)). Takových zápisů, tj. slov v abecedě Σ
délky O( (n)), je dohromady cO( (n))
, kde c je konstanta. Je zřejmé, že v posloupnosti
C0, . . , Cm nemohou být dvě stejné konﬁgurace: kdyby pro i < j platilo
Cj = Ci, platilo by i Cj+1 = Ci+1, Cj+2 = Ci+2 atd., počítač by donekonečna procházel
konﬁgurace Ci, . . , Cj−1, čili zacyklil by se. Počet m kroků, které program P
může vykonat, než se zastaví, je tedy omezen počtem cO( (n))
možných konﬁgurací.
Trochu počítání postačuje k ověření, že funkce v cO( (n))
je omezena polynomem
v n; platí totiž, že c (n)
je řádově totéž co n (c)
.
Nechť P1 a P2 jsou programy, které počítají funkce g a h a pracují v logaritmickém
prostoru. Opět zkonstruujeme program P, který na každém vstupu x simuluje
činnost programu P1 na vstupu x a činnost programu P2 na vstupu g(x). Nechť
q : N → N je funkce v O( ) taková, že program P2 každý vstup délky n zpracuje
s použitím prostoru nejvýše q(n). Z předchozího odstavce víme, že má-li libovolný
vstup x délku nejvýše n, pak g(x) má délku nejvýše p(n), kde p je jistý polynom.
Funkce q ◦ p je v O( ). To znamená, že na simulaci činnosti programu P2
ze vstupu g(x) program P vystačí s prostorem O( (n)). Potíž je ale v tom, že
program P nemůže postupovat stejně jako v (a), simulovat činnost programu P1,
výsledek g(x) si uložit do paměti a pak simulovat činnost programu P2, neboť
uložením dat g(x) do paměti by mohlo dojít k překročení povoleného prostoru.
122 2 Algoritmy a úlohy
Program P místo toho postupuje následovně. Rovnou začne simulací činnosti programu
P2. V každém okamžiku, kdy by program P2 četl obsah některého pole
vstupní pásky, program P simuluje činnost programu P1, aby obsah onoho pole
zjistil. Program P tedy činnost programu P1 simuluje opakovaně, nenechá jej přitom
nic nikam zapisovat, pokaždé ale sleduje jeho zamýšlené zápisy do jednoho
určitého pole. QED
Z tvrzení (b) předchozího lemmatu bezprostředně vyplývá inkluze LOG ⊆ P.
Lze dokázat, že platí také P ⊆ PSPACE. Ve větě 2.3.3 ale budeme tvrdit víc.
Vezměme nyní znovu v úvahu úlohy Sat a QBF jako typické zástupce úloh,
u kterých nevíme, zda jsou rozhodnutelné polynomiálním algoritmem, a všimněme
si určitého rozdílu mezi nimi. Když výroková formule A obsahuje ne úplně malý
počet výrokových atomů, může být velmi obtížné nalézt pravdivostní ohodnocení,
které ji splňuje. Je-li ale takové ohodnocení nalezeno a uschováno, snadno lze
kdykoliv později ověřit, že formule A je opravdu splnitelnou výrokovou formulí
— pro určování, zda dané ohodnocení splňuje danou výrokovou formuli, máme
polynomiální algoritmus. Na druhé straně, není vidět žádný snadný způsob, který
by umožnil ověřit, že dané pravdivostní ohodnocení splňuje danou kvantiﬁkovanou
výrokovou formuli, pokud jsme to už jednou zjistili. Pokud jsme to už jednou zjistili
a pak o tom zapochybujeme, asi nezbývá než to pracně zjistit znovu.
Obecněji řečeno, některé množiny (úlohy) A mají tu vlastnost, že platí-li pro
nějaké x, že x ∈ A, můžeme si poznamenat krátká data w, která nám umožňují
kdykoliv později rychle přesvědčit sama sebe nebo kohokoliv jiného, že opravdu
platí x ∈ A. V případě splnitelných výrokových formulí lze krátká data deﬁnovat
jako pravdivostní ohodnocení splňující danou formuli, v případě všech neorientovaných
grafů obsahujících nezávislou množinu velikosti k lze krátká data deﬁnovat
jako nezávislou množinu velikosti k, v případě množiny všech složených čísel (tj.
přirozených čísel, která nejsou prvočísly) lze krátká data deﬁnovat jako číslo, které
je dělitelem daného přirozeného čísla. U úlohy QBF není vidět, jak deﬁnovat krátká
data, a není tudíž jasné, zda úloha QBF patří do téže kategorie jako úlohy Sat,
Nezávislá množina či množina všech složených přirozených čísel. U úlohy Taut
by nás mohlo napadnout, že krátká data lze deﬁnovat jako důkaz dané formule
ve vhodně zvoleném kalkulu. Tento nápad ale (asi) nefunguje, neboť v kapitole 1
se nám (pro tam uvažované kalkuly) nepodařilo zjistit, že každá tautologie A má
krátký důkaz (vzhledem k délce formule A).
Úlohy jako je Sat a Nezávislá množina jsou úlohy s efektivní veriﬁkovatelností
pozitivních instancí. Rozdíl mezi takovými úlohami na jedné straně a úlohou QBF
(případně Taut) na straně druhé lze vyjádřit pomocí nedeterministických programů
a výpočtů.
Nedeterministické programy v jazyce RASP lze deﬁnovat více způsoby. Rozhodněme
se pro tento: u instrukce jmp se připouští více argumentů. To znamená,
že kromě zápisu jmp arg , který se jako jediný připouštěl v oddílu 2.1, jsou v nedeterministických
programech přípustné zápisy tvaru
jmp arg 1 ,. ., arg n .
2.3 Pár slov o výpočtové složitosti 123
Dojde-li na provedení takovéto instrukce, program pokračuje tak, jako kdyby byla
provedena některá z instrukcí jmp arg 1 až jmp arg n . Říkáme, že program
nedeterministicky volí jedno z n možných pokračování. Také se říká, že program
provádí nedeterministický krok. Program v jazyce RASP je deterministický, jestliže
všechny v něm se vyskytující instrukce jmp mají právě jeden argument. Řekneme,
že nedeterministický program se dopočítá při zpracování vstupu x, jestliže, začne-li
pracovat se vstupem x na vstupní pásce, dospěje k rozsvícení některého signálního
světla při každé volbě nedeterministických pokračování. Program se tedy zacyklí
při zpracování vstupu x, dají-li se nedeterministické kroky volit tak, aby činnost
programu probíhala donekonečna. Pro daný program může existovat více výpočtů
z téhož vstupu x. Stejně jako vždy jindy, uznáváme pouze úspěšné výpočty, tj. takové,
na jejichž konci dojde k zastavení počítače a k rozsvícení některého signálního
světla.
Řekneme, že nedeterministický program P rozhoduje úlohu A, jestliže platí, že
(i) program P se dopočítá na každém vstupu x, (ii) platí-li x ∈ A, pak některý
výpočet programu P končí odpovědí ANO, a (iii) platí-li x /∈ A, pak všechny
výpočty programu P končí odpovědí NE.
Řekneme, že nedeterministický program P pracuje v čase f, jestliže pro každé n
platí, že při zpracování libovolného vstupu délky nejvýše n program P provede při
každé volbě nedeterministických pokračování nejvýše f(n) kroků, a pak se zastaví.
Každý výpočet ze vstupu délky nejvýše n má tedy nejvýše f(n) + 1 konﬁgurací.
Program P pracuje v prostoru f, jestliže se dopočítá na každém vstupu x a jestliže
navíc při každém výpočtu ze vstupu x délky nejvýše n má obsazená paměť velikost
nejvýše f(n).
Rozmysleme si, jak může vypadat nedeterministický program pro úlohu Sat a
jaké jsou jeho časové nároky. Program začne svou práci tak, že zkontroluje formát
dané formule A a uloží ji do volné paměti za koncem programu. Program dále určí
seznam ai1 , . . , air všech výrokových atomů vyskytujících se ve formuli A a za zápis
formule A uloží do paměti počítače datovou strukturu tvaru
... r i1 0 i2 0 ... ir 0 ... ,
tj. zápis pravdivostního ohodnocení v, které všem výrokovým atomům formule A
přiřazuje nuly. Tato část programu je deterministická a je úplně stejná jako v případě
deterministického programu pro úlohu Sat z oddílu 2.1. Má-li vstupní formule
A délku nejvýše n, na dosavadní činnost stačí čas O(n2
). Náš program dále
projde zápis ohodnocení v, zvolí si nedeterministicky některé nuly a přepíše je
na jedničky. To může udělat například tak, jak je naznačeno na obrázku 2.3.2.
Fragment programu na obrázku 2.3.2 předpokládá, že ukazatel X byl nasměrován
na začátek záznamu v, tj. na buňku obsahující počet r atomů. Tato část programu
je nedeterministická, je na ni potřeba čas O(n) a po jejím provedení má program
v paměti uloženu formuli A a nějaké pravdivostní ohodnocení v. Program dále
pokračuje (deterministicky) stejně jako program pro rozhodování úlohy Pravdivostní
hodnota výrokové formule: určí pravdivostní hodnotu formule A při
124 2 Algoritmy a úlohy
mov @(X),-@(SP) ; Počet atomů
loop gt ; Dokud zbývají
add #2,X ; Následující atom
jmp YES,NO ; Zvol nedeterministicky
YES: mov #1,@(X) ; jedničku
NO: ; nebo nulu
sub #1,@(SP) ; Další atom?
endloop ; Opakuj, když gt
add #1,SP ; Srovnej zásobník
Obrázek 2.3.2: Nedeterministická volba pravdivostního ohodnocení
ohodnocení v a řekne ANO nebo NE podle toho, je-li formule A ohodnocením v
splněna nebo nesplněna. Na to mu opět stačí čas O(n2
). Je zřejmé, že je-li formule
A splnitelná, pak je možné zvolit ohodnocení v, které ji splňuje, a existuje tedy
výpočet, po jehož provedení program řekne ANO. Není-li A splnitelná, všechny výpočty
končí odpovědí NE. Všechny výpočty mají délku O(n2
). Úloha Sat je tedy
rozhodnutelná nedeterministickým programem, který pracuje v čase O(n2
).
Mezi dvěma algoritmy, které máme k dispozici pro rozhodování úlohy Sat,
deterministickým a nedeterministickým, tedy existuje obrovský rozdíl v časových
nárocích. Zdůrazněme ale, že pro nedeterministické algoritmy platí totéž, co jsme
dříve řekli o rekurzívně spočetných množinách a přijímatelnosti úloh: jde o teoretický
prostředek ke klasiﬁkaci úloh. Nedeterministické algoritmy rozhodně nelze
považovat za vynález, který v programátorské praxi může zrychlit výpočty.
Dovolíme-li si nedeterministické kroky, lze nejen zkrátit čas nutný k výpočtu,
ale i ušetřit paměťový prostor. Zdá se ale, že rozdíl v prostorových nárocích mezi
deterministickými a nedeterministickými programy není tak propastný jako v případě
časových nároků. Ukažme si, že úlohu Dosažitelnost, o které víme, že je
v SPACE( 2
), lze nedeterministickým programem rozhodovat v prostoru :
Přijmi data G, R, c a d. Urči počet n vrcholů grafu G, R . Polož x := c.
Opakuj (n − 1)-krát toto:
– platí-li x = d, řekni ANO a skonči.
– nevycházejí-li z x žádné hrany, řekni NE a skonči.
– zvol nedeterministicky y takové, že [x, y] je hrana, a polož x := y.
Řekni ANO, když x = d, jinak řekni NE.
Tento program nedeterministicky volí sled délky n začínající ve vrcholu c. ANO
řekne tehdy, když na konci sledu nebo někdy dříve dospěje k vrcholu d. NE řekne
tehdy, když nenarazí na vrchol d nebo když se mu nepodaří zvolit tak dlouhý sled.
Je zřejmé, že z vrcholu c vede sled do vrcholu d právě tehdy, když program může
říci ANO, tj. když existuje jeho výpočet ze vstupů G, R, c a d, který končí odpovědí
ANO. Program tedy rozhoduje úlohu Dosažitelnost. Jediná data programu
2.3 Pár slov o výpočtové složitosti 125
jsou proměnné x a y pro vrcholy grafu a interní řídící proměnná cyklu. Má-li celý
vstup délku n a reprezentujeme-li opět vrchol grafu pozicí jeho nejlevějšího znaku
na vstupní pásce, x i y jsou data velikosti O( (n)). Na zápis řídící proměnné cyklu
také stačí O( (n)) bitů.
Nechť NTIME(f) je třída všech úloh, které jsou rozhodnutelné nedeterministickým
programem, který pracuje v čase f, a nechť NSPACE(f) je třída všech úloh,
které jsou rozhodnutelné nedeterministickým program, který pracuje v prostoru f.
Dále označme
NLOG = NSPACE( ), NP =
c∈N
NTIME(nc
), NPSPACE =
c∈N
NSPACE(nc
).
Třídy NLOG, NP a NPSPACE jsou třídy všech úloh rozhodnutelných v nedeterministickém
logaritmickém prostoru, v nedeterministickém polynomiálním čase resp.
v nedeterministickém polynomiálním prostoru. Zatím víme, že Sat ∈ NTIME(n2
),
tedy Sat ∈ NP. Dále víme, že Dosažitelnost je úloha v NLOG.
Je zřejmé, že inkluze TIME(f) ⊆ NTIME(f) a SPACE(f) ⊆ NSPACE(f) platí
pro každou funkci f. Platí tedy LOG ⊆ NLOG, P ⊆ NP a PSPACE ⊆ NPSPACE.
Lemma 2.3.2 Ke každému (deterministickému nebo nedeterministickému) programu
P existuje konstanta c taková, že když program P provede k kroků, pak
◦ v každé paměťové buňce je číslo, jehož binární zápis má nejvýše k + c bitů,
◦ nejvýše k + c paměťových buněk má nenulový obsah,
◦ každá paměťová buňka s nenulovým obsahem má adresu menší než 2k+c
.
Důkaz První tvrzení lze snadno dokázat indukcí podle k. Když po provedení
k kroků mají zápisy všech čísel v paměti počítače nejvýše i bitů, pak po provedení
instrukce add nebo sub mají nejvýše i+1 bitů. Po provedení jakékoliv jiné instrukce
mají stále nejvýše i bitů.
Má-li paměťová buňka s adresou a nenulový obsah, mohl do ní tento obsah být uložen
například provedením instrukce mov . .,@(X). V tom případě je číslo a obsahem
buňky X a podle již dokázaného tvrzení platí a < 2k+c
. Není-li do paměťové buňky
s adresou a její nenulový obsah uložen provedením instrukce se vzdáleným operandem,
musel tam být uložen provedením instrukce s běžným operandem nebo tam
byl uložen již překladačem. V obou případech je číslo a omezeno délkou programu.
QED
Věta 2.3.3 (a) NLOG ⊆ P.
(b) NPSPACE ⊆ PSPACE.
(c) NP ⊆ NPSPACE.
Důkaz Úvahy ve všech třech případech jsou z velké části společné. Nechť P je
nedeterministický program, který rozhoduje určitou úlohu a pracuje v prostoru q.
Předpokládejme, že program nic nezapisuje na výstupní pásku a že výstupy ANO
126 2 Algoritmy a úlohy
a NE dává najevo rozsvícením zeleného nebo červeného signálního světla. Každá
konﬁgurace, ve které se program P může při zpracování libovolného vstupu délky
nejvýše n ocitnout, je slovem v předem pevně zvolené abecedě Σ, které má délku
nejvýše q(n). Přitom abecedu Σ jsme v oddílu 2.1 zvolili tak, že má 4 znaky. Nechť
x je vstup programu P délky n. Deﬁnujme orientovaný graf Gx, Rx . Množina Gx
je množina všech slov v abecedě Σ, která mají délku nejvýše q(n). Ze slova C
vede hrana do slova D (tj. dvojice [C, D] je v Rx), jestliže C a D jsou konﬁgurace
takové, že je-li program P v konﬁguraci C a na vstupní pásce je slovo x, program P
může provedením jednoho kroku přejít do konﬁgurace D. Protože program P je
nedeterministický, ke konﬁguraci C může existovat více konﬁgurací D takových,
že [C, D] ∈ Rx. V grafu Gx, Rx je jedna počáteční konﬁgurace a větší počet koncových
konﬁgurací. Deﬁnujme, že koncová konﬁgurace je pozitivní nebo negativní
podle toho, říká-li v ní program ANO či NE, tj. podle toho, je-li v ní rozsvíceno
zelené nebo červené signální světlo. Je jasné, že program P při zpracování vstupu x
může říci ANO právě tehdy, když v grafu Gx, Rx vede cesta z počáteční konﬁgurace
do některé pozitivní koncové konﬁgurace. Pro určování, zda z počáteční
konﬁgurace vede cesta do dané pozitivní koncové konﬁgurace, máme k dispozici
dva algoritmy, z nichž jeden pracuje v polynomiálním čase, druhý v prostoru O( 2
).
Určování, zda z počáteční konﬁgurace vede cesta do některé pozitivní koncové konﬁgurace,
neznamená žádné (podstatně) větší nároky na čas ani na prostor. Označme
h funkci, která graf Gx, Rx přepracuje na ANO, pokud v grafu Gx, Rx vede
cesta z počáteční konﬁgurace do některé pozitivní koncové konﬁgurace, a na NE
v ostatních případech. Zatím víme, že funkce h je současně v FP a v FSPACE( 2
).
Označme g funkci, která vstup x programu P přepracuje na graf Gx, Rx , a uvažujme
o programu P1, který počítá funkci g.
Program P1 nejprve stanoví délku n vstupu x, vypočítá číslo q(n) (o počitatelnosti
funkce q se ještě zmíníme) a zapíše na výstupní pásku seznam C0, . . , Cm všech
slov v abecedě Σ, která mají délku nejvýše q(n). Pak prochází seznam C0, . . , Cm,
o každém slově Ci zjistí, je-li konﬁgurací, a pokud ano, zapíše na výstupní pásku
seznam všech dvojic [Ci, D] takových, že [Ci, D] ∈ Rx. Platí-li [Ci, D] ∈ Rx, konﬁgurace
D se s konﬁgurací Ci shoduje v obsahu všech paměťových buněk až na
nejvýše tři a vytvoření konﬁgurace D z konﬁgurace Ci má blízko k okopírování
konﬁgurace Ci. Také vytvoření seznamu všech dvojic [Ci, D], kde [Ci, D] ∈ Rx, je
do značné míry kopírováním obsahu určitých paměťových buněk do jiného místa
paměti. To znamená, že na vytvoření grafu Gx, Rx program P1 vystačí s několika
ukazateli do výstupní pásky. Všech možných konﬁgurací délky q(n) je méně
než 4q(n)+1
, prvků množiny Rx je méně než 42(q(n)+1)
, čili 2O(q(n))
, délka zápisu
grafu Gx, Rx je také 2O(q(n))
. V každém z několika ukazatelů do výstupní pásky
se tedy může ocitnout číslo, jehož zápis má nejvýše O(q(n)) bitů. Program P1 tedy
pracuje v prostoru O(q).
V případě (a) platí q ∈ O( ), o funkci q lze předpokládat, že je počitatelná v prostoru
O(q), program P1 tedy pracuje v prostoru O(q), čili v prostoru O( ), a
platí g ∈ FLOG. Z 2.3.1(b) plyne g ∈ FP, z 2.3.1(a) plyne h ◦ g ∈ FP.
2.3 Pár slov o výpočtové složitosti 127
V případě (b) lze předpokládat, že q je polynom, což je funkce, kterou lze počítat
v polynomiálním prostoru. Program P1 tedy pracuje v polynomiálním prostoru
a platí g ∈ c∈N FSPACE(nc
). Tentokrát nemůžeme bezprostředně využít
žádné z našich předchozích tvrzení. Důkaz lemmatu 2.3.1(c) lze ale modiﬁkovat
na důkaz tohoto tvrzení: když h ∈ FSPACE( 2
) a g ∈ c∈N FSPACE(nc
),
pak h ◦ g ∈ c∈N FSPACE(nc
). Důkaz tohoto tvrzení a podrobnosti vynechané
v předchozích úvahách ponecháváme na čtenáři.
V případě (c) máme nedeterministický program P, který pracuje v čase p, kde p
je polynom. Při naší deﬁnici konﬁgurace v tomto případě není pravda, že každá
konﬁgurace má délku polynomiální v n. Deﬁnujme ale modiﬁkovanou konﬁguraci
jako slovo tvaru
d1d2d3d4b[a1:c1][a2:c2] . . [ak:ck], (∗)
kde slovo b udává hodnotu čítače instrukcí a každé ze slov ci udává obsah paměťové
buňky, jejíž adresu udává slovo ai. O ostatních paměťových buňkách (jiných
než a1, . . , ak) se rozumí, že obsahují nuly. Modiﬁkovaná konﬁgurace je tedy slovem
v abecedě {-, 0, 1, [, ], :}. Je-li C modiﬁkovaná konﬁgurace tvaru (∗), pak
lemma 2.3.2 říká, že délka zápisu každého z čísel ai a ci i jejich počet k je omezen
funkcí v O(p(n)). Celková délka slova C je omezena funkcí q, kde q ∈ O(p2
(n)),
neboli je omezena polynomem. Graf Gx, Rx nyní obsahuje modiﬁkované konﬁgurace.
Další úvahy jsou úplně stejné jako v případě (b). QED
Tvrzení (b) předchozí věty je zvláštním případem obecnějšího tvrzení známého
jako Savitchova věta: když funkce q splňuje jisté nepříliš omezující předpoklady,
pak NSPACE(q) ⊆ SPACE(q2
).
Z věty 2.3.3 plyne, že platí PSPACE = NPSPACE a navíc že pro dosud uvažované
třídy úloh platí inkluze
LOG ⊆ NLOG ⊆ P ⊆ NP ⊆ PSPACE.
O žádné z těchto čtyř inkluzí se dosud nepodařilo zjistit, zda je ostrá, ačkoliv
odborníci odhadují, že ostré jsou všechny čtyři. C. Papadimitriou píše v [62], že
tato situace je zdrojem značné frustrace. Je přitom známo, že NLOG = PSPACE,
takže můžeme s jistotou říci, že ze čtyř inkluzí je ostrá alespoň některá. Otázka, zda
platí P = NP, je dnes považována za jeden z nejdůležitějších otevřených problémů
teoretické informatiky (a logiky, a matematiky vůbec).
Řekneme, že úloha A je na úlohu B převeditelná logaritmickým převodem, a
píšeme A ≤log
m B, existuje-li funkce g ∈ FLOG taková, že ∀x(x ∈ A ⇔ g(x) ∈ B).
Relace ≤log
m je reﬂexivní, a z lemmatu 2.3.1(c) plyne, že je i tranzitivní. Uvidíme,
že relace ≤log
m má i další společné vlastnosti s relací ≤m z oddílu 2.2. Nebude-li hrozit
nedorozumění, budeme místo o převeditelnosti logaritmickým převodem mluvit
prostě jen o převeditelnosti. Ukažme si několik typických příkladů na převeditelnost
logaritmickým převodem.
Příklad 2.3.4 Jsou-li všechny výrokové atomy výrokové formule A mezi p1, . . , pn,
pak A je splnitelná, právě když kvantiﬁkovaná výroková formule ∃p1 . . ∃pnA je
128 2 Algoritmy a úlohy
splněna kterýmkoliv pravdivostním ohodnocením. Na ověření, zda A je výrokovou
formulí, a na sestavení seznamu všech atomů, které se v ní se vyskytují,
stačí logaritmický prostor. To znamená, že deﬁnujeme-li g(A) jako ∃p1 . . ∃pnA a
dodeﬁnujeme-li funkci g vhodně i na argumentech, které nejsou výrokovými formulemi,
máme logaritmický převod úlohy Sat na úlohu QBF. Z analogických
důvodů platí i Taut ≤log
m QBF, místo existenčních se použijí univerzální výrokové
kvantiﬁkátory.
Příklad 2.3.5 Když A je kvantiﬁkovaná výroková formule a e je pravdivostní
ohodnocení, pak e |= A ⇔ e /|= ¬A, tedy
[A, e] ∈ QBF ⇔ [¬A, e] /∈ QBF.
Ověření, zda A je kvantiﬁkovaná formule a e je pravdivostní ohodnocení, a pak připsání
negace je proveditelné v logaritmickém prostoru. Platí tedy QBF ≤log
m QBF,
úloha QBF je převeditelná na vlastní komplement. Z analogických důvodů platí
Sat ≤log
m Taut a Taut ≤log
m Sat. O žádné z úloh Sat a Taut ale není známo,
je-li převeditelná na vlastní komplement.
Příklad 2.3.6 Ukážeme, že platí Sat ≤log
m 3Sat. Nechť A je daná výroková formule.
Přiřaďme každé neatomické podformuli B formule A výrokový atom qB tak,
aby takto přiřazené atomy byly navzájem různé a různé od všech atomů formule A.
To lze udělat třeba tak, že stanovíme maximální m takové, že atom pm se vyskytuje
v A, a atom qB pak deﬁnujeme jako pm+1+i, kde i je pozice nejlevějšího znaku nejlevějšího
výskytu podformule B na vstupní pásce. Dále pro atomickou podformuli B
formule A deﬁnujme atom qB jako B. Tím je atom qB přiřazen každé podformuli B
formule A, atomické i neatomické. Podle toho, je-li neatomická podformule B tvaru
C&D, C∨D, C→D nebo ¬C, jí přiřaďme dvě nebo tři klauzule podle této tabulky:
C & D ¬qC ∨ ¬qD ∨ qB ¬qB ∨ qC ¬qB ∨ qD
C ∨ D ¬qC ∨ qB ¬qD ∨ qB ¬qB ∨ qC ∨ qD
C → D qC ∨ qB ¬qD ∨ qB ¬qB ∨ ¬qC ∨ qD
¬C qC ∨ qB ¬qB ∨ ¬qC.
Význam klauzulí se trochu ozřejmí, přepíšeme-li si je bez negací, pomocí implikací
(například v prvním řádku vlastně jsou implikace qC &qD →qB, qB →qC a qB →qD).
Označme A konjunkci všech klauzulí takto přidělených neatomickým podformulím
formule A. Tvrdíme, že je-li v pravdivostní ohodnocení takové, že v(A ) = 1, a je-li
B podformule formule A, pak v(B) = v(qB). Toto pomocné tvrzení lze snadno dokázat
indukcí dle složitosti formule B. Dále tvrdíme, že jsou-li v a v pravdivostní
ohodnocení taková, že pro každou podformuli B formule A platí v (qB) = v(B),
pak v (A ) = 1. I toto pomocné tvrzení lze snadno dokázat; indukcí podle složitosti
formule B lze ověřit, že v splňuje všechny klauzule přiřazené formuli B.
Když pro nějaké pravdivostní ohodnocení v platí v(qA & A ) = 1, pak z prvního
pomocného tvrzení plyne, že platí i v(A) = 1. Když naopak v(A) = 1, můžeme
2.3 Pár slov o výpočtové složitosti 129
ohodnocení v změnit na ohodnocení v splňující v (qB) = v(B) pro každou podformuli
B; díky druhému pomocnému tvrzení pak platí v (qA &A ) = 1. Formule A je
tedy splnitelná právě tehdy, když je formule qA & A splnitelná. Formule qA & A
je v konjunktivním normálním tvaru a lze si rozmyslet, že může být z formule A
získána algoritmem pracujícím v logaritmickém prostoru. Funkce A → qA & A je
tedy logaritmickým převodem úlohy Sat na úlohu 3Sat.
¬p ¬q ¬r ¬s
p q r s
' E
E '
d
d
d
dd
 
 
 
  © 
 
 
  
d
d
d
dds
rrj
rr
Obrázek 2.3.3: Převod úlohy 2Sat . . .
Příklad 2.3.7 Rozmyslíme si, že platí 2Sat ≤log
m Dosažitelnost. Máme sestrojit
funkci g počitatelnou v logaritmickém prostoru, která pro každý vstup A splňuje
podmínku, že A je výroková formule v konjunktivním normálním tvaru s klauzulemi
nejvýše dvouprvkovými, právě když g(A) není tvaru G, R, c, d , kde G, R je
orientovaný graf, v němž z c vede cesta do d. Nechť tedy A je daný vstup funkce g.
Z obvyklých důvodů můžeme předpokládat, že A je formule v konjunktivním normálním
tvaru s klauzulemi nejvýše dvouprvkovými (splnitelná nebo nesplnitelná).
Nejprve z formule A sestrojíme pomocný graf H, Q . Potom, vhodným pospojováním
několika kopií grafu H, Q a dvou dodatečných vrcholů c a d, sestrojíme
graf G, R , v němž z c vede cesta do d právě tehdy, když formule A není splnitelná.
Nechť p1, . . , pn je seznam všech atomů formule A. V grafu H, Q bude 2n
vrcholů, jeden pro každý z literálů p1, . . , pn a ¬p1, . . , ¬pn. Je-li a literál, nechť a
označuje literál opačný k a (tj. ten, který vznikne z a odstraněním negace, pokud a
je negovaný atom, a přidáním negace, pokud není). Relace Q obsahuje dva prvky
pro každou klauzuli a∨b formule A, totiž [a, b] a [b, a]. Přitom jednočlenná klauzule
a se považuje za disjunkci a ∨ a a je jí přidělena hrana [a, a]. Graf H, Q příslušný
například k formuli
(¬p ∨ q) & (¬q ∨ ¬r) & (r ∨ ¬s) & (s ∨ ¬q) & (q ∨ p)
je na obrázku 2.3.3. Všimněme si, že v grafu H, Q vede cesta z a do b, právě
když v něm vede cesta z b do a. Tvrdíme, že formule A je nesplnitelná, právě
když pro některý literál a v grafu H, Q současně existují cesty z a do a i z a
do a. Ukažme si stručně, jak se dokáže implikace ⇒ tohoto pomocného tvrzení.
Nechť neexistuje literál a takový, že současně a je dosažitelný z a a a je dosažitelný
z a. Proberme postupně všechny literály formule A (v nějakém zvoleném
pořadí). Nechť a je literál, kterému dosud nebyla přiřazena pravdivostní hodnota.
130 2 Algoritmy a úlohy
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
q q q q
r rc d
c
c
c
c
ffxttE
¡¡!
T
T
T
T
Obrázek 2.3.4: . . . na komplement úlohy Dosažitelnost
Je-li a v grafu H, Q dosažitelný z a, volme v(a) = 1 a v(a) = 0. Je-li naopak
a dosažitelný z a, volme v(a) = 0 a v(a) = 1. Neplatí-li ani jedno, přiřaďme
literálu a libovolnou pravdivostní hodnotu a literálu a ovšem přiřaďme opačnou
pravdivostní hodnotu. Dále pro každý literál b, který je v grafu H, Q dosažitelný
z toho literálu z dvojice a a a, jemuž jsme přiřadili jedničku, položme
v(b) = 1 a v(b) = 0. To automaticky znamená, že pro každý literál b, z něhož
je dosažitelný ten z dvojice a a a, kterému jsme přiřadili nulu, platí v(b) = 0
a v(b) = 1. Ponecháváme na čtenáři, aby domyslel, že tímto postupem je korektně
deﬁnováno pravdivostní ohodnocení a že je to pravdivostní ohodnocení, které splňuje
formuli A. Důkaz implikace ⇐ pomocného tvrzení také ponecháváme na čte-
náři.
Vezměme nyní 2n kopií grafu H, Q a uspořádejme je do n řádků a dvou sloupců
tak, jak je naznačeno na obrázku 2.3.4, a přidejme dále dva dodatečné vrcholy c a d.
Z vrcholu c vede n hran, přičemž i-tá vede do i-tého řádku, a sice do literálu pi
v levé kopii grafu H, Q . V i-tém řádku je dále hrana směřující z literálu ¬pi v levé
kopii grafu H, Q do téhož literálu ¬pi v pravé kopii a pak je tam hrana směřující
z literálu pi v pravé kopii do vrcholu d. Tím je deﬁnován graf G, R . Je zřejmé, že
vrchol d je v grafu G, R dosažitelný z vrcholu c právě tehdy, když pro některé i
je v grafu H, Q současně ¬pi dosažitelný z pi a pi dosažitelný z ¬pi, a to je právě
tehdy, když formule A není splnitelná. Funkce A → g(A) tedy má požadované
vlastnosti.
Lemma 2.3.8 Nechť Γ je libovolná z tříd LOG, NLOG, P, NP nebo PSPACE.
Když A ≤log
m B a B ∈ Γ, pak i A ∈ Γ.
2.3 Pár slov o výpočtové složitosti 131
Důkaz Pro Γ = LOG a Γ = P toto tvrzení plyne bezprostředně z lemmatu 2.3.1.
Zbývající úvahy jsou podobné postupům z důkazů lemmatu 2.3.1 a věty 2.3.3. QED
Ve výpočtové složitosti tedy platí analogie bodů (b) a (c) lemmatu 2.2.31.
Snadno lze ověřit, že budeme-li ve zbývajících bodech (d)–(f) psát ≤log
m místo ≤m
(a LOG místo OR v bodě (e)), také dostaneme pravdivá tvrzení.
Z příkladu 2.3.7 (a z výpočtově-složitostní analogie tvrzení (d) lemmatu 2.2.31)
víme, že platí 2Sat ≤log
m Dosažitelnost. Platí tedy 2Sat ∈ NLOG. Podobně
z příkladu 2.3.4 plyne Taut ∈ PSPACE.
Nechť Γ je třída úloh. Řekneme, že úloha B je Γ-těžká, platí-li A ≤log
m B pro
každou úlohu A ∈ Γ. Úloha B je Γ-kompletní, je-li Γ-těžká a platí-li navíc B ∈ Γ.
Pojem kompletní úlohy má podobný smysl jako v teorii rekurzívních funkcí.
Dokážeme-li, že nějaká úloha B je Γ-kompletní pro nějakou třídu Γ, je tím řečeno
poměrně deﬁnitivní slovo o její algoritmické složitosti. Zároveň je tím podmíněně
dokázáno, že úloha B není prvkem žádné menší třídy (z těch, které uvažujeme).
Například když B je P-kompletní, znamená to, že B /∈ NLOG, ledaže by platilo
NLOG = P. Dále to znamená, že B /∈ LOG, ledaže by platilo dokonce LOG = P.
Následující věta tvrdí, že Γ-kompletní úlohy existují pro každou z tříd Γ, které uvažujeme
(kromě třídy LOG, pro kterou to smysl nemá).
Věta 2.3.9 Každá z úloh Dosažitelnost, HornSat, Sat a QBF je na své
úrovni kompletní: Dosažitelnost je NLOG-kompletní, HornSat je P-kompletní,
Sat je NP-kompletní, QBF je PSPACE-kompletní.
Tuto důležitou větu ponecháváme bez důkazu, čtenáře odkazujeme na knihy
[62], [77], případně [3] či [52]. Poznamenejme však, že důkazy jsou spíše pracné
než obtížné a že důkaz NLOG-kompletnosti úlohy Dosažitelnost je z větší části
obsažen v důkazu věty 2.3.3(a).
Z věty 2.3.9 plyne například toto: pokud vůbec existuje nějaká úloha v množině
PSPACE − NP, pak QBF je příklad takové úlohy, pokud vůbec existuje nějaká
úloha v NP − P, pak Sat je příklad takové úlohy apod. Nebo jinak, nemá smysl
hledat algoritmus pro úlohu HornSat, který vystačí s logaritmickým prostorem,
ledaže bychom si vytkli úkol dokázat rovnost P = LOG, nemá smysl hledat polynomiální
algoritmus pro úlohu Sat, ledaže bychom chtěli dokázat rovnost NP = P.
Chceme-li o nějaké dané úloze B ∈ NP dokázat, že B je NP-kompletní, stačí dokázat
Sat ≤log
m B. Z příkladu 2.3.6 plyne, že také stačí dokázat 3Sat ≤log
m B.
Protože, jak víme z oddílu 2.2, je množina QBF primitivně rekurzívní, z její
PSPACE-kompletnosti plyne inkluze PSPACE ⊆ PR.
Poslední problematika, o které se chceme v tomto oddílu zmínit, je uzavřenost
tříd úloh na komplement. Je-li Γ kterákoliv z našich pěti tříd, můžeme uvažovat
třídu coΓ všech komplementů úloh z Γ. Je-li ale Γ kterákoliv z tříd LOG,
P a PSPACE, nedává to nic nového, neboť deterministické třídy jsou evidentně
uzavřeny na komplement. Kupodivu ani coNLOG není nic nového, neboť Immermanova-Szelepcsényiho
věta (viz [62] nebo [77]) tvrdí, že i třída NLOG je uzavřena
132 2 Algoritmy a úlohy
na komplement, a že tedy platí coNLOG = NLOG. Z Immermanovy-Szelepcsényiho
věty, z příkladu 2.3.7 a z lemmatu 2.3.8 například plyne, že 2Sat ∈ NLOG. Dále
lze (s užitím cvičení 15) zdůvodnit, že kromě úlohy Dosažitelnost také úlohy
Dosažitelnost, 2Sat a 2Sat jsou NLOG-kompletní.
Ze všech tříd tvaru coΓ, kde Γ je některá z našich pěti tříd, pouze coNP je
(možná) novou třídou, různou od ostatních pěti. Vztah třídy coNP k třídě NP je
podobný jako vztah třídy Π1 k třídě Σ1: úvahou analogickou jako v první části
důkazu lemmatu 2.2.38 lze totiž ověřit, že platí-li mezi třídami NP a coNP některá
inkluze, pak platí dokonce rovnost.
Není známo, zda platí NP = coNP, ale „oﬁciální domněnka zní, že NP a coNP
jsou různé třídy. Z NP = coNP ovšem plyne P = NP. Není také známo, zda ve
výpočtové složitosti platí analogie Postovy věty: NP ∩ coNP = P. Vztahy mezi
třídami P, NP a coNP jsou znázorněny na obrázku 2.3.5. Dosavadní (ne)znalosti
nás nutí počítat s tím, že jak množina (NP − coNP) ∪ (coNP − NP), tak množina
(NP ∩ coNP) − P může být prázdná, a to nezávisle na sobě. Víme pouze, jak jsme
už poznamenali, že NP − coNP = ∅, právě když coNP − NP = ∅.
NP coNP
P
Obrázek 2.3.5: Vztahy mezi třídami P, NP a coNP
Z důvodů stejných jako v teorii rekurzívních funkcí platí, že libovolná úloha je
Γ-kompletní, právě když její komplement je coΓ-kompletní. Tedy Sat je coNP-kompletní
úloha. Uvažme ještě ekvivalence
A ∈ Taut ⇔ ¬A /∈ Sat a A /∈ Sat ⇔ ¬A ∈ Taut.
První říká Taut ≤log
m Sat. Z toho (a z analogie tvrzení 2.3.8 pro třídu coNP)
plyne Taut ∈ coNP. Druhá říká Sat ≤log
m Taut. Úloha Taut je tedy příkladem
coNP-kompletní úlohy.
Fakt, že Taut je coNP-kompletní úloha, poskytuje podmíněnou odpověď na
otázku uvedenou na str. 37, která se týká délek důkazů ve výrokových kalkulech.
Věta 2.3.10 Platí-li NP = coNP, pak neexistuje výrokový kalkulus C a polynom p
tak, že každá tautologie délky nejvýše n má v kalkulu C důkaz délky nejvýše p(n).
Důkaz Nechť kalkulus C a polynom p jsou takové, že každá tautologie A má v kalkulu
C důkaz, jehož délka je nejvýše p(|A|). Pak algoritmus, který každou výrokovou
formuli A zpracuje tak, že nejprve nedeterministicky vygeneruje důkaz P délky
2.3 Pár slov o výpočtové složitosti 133
nejvýše p(|A|) a pak ověří, že P je opravdu důkazem formule A v kalkulu C, je korektním
(nedeterministickým) algoritmem, který rozhoduje úlohu Taut v polynomiálním
čase. Platí tedy Taut ∈ NP. Vzhledem ke coNP-kompletnosti úlohy Taut
platí také coNP ⊆ NP, a tedy coNP = NP. To je spor s předpokladem coNP = NP.
QED
Vidíme tedy, že navrhnout efektivní výrokový kalkulus, ve kterém každá tautologie
má důkaz polynomiální délky, znamená dokázat zároveň nepravděpodobný
výsledek ve výpočtové složitosti, totiž že coNP = NP.
Pojem Γ-kompletní úlohy byl nejprve studován pro Γ = NP. Průkopnickými
pracemi o NP-kompletnosti jsou Cookovy a Karpovy články [13] a [46]. Čtenářově
pozornosti doporučujeme také knihu [24]. Ta je důležitá tím, že obsahuje seznam
několika stovek úloh z různých oblastí matematiky, které jsou NP-kompletní. O
P-kompletních úlohách si lze přečíst v [44].
Cvičení
1. Zdůvodněte, že Násobení lze počítat v logaritmickém prostoru.
Návod. Obrázek 2.3.6 naznačuje školní algoritmus pro násobení přirozených
čísel modiﬁkovaný pro případ, kdy čísla se zapisují binárně. Na tomto algoritmu
lze založit program, tabulku umístěnou mezi dvěma vodorovnými čarami
ale není nutné uchovávat v paměti počítače celou najednou. Spokojte se s programem,
který číslice výsledku zapíše na výstupní pásku v obráceném pořadí,
tj. od nejnižšího řádu počínaje. Správného pořadí číslic by se dalo dosáhnout
například užitím (modiﬁkací důkazu) lemmatu 2.3.1(c).
2. Zdůvodněte, že úloha DNFSat je rozhodnutelná algoritmem, který pracuje
v polynomiálním čase a logaritmickém prostoru.
3. Každou výrokovou formuli lze převést na ekvivalentní formuli v disjunktivním
normálním tvaru, o formuli v disjunktivním normálním tvaru lze díky předchozímu
cvičení rychle rozhodnout, je-li splnitelná; to dohromady dává polynomiální
algoritmus pro úlohu Sat. Vysvětlete podrobně, proč tato úvaha není
správná.
1 0 1 1 1 0
1 0 1 1
1 0 1 1 1 0
1 0 1 1 1 0
0 0 0 0 0 0
1 0 1 1 1 0
1 1 1 1 1 1 0 1 0
Obrázek 2.3.6: Školní algoritmus pro násobení
134 2 Algoritmy a úlohy
4. Zdůvodněte, že jak úloha Hodnota booleovského výrazu, tak úloha Pravdivostní
hodnota výrokové formule je rozhodnutelná v logaritmickém
prostoru.
Návod. Navrhněte algoritmus, který postupuje tak, že má-li zjistit pravdivostní
hodnotu podformule B & C, B ∨ C či B → C dané formule A při daném ohodnocení
v, zjistí v(B), a hodnotu v(C) zjišťuje pouze tehdy, když je to nutné
(např. pokud u formule tvaru B & C vyšlo, že v(B) = 0, není už nutné zjišťovat
v(C), platí totiž v(B & C) = 0). Algoritmus si nemusí pamatovat dříve
určené pravdivostní hodnoty. Když například v nějakém stadiu výpočtu určil
v(C) ve formuli B & C, je jasné, že předtím vyšlo v(B) = 1, jinak by nebylo
došlo na zjišťování hodnoty v(C).
5. Nechť A je výroková formule v konjunktivním normálním tvaru, nechť p je atom
takový, že v žádné klauzuli formule A se nevyskytuje současně p i ¬p. Pišme
formuli A v tvaru
(B1 ∨ p) & . . & (Bn ∨ p) & (C1 ∨ ¬p) & . . & (Cm ∨ ¬p) & D1 & . . & Dk,
kde klauzule Bi, Cj a Dl neobsahují p. Jinými slovy, rozdělme klauzule formule
A na klauzule obsahující p, klauzule obsahující ¬p a klauzule neobsahující
p ani ¬p. Utvořme z formule A formuli A :
i,j
(Bi ∨ Cj) &
l
Dl.
Zdůvodněte, že A je splnitelná, právě když A je splnitelná. Musí být formule
A a A ekvivalentní?
6. Navrhněte na základě předchozího cvičení algoritmus, který rozhoduje úlohu
CNFSat. Je váš algoritmus polynomiálním algoritmem?
7. Zdůvodněte, že je-li formule A v cvičení 5 hornovská, pak i A je hornovská.
Dále zdůvodněte, že je-li hornovská formule nesplnitelná, pak obsahuje klauzuli
sestávající z jediného pozitivního literálu. Na základě toho navrhněte polynomiální
algoritmus pro úlohu HornSat.
8. Zdůvodněte, že na základě cvičení 5 lze navrhnout i polynomiální algoritmus
pro úlohu 2Sat.
9. V rezolučním výrokovém kalkulu se nepřipouštějí konjunkce, disjunkce ani implikace;
jediná operace s formulemi je operace a → a, která z negativního
literálu odstraní negaci resp. k pozitivnímu literálu připíše negaci. Klauzule
se deﬁnuje jako množina literálů, formulím v konjunktivním normálním tvaru
odpovídají množiny klauzulí, tj. množiny množin literálů. Pravdivostní ohodnocení
v splňuje klauzuli, jestliže splňuje některý její prvek; množina klauzulí
je splnitelná, jestliže existuje ohodnocení v, které splňuje všechny její prvky.
2.3 Pár slov o výpočtové složitosti 135
Prázdná množina klauzulí je splnitelná, prázdná klauzule je jediná klauzule,
která není splnitelná. Pravidlo rezoluce je pravidlo
C ∪ {a} , D ∪ {a} / C ∪ D,
kde C a D jsou klauzule. Rezoluční odvození z množiny klauzulí Γ je posloupnost
C1, . . , Cn klauzulí taková, že každá Ci je v Γ nebo je z některých klauzulí
Cj a Ck, kde j, k < i, odvozena pravidlem rezoluce. Zdůvodněte užitím cvičení
5, že neprázdná množina Γ klauzulí je nesplnitelná, právě když existuje
rezoluční odvození prázdné klauzule z množiny Γ.
10. Nechť Σ je abeceda a f : Σ∗
→ N. Deﬁnujme Subgraf funkce f jako množinu
Subgraf(f) = { [w, y] ; y ≤ f(w) }.
Dokažte, že f ∈ FP, právě když platí Subgraf(f) ∈ P a současně existuje
polynom p takový, že pro každé slovo w ∈ Σ∗
platí |f(w)| ≤ p(|w|) (kde, jako
obvykle, |w| označuje délku slova w).
Návod. Je-li dáno slovo w, lze začít s intervalem [[0, p(|w|)]] a hodnotu f(w)
nalézt půlením intervalů.
11. Pokud úloha Nezávislá množina je v P, pak existuje polynomiální algoritmus,
který ke každému grafu G, R určí maximální velikost množiny, která je
v grafu G, R nezávislá. Dokažte využitím předchozího cvičení.
12. Když h ∈ FSPACE( 2
) a g ∈ c∈N FSPACE(nc
), pak h◦g ∈ c∈N FSPACE(nc
).
Dokažte.
13. Dokažte, že funkce x → 22x
není v c∈N FSPACE(nc
). Na základě toho zdůvodněte,
že třída c∈N FSPACE(nc
) není uzavřena na substituci.
Návod. Přizpůsobte úvahu z důkazu lemmatu 2.3.1, která se týkala maximálního
počtu různých konﬁgurací, a tudíž maximálního počtu znaků zapsaných
na výstupní pásku.
14. Dokažte podrobně, že úloha Nezávislá množina je ve třídě NP.
15. Zdůvodněte, že platí Dosažitelnost ≤log
m 2Sat.
Návod. Nechť je dán orientovaný graf G, R a jeho dva vrcholy c a d. Přidělme
každému vrcholu a atom pa, přidělme každé hraně [a, b] klauzuli a ∨ b a ke
konstruované formuli ještě přidejme dvě klauzule c a d.
16. Nalezněte jednoduchý převod úlohy CNFSat na úlohu 3Sat.
Návod. Když v dané formuli A je klauzule C tvaru a1 ∨ . . ∨ an, kde n > 3,
zvolte nový atom s a klauzuli C nahraďte dvěma klauzulemi a1 ∨ . . ∨ an−2 ∨ s
a an−1 ∨ an ∨ ¬s.
136 2 Algoritmy a úlohy
17. Zdůvodněte, že Nezávislá množina je NP-kompletní úloha.
Návod. Převádějte úlohu 3Sat. Nechť je dána výroková formule A v konjunktivním
normálním tvaru s nejvýše tříprvkovými klauzulemi. Vrcholy konstruovaného
neorientovaného grafu G, R jsou dvojice tvaru [C, a], kde C je
klauzule formule A a a je v ní se vyskytující literál. Hrany jsou všechny dvojice
tvaru [[C, a], [C, b]] a dále všechny dvojice tvaru [[C, a], [D, a]]. Například graf
příslušný k formuli
(p ∨ ¬r ∨ s) & (¬p ∨ q ∨ ¬s) & (r ∨ ¬q)
je na obrázku 2.3.7. Číslo k (velikost požadované nezávislé množiny) je počet
klauzulí formule A.
r r r r r
r r r







Obrázek 2.3.7: NP-kompletnost úlohy Nezávislá množina
18. Zdůvodněte, že NLOG ⊆ SPACE( 2
).
19. Protože úloha HornSat je v P, je také v TIME(nc
) pro jisté c. Protože všechny
úlohy v P jsou na úlohu HornSat převeditelné, znamená to, že existuje c
takové, že P ⊆ TIME(nc
). Proč tato úvaha není správná?
20. Zdůvodněte, že úloha QBF je PSPACE-kompletní i za následujících omezujících
předpokladů na vstupní formuli Q1p1 . . QnpnB:
◦ formule B je v konjunktivním normálním tvaru a neobsahuje jiné atomy
než p1, . . , pn,
◦ n je sudé, Q1 = ∃ a v posloupnosti Q1, . . , Qn se střídají existenční a
univerzální kvantiﬁkátory.
Návod. V příkladu 2.3.6 jsme k dané výrokové formuli B(p) sestrojili formuli
E(p, q) v konjunktivním normálním tvaru sestavenou z atomů p1, . . , pn
a q1, . . , qm takovou, že pro každé pravdivostní ohodnocení e platí e |= B,
právě když e |= ∃q1 . . ∃qmE. Formuli Q1p1 . . QnpnA lze tedy nahradit formulí
Q1p1 . . Qnpn∃q1 . . ∃qmE. Pak lze přidat jalové kvantiﬁkátory (tj. kvantiﬁkátory
∃r nebo ∀r, kde r je atom různý od všech pi a qj).
3
Predikátová logika
My opinion is simply that a concept can only be logically ﬁxed through its relation
to other concepts. These relations, formulated in precise statements, I call axioms
and I add, that the axioms (. . . ) are the deﬁnitions of the concepts.
(D. Hilbert, citát uveden v [81])
3.1 Formule a sémantika predikátové logiky
3.1.1 Jazyky, termy a formule
Náš výklad o predikátové logice bude po určitou dobu paralelní s výkladem v kapitole
1 o výrokové logice. I tady budeme nejprve mluvit o tom, co jsou (predikátové)
formule, pak o sémantice, která mimo jiné určí, které z formulí jsou logicky
platné (tj. pravdivé za každých okolností), a potom stanovíme logický kalkulus tak,
abychom pro něj byli schopni dokázat větu o úplnosti, která (mimo jiné) tvrdí, že
dokazatelné jsou přesně ty predikátové formule, které jsou logicky platné.
V predikátových formulích (přesněji formulích predikátové logiky prvního řádu)
se mohou vyskytovat symboly několikerého druhu:
• Logické spojky →, ¬, &, ∨.
• Kvantiﬁkátory: univerzální kvantiﬁkátor ∀ a existenční kvantiﬁkátor ∃.
• Závorky ( ).
• Proměnné x, y, u, v, . . . , x0, x1, . . .
• Funkční symboly pro označení operací s objekty. Každému funkčnímu symbolu
F je přiřazeno přirozené číslo n ≥ 0 zvané četnost symbolu F. Například
„+ zpravidla označuje binární funkční symbol, tj. funkční symbol četnosti 2.
Funkční symboly četnosti nula se nazývají konstanty.
• Predikátové symboly (též relační symboly) pro označení vztahů mezi objekty.
Každému predikátovému symbolu P je přiřazeno přirozené číslo n ≥ 1 zvané
četnost symbolu P. Například „∈ zpravidla označuje binární predikátový
symbol, tj. predikátový symbol četnosti 2.
138 3 Predikátová logika
Množinu všech proměnných označme Var a předpokládejme o ní, že je nekonečná
spočetná. Logickým spojkám a kvantiﬁkátorům se říká logické symboly. Funkční
a predikátové symboly se dohromady nazývají mimologické symboly. Kdykoliv budeme
mluvit o formulích, důkazech nebo axiomatické teorii, budeme předpokládat,
že nejprve byla pevně zvolena nebo zadána množina L mimologických symbolů
zvaná jazyk (nějaké teorie). Jazyk je tedy množina L mimologických symbolů
spolu s údajem, který pro každý prvek množiny L určuje, zda je to funkční nebo
predikátový symbol a jaká je jeho četnost.
Jeden ze symbolů, totiž rovnítko „= , si zasluhuje zvláštní zmínku. Nejprve
budeme mluvit o predikátové logice bez rovnosti, ve které se rovnítko považuje za
mimologický symbol, který se může nebo nemůže vyskytovat ve formulích podle
toho, zda byl nebo nebyl přijat do zvoleného jazyka. Později, v predikátové logice
s rovností, se rovnítko bude považovat za logický symbol, který se ve formulích
může vyskytovat, přestože není jmenován mezi prvky jazyka, a kterému sémantika
predikátové logiky s rovností i deﬁnice kalkulů pro predikátovou logiku s rovností
přisuzují zvláštní význam.
Bude-li se to hodit, budeme užívat i symboly , ⊥ a ≡ ve významu z kapitoly 1.
Spojce ≡ v tom případě přisuzujeme nižší prioritu než všem ostatním spojkám.
Deﬁnice 3.1.1 Množina všech termů jazyka L je nejmenší množina výrazů splňující
podmínky
◦ každá proměnná je term (jazyka L),
◦ jsou-li t1, . . , tn termy a F ∈ L je funkční symbol četnosti n, pak F(t1, . . , tn)
je term jazyka L.
Atomická formule jazyka L je každý výraz tvaru P(t1, . . , tn), kde t1, . . , tn jsou
termy jazyka L a P ∈ L je predikátový symbol četnosti n. Množina všech (predikátových)
formulí jazyka L je nejmenší množina výrazů splňující podmínky
◦ každá atomická formule je formule jazyka L,
◦ jsou-li ϕ a ψ formule jazyka L a x je proměnná, pak i výrazy (ϕ→ψ), (ϕ&ψ),
(ϕ ∨ ψ), ¬ϕ, ∀xϕ a ∃xϕ jsou formule jazyka L.
Místo formule jazyka L se také říká formule v jazyce L. V druhé podmínce
v deﬁnici termu se připouští i případ n = 0. To znamená, že každá konstanta
c ∈ L je zároveň termem jazyka L. Formule ∀xϕ a ∃xϕ čteme „pro každé x
(platí) ϕ resp. „existuje x takové, že (platí) ϕ . Často, zejména nepůjde-li nám
právě o algoritmy pracující s formulemi a důkazy, připustíme i zápisy, které ne
zcela vyhovují deﬁnici 3.1.1. Stejně jako ve výrokové logice nebudeme psát úplně
vnější dvojici závorek. Naopak, pokud to pomůže čitelnosti, budeme závorkovat
i výrazy, u kterých to deﬁnice 3.1.1 nepředepisuje, například atomické formule.
Binární symboly, a to jak funkční, tak predikátové, se zpravidla píší mezi operandy,
například x + y nebo (x + y) místo +(x, y), nebo x ∈ y místo ∈(x, y). U binárních
predikátů se často užívá přeškrtnutí místo negace: t = s a t /∈ s jsou zkrácené
zápisy pro ¬(t = s) a ¬(t ∈ s).
3.1 Formule a sémantika predikátové logiky 139
Příklad 3.1.2 Jazyk teorie množin {∈} obsahuje jediný symbol, který je binárním
predikátem. Fakt, že v tomto jazyce nejsou žádné funkční symboly, znamená, že jediné
termy v jazyce teorie množin jsou proměnné. Výrazy x ∈ x nebo ∃x∀y(y ∈ x)
jsou příklady formulí jazyka teorie množin. Uvažujeme-li teorii množin v predikátové
logice s rovností, pak ovšem také ∀v(v ∈ x & x = y → v ∈ y) je příklad
formule jazyka teorie množin.
Příklad 3.1.3 Jazyk teorie grup {+, 0} má binární funkční symbol + a konstantu
0. Výrazy x, x + y a (x + 0) + x jsou příklady termů v jazyce teorie grup.
Jazyk {+, 0} má smysl uvažovat pouze v predikátové logice s rovností, protože
bez alespoň jednoho predikátového symbolu nelze vytvořit žádnou formuli. V tom
případě ∀x∀y(x + y = y + x) a ∃y(y + y = x → x = 0) jsou příklady formulí
v jazyce teorie grup.
Příklad 3.1.4 Aritmetický jazyk {+, ·, 0, S, ≤, <} má dva binární funkční symboly
+ a ·, konstantu 0, unární funkční symbol S a dva binární predikátové symboly
≤ a <. Výrazy S(S(S(0))) a x · S(y + z) jsou příklady termů v aritmetickém jazyce
(aritmetických termů). Výrazy
x < S(0) ∨ S(0) < x, ∃y(y + y = 0), S(S(0)) · S(S(0)) = S(S(S(0)))
jsou příklady formulí v aritmetickém jazyce (aritmetických formulí). Aritmetický
jazyk budeme zpravidla vztahovat k přirozeným číslům a S(x) budeme chápat jako
označení pro číslo x + 1. Symbol „S odkazuje k anglickému successor (následník).
Vidíme, že volbou jazyka je dáno, o čem se v dané teorii může mluvit. Samotnou
deﬁnici pojmu teorie však odložme na později.
Uvažujme nyní aritmetickou formuli ∃y(y + y = x), označme ji ϕ a všimněme
si rozdílného postavení proměnných x a y ve ϕ. Formule ϕ vyjadřuje vlastnost
objektu x (a nikoliv y). Lze ji číst číslo x je dělitelné dvěma. Proměnná y má ve
formuli ϕ pomocný význam, podobně jako ve výrazu
x
0
f(y) dy. Budeme říkat, že
proměnná x se ve formuli ϕ vyskytuje volně, y se ve ϕ vyskytuje vázaně. Následující
deﬁnice umožňuje rozdělit výskyty proměnných v libovolné formuli na volné a
vázané.
Deﬁnice 3.1.5 Každý výskyt libovolné proměnné v atomické formuli je volný. Každý
volný (vázaný) výskyt proměnné x ve formuli ϕ a ve formuli ψ je zároveň
volným (vázaným) výskytem ve formulích (ϕ → ψ), (ϕ & ψ) a (ϕ ∨ ψ). Každý volný
(vázaný) výskyt proměnné x ve formuli ϕ je zároveň volným (vázaným) výskytem
proměnné x ve formuli ¬ϕ. Všechny výskyty proměnné x ve formulích ∀xϕ a ∃xϕ
jsou vázané, žádný z nich není volný. Je-li y proměnná různá od proměnné x, pak
každý volný (vázaný) výskyt proměnné y ve formuli ϕ je zároveň volným (vázaným)
výskytem proměnné y ve formulích ∀xϕ a ∃xϕ.
Deﬁnice 3.1.6 Term je uzavřený, jestliže neobsahuje žádné proměnné. Formule ϕ
je uzavřená formule neboli sentence, jestliže ϕ neobsahuje volné výskyty proměnných.
Formule ϕ je otevřená, jestliže neobsahuje kvantiﬁkátory.
140 3 Predikátová logika
Například když ϕ je formule ∃x(x < y & ∀y(z + S(y) = x)), pak proměnná z
má ve ϕ jediný výskyt, který je volným výskytem, všechny (tři) výskyty proměnné x
ve ϕ jsou vázané a ze tří výskytů proměnné y je první volný a další dva jsou vázané.
Formule ϕ není sentence, formule ∀y∀zϕ je sentence. Ze tří formulí uvedených
v příkladu 3.1.4 první je otevřená, druhá je sentence a třetí je dokonce otevřená
sentence. Vidíme, že „volný výskyt a „vázaný výskyt jsou komplementární pojmy,
daný výskyt je volný právě tehdy, není-li vázaný. Daná proměnná ale může
mít v dané formuli současně volné i vázané výskyty. „Otevřená formule a „uzavřená
formule nejsou komplementární pojmy, některé formule nejsou uzavřené ani
otevřené, některé jsou naopak obojí. Pokud nějaký jazyk L neobsahuje žádné konstanty,
což je pravda například o jazyce teorie množin, pak v L neexistují žádné
uzavřené termy ani otevřené sentence.
Než obrátíme pozornost k deﬁnici struktury, zmiňme se ještě o tom, co přesně
jsou termy a formule. Všechny jazyky „ze života , tj. ty, o kterých si budeme klást
nějaké otázky a v souvislosti s kterými se budeme snažit řešit nějaké problémy,
budou konečné nebo alespoň spočetné. To ale neznamená, že všechny jazyky, které
mají aplikace, tj. které mohou pomoci řešit nějaké problémy, jsou nejvýše spočetné.
Uvidíme (například v důkazu věty 3.4.5), že věty o úplnosti a kompaktnosti platí
pro všechny teorie bez ohledu na mohutnost jazyka a že tento fakt může mít určité
důsledky i pro teorie s konečným jazykem. Z toho důvodu většinou připouštíme, aby
jazyk měl libovolnou mohutnost, a termy a formule jsou v tom případě abstraktními
objekty, nejspíš konečnými posloupnostmi „symbolů .
Uvažujeme-li však o algoritmech pracujících se syntaktickými objekty (nastane
to v oddílu 3.6 a později), potřebujeme mít možnost považovat termy a formule
za posloupnosti skutečných symbolů, tj. prvků nějaké konečné abecedy. V tomto
případě s množinou Var všech proměnných zacházíme stejně, jako jsme v kapitole 2
zacházeli s množinou všech výrokových atomů: předpokládáme, že její prvky jsou
očíslovány, Var = {v0, v1, v2, . . . }, že každá proměnná vi sestává z písmene v a ze
zápisu indexu i a že jsme se rozhodli, zda indexy zapisujeme unárně, binárně či
dekadicky. Dále v tomto případě předpokládáme, že jazyk je nejvýše spočetný, a
že je-li nekonečný, byla pro zapisování jeho prvků přijata podobná dohoda jako pro
zapisování proměnných.
3.1.2 Struktury
Deﬁnice 3.1.7 Struktura pro jazyk L je neprázdná množina D ( nosná množina
struktury) spolu s funkcí r deﬁnovanou na L. Když c ∈ L je konstanta, pak r(c) je
prvek množiny D. Když F ∈ L je n-ární funkční symbol a n ≥ 1, pak r(F) je
n-ární operace na množině D, tj. funkce z Dn
do D. Když P ∈ L je n-ární
predikátový symbol, pak r(P) je n-ární relace na množině D, tj. platí r(P) ⊆ Dn
.
Prvku r(c), funkci r(F) a relaci r(P) říkáme realizace symbolu c resp. symbolu F
resp. symbolu P v dané struktuře. V predikátové logice s rovností je realizací r(=)
symbolu = vždy diagonála na množině D, tj. množina { [x, x] ; x ∈ D }.
3.1 Formule a sémantika predikátové logiky 141
A:
r1(+) a b
a a b
b b a
r1(0) = a
r1(S)
a b
b b
r r
r r
a b
c d
B
T




k
E
§ ¤
¦ c
r r ra b c
r3(Q)r3(P)
C '
&
$
%




Obrázek 3.1.1: Různé struktury
Příklad 3.1.8 Uvažujme jazyk {+, 0, S}, kde + je binární, S unární funkční symbol
a 0 je konstanta. Vezměme dvouprvkovou množinu A = {a, b} a deﬁnujme
realizace r1(+), r1(0), r1(S) tří symbolů našeho jazyka rovností r1(0) = a a dvěma
tabulkami na obrázku 3.1.1 nahoře. Výsledná struktura A = {a, b}, r1(+), a, r1(S)
je opravdu strukturou pro jazyk {+, 0, S}, neboť r1(+), a a r1(S) jsou binární, „nulární
a unární operace na množině {a, b}. Dole na témže obrázku jsou dva další
příklady struktur. Vlevo je struktura B = {a, b, c, d}, r2(∈) se čtyřprvkovou nosnou
množinou B = {a, b, c, d} a s binární relací znázorněnou šipkami. Struktura B
je strukturou pro jazyk s jediným binárním predikátem ∈. Vpravo je struktura C
pro jazyk {P, Q} se dvěma unárními predikátovými symboly. Realizace {b, c} a {c}
symbolů P a Q jsou vyznačeny ovály.
Všechny struktury v předchozím příkladu jsou konečné. Deﬁnice struktury ale
připouští libovolné mohutnosti nosných množin.
Při označování struktur budeme většinou postupovat tak, jak naznačuje předchozí
příklad a jak je běžné v algebře. Strukturu označíme tučnou variantou téhož
písmene, kterým je označena její nosná množina, a realizaci symbolu I ve struktuře
D budeme značit ID
místo r(I). V případě, kdy jazyk L je konečný, budeme
strukturu zapisovat jako n-tici, v níž za nosnou množinou následují realizace symbolů
jazyka L.
Jmenujme nyní několik prominentních struktur běžných v matematice. Nechť
s označuje funkci x → x + 1, tj. přičítání jedničky, uvažovanou v množině všech
přirozených nebo celých čísel. Pak struktura N = N, +N
, ·N
, 0N
, s, ≤N
, <N
, tj.
množina všech přirozených čísel s obvyklými operacemi a s neostrým a ostrým
uspořádáním, je struktura pro aritmetický jazyk, kterou nazýváme strukturou přirozených
čísel. V případech, jako je tento, kdy aritmetické symboly mají „obvyklý
význam, si dovolíme nedůslednost a budeme psát
N = N, +, ·, 0, s, ≤, < ,
tj. nebudeme (s výjimkou symbolu S) rozlišovat mezi symbolem a označením pro
142 3 Predikátová logika
jeho realizaci. Jinou strukturou pro aritmetický jazyk je struktura
Z = Z, +, ·, 0, s, ≤, <
celých čísel. Za strukturu racionálních čísel a reálných čísel považujme struktury
Q = Q, +, ·, 0, 1, < a R = R, +, ·, 0, 1, <
pro (v obou případech týž) jazyk se dvěma binárními funkčními symboly, dvěma
konstantami a jedním binárním predikátem. Někdy budeme také uvažovat jiné
(například menší) jazyky a mluvit třeba o struktuře Q, < všech racionálních čísel
s uspořádáním nebo o struktuře Z, +, 0 všech celých čísel se sčítáním a s nulou.
Řekne-li se ale například „struktura přirozených čísel nebo „struktura reálných
čísel bez dalšího určení, myslí se tím výše deﬁnovaná struktura N nebo R pro
aritmetický jazyk resp. pro jazyk {+, ·, 0, 1, <}. Je zřejmé, že některé symboly jsou
do našich jazyků zařazeny jen pro pohodlí. Například ze dvou symbolů ≤ a < by
většinou stačilo uvažovat jen jeden a ve struktuře N by dokonce bylo možné se
vzdát obou, neboť uspořádání přirozených čísel je deﬁnovatelné (s přesnou deﬁnicí
se setkáme později) pomocí sčítání. Všechny struktury N, Z, Q a R považujeme
za struktury pro predikátovou logiku s rovností.
Nechť L je jazyk a nechť D = D, r je struktura pro L. Ohodnocením proměnných
ve struktuře D nazvěme libovolnou funkci z množiny Var všech proměnných do
nosné množiny D struktury D. Je-li e ohodnocení proměnných ve struktuře D, r ,
je-li x proměnná a je-li a prvek množiny D, výraz e(x/a) označuje ohodnocení proměnných,
které proměnné x přiřazuje hodnotu a a na všech ostatních proměnných
se shoduje s ohodnocením e.
Máme-li strukturu D a ohodnocení proměnných e ve struktuře D, můžeme
se ptát, jaká je hodnota daného termu t ve struktuře D při ohodnocení e a zda
daná formule ϕ je nebo není v D splněna ohodnocením e. Fakt, že ϕ je v D
splněna ohodnocením e, značíme D |= ϕ[e]. Symbol |= tedy v predikátové logice
označuje (mimo jiné, jak brzy uvidíme) ternární relaci mezi strukturami, formulemi
a ohodnoceními. Ternární relaci můžeme ovšem také chápat jako ternární funkci
s hodnotami v množině {0, 1}. Tato funkce se deﬁnuje rekurzí podle složitosti
formule. Nejprve je třeba deﬁnovat hodnotu tD
[e] termu t ve struktuře D, a to
rovněž rekurzí podle složitosti termu t.
Deﬁnice 3.1.9 Nechť D = D, r je struktura pro jazyk L.
(a) Hodnota tD
[e] libovolného termu t při ohodnocení proměnných e ve struktuře
D je určena rovnostmi
T1: tD
[e] = e(t), když t je proměnná,
T2: (F(t1, . . , tn))D
[e] = r(F)(tD
1 [e], . . , tD
n [e]),
když F ∈ L je n-ární funkční symbol.
(b) Relace |= mezi strukturami, formulemi a ohodnoceními proměnných je určena
ekvivalencemi
3.1 Formule a sémantika predikátové logiky 143
T3: D |= P(t1, . . , tn)[e] ⇔ [tD
1 [e], . . , tD
n [e]] ∈ r(P),
když P ∈ L je n-ární predikátový symbol,
T4: D |= (ϕ → ψ)[e] ⇔ D /|= ϕ[e] nebo D |= ψ[e],
T5: D |= (¬ϕ)[e] ⇔ D /|= ϕ[e],
T6: D |= (ϕ & ψ)[e] ⇔ D |= ϕ[e] a D |= ψ[e],
T7: D |= (ϕ ∨ ψ)[e] ⇔ D |= ϕ[e] nebo D |= ψ[e],
T8: D |= (∃xϕ)[e] ⇔ ∃a ∈ D(D |= ϕ[e(x/a)]),
T9: D |= (∀xϕ)[e] ⇔ ∀a ∈ D(D |= ϕ[e(x/a)]).
Zápis D |= ϕ[e] čteme „ϕ je splněna ohodnocením e ve struktuře D nebo „ohodnocení
e splňuje v D formuli ϕ .
Tato deﬁnice je podstatnou součástí sémantiky predikátové logiky. Říká se
jí Tarského deﬁnice, případně deﬁnice platnosti formule ve struktuře, někdy též
(Tarského) deﬁnice pravdy. Písmeno „T v označení podmínek T1–T9 odkazuje ke
jménu „Tarski a zároveň k anglickému slovu „true . Všimněme si, že deﬁnice 3.1.9
opravdu korektně deﬁnuje ternární relaci. Podmínky T4–T9 převádějí otázku, zda
daná formule je nebo není splněna, na tutéž otázku pro jednodušší a jednodušší
formule. U atomických formulí, kterých se týká podmínka T3, záleží na hodnotách
termů. Ty jsou určeny podmínkami T1 a T2. K podmínce T8 pro jistotu poznamenejme,
že kvantiﬁkátor ∃ je v ní užit v různých významech: vlevo je (skutečným
čili formálním) symbolem, vpravo je (neformálně-jazykovou čili metamatematickou)
zkratkou. Totéž platí o kvantiﬁkátoru ∀ v podmínce T9.
Příklad 3.1.10 (a) Předpokládejme, že e1 je nějaké ohodnocení proměnných ve
struktuře A z obrázku 3.1.1, které proměnným x a z přiřazuje hodnoty b a a. Podmínka
T1 říká, že b a a jsou zároveň hodnotami termů x a z. Podmínka T2 dává
(S(x))A
[e1] = b a (S(x)+ z)A
[e1] = b. Oba termy S(x) a S(x)+ z mají ve struktuře
A při ohodnocení e1 tutéž hodnotu b.
(b) Nechť e2 je nějaké ohodnocení proměnných ve struktuře R reálných čísel, které
proměnným x, y a z přiřazuje postupně hodnoty 3, 15 a 5. Podmínky T1 a T2
dávají (z · x)R
[e2] = 15. Vzpomeňme si, že v predikátové logice s rovností je realizací
symbolu „= rovnost, v našem případě na množině R. Podmínka T3 dává
R |= (z · x = y)[e2]. Podle podmínky T8 platí také R |= (∃z(z · x = y))[e2], neboť
ohodnocení e2 je možné v bodě z předeﬁnovat (dokonce to ani není nutné) tak, aby
výsledné ohodnocení splňovalo formuli z · x = y.
(c) Nechť e3 je nějaké ohodnocení proměnných ve struktuře C znázorněné na obrázku
3.1.1. Platí C |= (P(x))[e3(x/b)] a C /|= (Q(x))[e3(x/b)]. Tedy, podle
T4 a T9,
C /|= (P(x) → Q(x))[e3(x/b)] a C /|= (∀x(P(x) → Q(x)))[e3].
Podobně lze ověřit C /|= (∀xP(x))[e3] a C |= (∀xP(x) → ∀xQ(x))[e3].
(d) Je-li c ∈ L konstanta, podmínka T2 říká cD
[e] = r(c). To znamená, že realizace
144 3 Predikátová logika
konstanty c v libovolné struktuře D je zároveň hodnotou konstanty c jako termu, a
to bez ohledu na ohodnocení proměnných. Například hodnotami termů 0 a S(S(0))
ve struktuře A z obrázku 3.1.1 jsou prvky a a b množiny A, a to při každém
ohodnocení proměnných e4.
Termům 0, S(0), S(S(0)), . . . aritmetického jazyka říkáme numerály a značíme
je 0, 1, 2 atd. Numerál n je tedy term tvaru S(S(. . (0) . .) obsahující jeden výskyt
konstanty 0, dále n výskytů symbolu S a ovšem příslušné množství závorek. Termy
0 a 0 jsou totožné. Numerály umožňují v aritmetickém jazyce formulovat tvrzení
o konkrétních (metamatematických) přirozených číslech, protože hodnotou libovolného
numerálu n ve struktuře N je číslo n, a to při libovolném ohodnocení
proměnných.
Body (c) a (d) v předchozím příkladě naznačují, že hodnota termu t při ohodnocení
proměnných e závisí na hodnotách jen těch proměnných, které se v t skutečně
vyskytují, a platnost vztahu D |= ϕ[e] závisí na ohodnocení jen těch proměnných,
které se ve ϕ vyskytují volně. Hned dokážeme, že tomu tak skutečně je. Pro sentenci
ϕ to znamená, že je-li ϕ ve struktuře D splněna nějakým ohodnocením e, pak
je v D splněna každým ohodnocením e.
Lemma 3.1.11 Nechť D je struktura pro jazyk L, nechť x1, . . , xn jsou proměnné
a nechť e1 a e2 jsou ohodnocení proměnných ve struktuře D, která se shodují na
proměnných x1, . . , xn.
(a) Je-li t term jazyka L, jehož všechny proměnné jsou mezi x1, . . , xn, pak platí
tD
[e1] = tD
[e2].
(b) Je-li ϕ formule jazyka L, jejíž všechny volné proměnné jsou mezi x1, . . , xn,
pak D |= ϕ[e1] ⇔ D |= ϕ[e2].
Důkaz Indukcí podle složitosti termu t či formule ϕ lze snadno ukázat, že (a) i (b)
platí pro danou strukturu D, pro všechny seznamy x1, . . , xn proměnných obsahující
všechny proměnné vyskytující se v t (resp. vyskytující se volně ve ϕ) a pro všechny
dvojice e1, e2 ohodnocení shodujících se na x1, . . , xn. Ukažme si podstatný případ,
totiž ten, kdy formule ϕ v (b) je utvořena z jednodušší formule pomocí kvantiﬁkace.
Nechť tedy e1, e2, seznam x1, . . , xn a formule ϕ jsou dány a nechť ϕ je tvaru ∀yψ.
Předpokládejme, že proměnná y je různá od všech x1, . . , xn. Úvaha v případě,
kdy y je xi, je podobná. Všechny volné proměnné formule ψ jsou mezi y, x1, . . , xn
a pro libovolné a ∈ D se ohodnocení e1(y/a) a e2(y/a) shodují na y, x1, . . , xn.
Podle indukčního předpokladu jsou podmínky D |= ψ[e1(y/a)] a D |= ψ[e2(y/a)]
ekvivalentní. Z toho plyne druhá z následujících tří ekvivalencí:
D |= (∀yψ)[e1] ⇔ ∀a ∈ D(D |= ψ[e1(y/a)])
⇔ ∀a ∈ D(D |= ψ[e2(y/a)])
⇔ D |= (∀yψ)[e2].
Zbývající dvě ekvivalence plynou bezprostředně z podmínky T9. QED
3.1 Formule a sémantika predikátové logiky 145
Nechť ϕ je formule, jejíž všechny volné proměnné jsou mezi x1, . . , xn. Domluvme
se, že nebude-li pochybnost o pořadí proměnných x1, . . , xn, pak zápisem
D |= ϕ[a1, . . , an] budeme označovat fakt, že ϕ je v D splněna některým nebo
každým ohodnocením, které proměnným x1, . . , xn přiřazuje hodnoty a1, . . , an.
Vzhledem k předchozímu lemmatu je tento zápis korektní. Je-li například ϕ formule
∃z(z · x = y) z příkladu 3.1.10(b), budeme psát třeba R |= ϕ[3, 15] a číst
„formule ϕ je ve struktuře reálných čísel splněna dvojicí [3, 15] .
3.1.3 Substituce, důsledek, logicky platné formule
Nechť s je term, x1, . . , xn jsou navzájem různé proměnné a t1, . . , tn jsou termy
nějakého jazyka L. Označme sx1,..,xn
(t1, . . , tn) term, který vznikne z termu s současným
nahrazením každého výskytu každé proměnné xi termem ti. Podobně, je-li
ϕ formule v L, pak ϕx1,..,xn (t1, . . , tn) je formule, která vznikne z formule ϕ současným
nahrazením každého volného výskytu každé proměnné xi termem ti. Operaci,
která ze seznamu proměnných x1, . . , xn, seznamu termů t1, . . , tn a termu s nebo
formule ϕ vytvoří term sx1,..,xn (t1, . . , tn) resp. formuli ϕx1,..,xn (t1, . . , tn), nazýváme
současnou (simultánní) substitucí (dosazením) termů za proměnné do termu nebo
do formule. Přitom se nepředpokládá, že proměnné x1, . . , xn se v s nebo ve ϕ skutečně
vyskytují, a nepředpokládá se ani, že v s nebo ϕ nejsou jiné (volné) proměnné
než x1, . . , xn. Proměnné x1, . . , xn se mohou vyskytovat v termech t1, . . , tn.
Slovo „současná v předchozím odstavci je důležité. Představme si, že ϕ je
formule x < y, term t1 je y a t2 je x. Pak ϕx,y(t1, t2) je formule y < x. To je
ale jiná formule než (ϕx(t1))y(t2). Přes tuto potíž ale platí, že současnou substituci
n termů lze nahradit několika substitucemi jednoho termu. To lze udělat
následovně. Nechť ϕ je formule, x1, . . , xn navzájem různé proměnné a t1, . . , tn
termy. Zvolme proměnné v1, . . , vn, které jsou navzájem různé a nevyskytují se
ve ϕ ani v termech t1, . . , tn. Snadno lze ověřit, že substituujeme-li ve ϕ (po jedné)
v1 za x1 až vn za xn, a pak (opět po jedné) t1 za v1 až tn za vn, dostaneme formuli
ϕx1,..,xn (t1, . . , tn). Díky tomuto postupu vystačíme v následujícím lemmatu,
a také v příštím oddílu, když budeme formulovat axiomy hilbertovského kalkulu
pro predikátovou logiku, se substitucí jediného termu. Následující příklad ukazuje,
že nejprve musíme překonat ještě další potíž.
Příklad 3.1.12 Nechť ϕ je aritmetická formule ∃y(x < y). Pak formule ∀xϕ je
ve struktuře N splněna jakýmkoliv ohodnocením, ale ϕx(y) je formule ∃y(y < y),
o které to neplatí.
Deﬁnice 3.1.13 Řekneme, že term t není substituovatelný za proměnnou x ve
formuli ϕ, jestliže některý volný výskyt proměnné x ve formuli ϕ je součástí takové
podformule ∀vψ nebo ∃vψ formule ϕ, že proměnná v se vyskytuje v termu t.
V opačném případě term t je substituovatelný za x ve ϕ.
Jinými slovy, term t je substituovatelný za x ve formuli ϕ, jestliže žádný výskyt
proměnné v termu t se substitucí nestane vázaným výskytem. Krajní případy jsou
146 3 Predikátová logika
tyto: každý term je substituovatelný za libovolnou proměnnou do otevřené formule,
každý term je substituovatelný ve formuli ϕ za libovolnou proměnnou, která
se ve ϕ nevyskytuje, uzavřený term je substituovatelný za libovolnou proměnnou
v libovolné formuli a libovolná proměnná je substituovatelná sama za sebe v libovolné
formuli.
Domluvme se, že zápis ϕx(t) pro substituci budeme nadále užívat pouze v případě,
kdy term t je substituovatelný za x ve ϕ.
Lemma 3.1.14 Nechť e je ohodnocení proměnných ve struktuře D pro jazyk L,
nechť dále t je term jazyka L a x je proměnná.
(a) Je-li s term jazyka L, pak (sx(t))D
[e] = sD
[e(x/tD
[e])].
(b) Je-li ϕ formule jazyka L a t je substituovatelný za x ve ϕ, pak D |= (ϕx(t))[e],
právě když D |= ϕ[e(x/tD
[e])].
Důkaz Indukcí podle složitosti termu s a formule ϕ. Když s je proměnná x, pak
sx(t) je t a sD
[e(x/tD
[e])] je tD
[e], viz podmínku T1. Když s je proměnná y jiná
než x, pak sx(t) je y a rovnost platí vzhledem k lemmatu 3.1.11, neboť ohodnocení
e a e(x/tD
[e]) se shodují v bodě y.
Když ϕ je konjunkce ψ1 & ψ2, pak ϕx(t) je (ψ1)x(t) & (ψ2)x(t). Užitím tohoto
a podobných faktů a indukčního předpokladu lze probrat všechny případy, kdy ϕ
je sestavena z jednodušších formulí pomocí některé logické spojky a také kdy s je
složeným termem. Podrobnosti přenecháváme čtenáři.
Věnujme se podrobně případu, kdy formule ϕ je tvaru ∃yψ. Poslední případ, kdy
je tvaru ∀yψ, je podobný a také jej přenecháváme čtenáři.
Když y je x, pak x nemá žádné volné výskyty ve ϕ, ϕx(t) je ϕ a ekvivalence v (b)
platí podle lemmatu 3.1.11, protože ohodnocení e a e(x/tD
[e]) se shodují na všech
proměnných, které se ve ϕ vyskytují volně. Úplně stejná úvaha platí i pro případ,
kdy y není x a x nemá volné výskyty ve ϕ.
Nechť tedy y není x a x má volné výskyty ve ϕ. Pak ϕx(t) je ∃yψx(t) a platí
D |= ϕx(t)[e] ⇔ D |= (∃yψx(t))[e]
⇔ ∃a ∈ D(D |= (ψx(t))[e(y/a)])
⇔ ∃a ∈ D(D |= ψ[e(y/a)(x/tD
[e(y/a)])])
⇔ ∃a ∈ D(D |= ψ[e(x/tD
[e])(y/a)])
⇔ D |= (∃yψ)[e(x/tD
[e])],
přičemž druhá a pátá ekvivalence plynou bezprostředně z podmínky T8, třetí je
indukční předpoklad a čtvrtou zdůvodněme podrobně. Složitý zápis ve třetím řádku
vyjadřuje, že máme (i) v ohodnocení e hodnotu v bodě y změnit na a, při takto
změněném ohodnocení určit hodnotu tD
[e(y/a)] termu t a (ii) tu pak použít ke
změně hodnoty v bodě x. Protože ale term t je substituovatelný za x ve ϕ, a
přitom x má volné výskyty ve ϕ, proměnná y se nevyskytuje v t. Tím ale platí
rovnost tD
[e(y/a)] = tD
[e] a kroky (i) a (ii) mohou být provedeny v opačném
pořadí, jak je naznačeno ve čtvrtém řádku. QED
3.1 Formule a sémantika predikátové logiky 147
Deﬁnice 3.1.15 Řekneme, že formule ϕ platí ve struktuře D, a píšeme D |= ϕ,
jestliže ϕ je v D splněna každým ohodnocením proměnných.
Toto je druhý význam symbolu |= v predikátové logice. V zápisu D |= ϕ symbol
|= označuje binární relaci, v zápisu D |= ϕ[e] ternární relaci. Poznamenejme, že
užívání termínů „platí a „splněna není v české literatuře úplně ustáleno. V anglické
literatuře se užívají termíny valid, true, případně satisﬁed, a jejich užití možná
také není zcela jednotné.
Příklad 3.1.16 (a) Formule ∀v(v ∈ x ≡ v ∈ y) → x = y neplatí ve struktuře B
z obrázku 3.1.1, protože v B není splněna ohodnocením [a, b].
(b) Lze ověřit (a v příkladu 3.1.10(b) to vlastně zčásti bylo provedeno), že formule
x = 0 → ∃z(z·x = y) platí ve struktuře R reálných čísel. Ve struktuře Z celých čísel
tato formule některými ohodnoceními proměnných sice splněna je, ale některými
není. Tedy Z /|= ϕ.
(c) Nechť χ je sentence 1+2 = 3, tj. sentence S(0)+S(S(0)) = S(S(S(0))). Snadno
lze ověřit, že pro strukturu A z obrázku 3.1.1 platí A /|= χ a A |= ¬χ.
Lemma 3.1.17 Nechť D je struktura pro jazyk L a nechť ϕ je formule v L. Pak
(a) Když D |= ϕ, pak D /|= ¬ϕ.
(b) Když ϕ je navíc sentence, pak D |= ϕ nebo D |= ¬ϕ.
Důkaz Nechť D |= ϕ, což znamená, že ϕ je splněna každým ohodnocením proměnných
ve struktuře D. Protože nosná množina struktury D je podle deﬁnice
neprázdná, znamená to také, že ϕ je v D splněna některým ohodnocením e.
Z D |= ϕ[e] plyne dle T5, že D /|= (¬ϕ)[e]. Tedy D /|= ¬ϕ.
Když D /|= ϕ, pak existuje e takové, že D /|= ϕ[e]. Podmínka T5 dává D |= (¬ϕ)[e].
Lemma 3.1.11(b) říká, že je-li sentence splněna v D některým ohodnocením proměnných,
pak je v D splněna každým ohodnocením proměnných. Tedy D |= ¬ϕ.
QED
Deﬁnice 3.1.18 Řekneme, že formule ϕ jazyka L je (logickým) důsledkem množiny
formulí ∆ nebo že ϕ vyplývá z (množiny předpokladů) ∆ a píšeme ∆ |= ϕ,
jestliže v každé struktuře D pro jazyk L je ϕ splněna každým ohodnocením proměnných,
které v D splňuje všechny formule z ∆. Tedy
∆ |= ϕ ⇔ ∀D∀e(D |= ∆[e] ⇒ D |= ϕ[e]),
kde D |= ∆[e] znamená ∀ψ ∈ ∆(D |= ψ[e]). Řekneme, že formule ϕ je důsledkem
formule ψ, jestliže je důsledkem množiny {ψ}. Formule ϕ a ψ jsou ekvivalentní,
jestliže ϕ je důsledkem ψ i ψ je důsledkem ϕ. Formule ϕ je logicky platnou formulí,
jestliže ϕ vyplývá z prázdné množiny předpokladů.
Toto je třetí (a poslední) význam symbolu |= v predikátové logice. V zápisech
D |= ϕ a D |= ϕ[e] vlevo stojí struktura a |= znamená platnost resp. fakt, že formule
148 3 Predikátová logika
je splněna. V zápisu ∆ |= ϕ vlevo stojí množina formulí a, stejně jako ve výrokové
logice, |= znamená důsledek. Poznamenejme, že v některých pramenech (zejména
v [75]) se uvažuje trochu jiná deﬁnice důsledku, založená na podmínce (∗) uvedené
dále na str. 160.
Je zřejmé, že — podobně jako ve výrokové logice — ϕ je logicky platnou formulí,
právě když ϕ platí v každé struktuře (pro příslušný jazyk), ϕ je důsledkem
formule ψ, právě když ψ → ϕ je logicky platnou formulí, a konečně ϕ a ψ jsou
ekvivalentní, právě když ϕ ≡ ψ je logicky platnou formulí.
Příklad 3.1.19 (a) Z formule ∀y(y /∈ x) vyplývá formule ¬∃y(y ∈ x): když pro
nějakou strukturu D a pro každé a ∈ D platí D |= (¬(y ∈ x))[e(y/a)], pak neexistuje
a ∈ D takové, že D |= (y ∈ x)[e(y/a)]. Tedy D /|= (∃y(y ∈ x))[e]
a D |= (¬∃y(y ∈ x))[e]. Naopak také formule ∀y(y /∈ x) vyplývá z ¬∃y(y ∈ x). Obě
formule jsou tedy ekvivalentní.
(b) Formule (∀xP(x) → ∀xQ(x)) → ∀x(P(x) → Q(x)) není logicky platnou formulí,
neboť v příkladu 3.1.10(c) jsme našli ohodnocení (tam označené e3, ale hodí se
jakékoliv ohodnocení), které ji nesplňuje ve struktuře C z obrázku 3.1.1.
(c) Formule 1 + 2 = 3 není logicky platnou formulí, viz příklad 3.1.16(c).
(d) Ve struktuře C z obrázku 3.1.1 existuje ohodnocení, které splňuje formuli P(x),
ale nesplňuje formuli ∀vP(v). Formule ∀vP(v) tedy nevyplývá z formule P(x) a
P(x) → ∀vP(v) není logicky platnou formulí.
(e) Nechť D je libovolná struktura pro jazyk L, nechť ϕ je formule v L a nechť
e je ohodnocení proměnných. Když D |= (∀xϕ)[e], pak ϕ je v D splněna všemi
ohodnoceními tvaru e(x/a), kde a ∈ D. Mezi nimi je i původní ohodnocení e. Tím
jsme ověřili, že každá formule ϕ vyplývá z formule ∀xϕ. V bodu (a) následujícího
lemmatu toto tvrzení ještě zesílíme.
(f) Je-li v nějaké struktuře D rovnítko realizováno rovností na množině D, pak
formule
γn = ∀x1 . . ∀xn∃y(y = x1 & . . & y = xn),
kde n ≥ 1, ve struktuře D platí, kdykoliv je nosná množina D nekonečná (a také
kdykoliv je konečná s alespoň n + 1 prvky). Uvažujme jazyk {0, S} s konstantou a
unární funkcí a množinu předpokladů
∆ = { ∀x(S(x) = 0), ∀x∀y(S(x) = S(y) → x = y) }.
Platí-li ∆ v D, pak realizace SD
symbolu S v D musí být funkce z D do D, která je
prostá a není na. To lze zařídit pouze v případě, je-li nosná množina struktury D
nekonečná. Ověřili jsme, že pro každé n sentence γn platí v každé struktuře D
pro jazyk {0, S}, ve které platí všechny prvky množiny ∆. Každá sentence γn tedy
v predikátové logice s rovností vyplývá z množiny ∆.
Lemma 3.1.20 (a) Je-li t term substituovatelný za x ve ϕ, pak ∀xϕ → ϕx(t)
a ϕx(t) → ∃xϕ jsou logicky platné formule.
(b) Nechť x se nevyskytuje volně v ψ. Když D |= ψ → ϕ, pak D |= ψ → ∀xϕ.
Když D |= ϕ → ψ, pak D |= ∃xϕ → ψ.
3.1 Formule a sémantika predikátové logiky 149
(c) Nechť v je proměnná substituovatelná za x ve ϕ a nechť v se nevyskytuje volně
ve ϕ. Pak ∀xϕ a ∀vϕx(v) jsou spolu ekvivalentní a také ∃xϕ a ∃vϕx(v) jsou spolu
ekvivalentní.
(d) Nechť ϕ a ψ jsou ekvivalentní formule. Pak ∀xϕ a ∀xψ, a také ∃xϕ a ∃xψ
jsou spolu ekvivalentní.
Důkaz Nechť D je struktura pro jazyk L a nechť e je ohodnocení proměnných ve
struktuře D. Když D /|= (∀xϕ)[e], pak podle T4 máme D |= (∀xϕ → ϕx(t))[e].
Nechť tedy platí D |= (∀xϕ)[e]. Pak podle T9 je formule ϕ v D splněna každým
ohodnocením tvaru e(x/a). Určeme hodnotu tD
[e] termu t a zvolme a := tD
[e].
Z D |= ϕ[e(x/tD
[e])] plyne díky lemmatu 3.1.14(b), že platí i D |= (ϕx(t))[e].
Podmínka T4 i v tomto případě dává D |= (∀xϕ → ϕx(t))[e]. Ověřili jsme, že
implikace ∀xϕ→ϕx(t) je v D splněna každým ohodnocením e. To platí pro každou
strukturu D. Ověření, že každá formule tvaru ϕx(t) → ∃xϕ je logicky platnou
formulí, je podobné.
Nechť e je ohodnocení proměnných ve struktuře D takové, že D |= ψ[e]. Chceme
ověřit D |= (∀xϕ)[e]. Uvažujme libovolné ohodnocení tvaru e(x/a). Lemma 3.1.11
říká D |= ψ[e(x/a)], protože nevyskytuje-li se x v ψ volně, ohodnocení e a e(x/a)
se shodují na všech volných proměnných formule ψ. Protože D |= ψ → ϕ, máme
D |= (ψ → ϕ)[e(x/a)]. Tedy D |= ϕ[e(x/a)]. Ověřili jsme, že ϕ je v D splněna každým
ohodnocením tvaru e(x/a). Podmínka T9 dává D |= (∀xϕ)[e]. Důkaz druhého
tvrzení v (b) je analogický. Všimněme si, že v tomto případě jsme nepotřebovali
lemma 3.1.14.
Je-li v substituovatelná za x ve ϕ, pak ∀xϕ → ϕx(v) a ϕx(v) → ∃xϕ jsou logicky
platné formule podle tvrzení (a). Nevyskytuje-li se v volně ve ϕ, (b) říká, že i
∀xϕ → ∀vϕx(v) a ∃vϕx(v) → ∃xϕ jsou logicky platné formule. Logická platnost
opačných implikací plyne z toho, že nevyskytuje-li se v volně ve ϕ, pak (ϕx(v))v(x)
je ϕ.
Nechť D je libovolná struktura pro daný jazyk. Protože ϕ a ψ jsou ekvivalentní,
platí D |= ϕ → ψ. Z tvrzení (a) nebo z příkladu 3.1.19(e) víme D |= ∀xϕ → ϕ.
Tedy D |= ∀xϕ → ψ. Tvrzení (b) dává D |= ∀xϕ → ∀xψ, neboť x se nevyskytuje
volně ve formuli ∀xϕ. Důkaz druhého tvrzení v (d) je opět analogický. QED
Příklad 3.1.21 Označme ψ aritmetickou formuli 1 + 2 = 1 + 3. Z ψ vyplývají
obě formule ∃x(x + 2 = 1 + S(S(x))) a ∃x(1 + x = 1 + S(x)), neboť jak z formule
x + 2 = 1 + S(S(x)), tak z formule 1 + x = 1 + S(x) lze formuli ψ získat
substitucí (substituovatelného) termu za x.
Lemma 3.1.22 Nechť ϕ a χ jsou formule a nechť x se nevyskytuje volně ve formuli
χ. Pak následující formule jsou logicky platné:
(a) ¬∀xϕ ≡ ∃x¬ϕ, ¬∃xϕ ≡ ∀x¬ϕ,
(b) χ ∨ ∀xϕ ≡ ∀x(χ ∨ ϕ), χ ∨ ∃xϕ ≡ ∃x(χ ∨ ϕ),
(c) χ & ∀xϕ ≡ ∀x(χ & ϕ), χ & ∃xϕ ≡ ∃x(χ & ϕ),
150 3 Predikátová logika
(d) χ → ∀xϕ ≡ ∀x(χ → ϕ), χ → ∃xϕ ≡ ∃x(χ → ϕ),
(e) ∀xϕ → χ ≡ ∃x(ϕ → χ), ∃xϕ → χ ≡ ∀x(ϕ → χ).
Důkaz Ověřme implikaci → v druhé formuli bodu (e). Všechny ostatní případy
jsou podobné nebo jednodušší a přenecháváme je čtenáři. Nechť D je struktura pro
příslušný jazyk a nechť e je ohodnocení proměnných splňující v D formuli ∃xϕ→χ.
Chceme ověřit D |= (∀x(ϕ → χ))[e]. To znamená ověřit, že D |= (ϕ → χ)[e(x/a)]
platí pro každé a ∈ D. Nechť tedy a ∈ D je dáno. Rozlišme případy D |= (∃xϕ)[e]
a D /|= (∃xϕ)[e]. Když D /|= (∃xϕ)[e], pak podle podmínky T8 pro každé b ∈ D
platí D /|= ϕ[e(x/b)]. Volba b := a a podmínka T4 dávají D |= (ϕ → χ)[e(x/a)].
Když D |= (∃xϕ)[e], předpoklad D |= (∃xϕ→χ)[e] a podmínka T4 dávají D |= χ[e].
Protože x se nevyskytuje volně v χ, lemma 3.1.11 dává D |= χ[e(x/a)], ohodnocení
e a e(x/a) se totiž shodují na všech proměnných volných v χ. Tedy i v tomto
případě platí D |= (ϕ → χ)[e(x/a)]. QED
Řekneme, že formule ϕ je v prenexním normálním tvaru nebo že ϕ je prenexní
formule, jestliže ϕ má tvar Q1x1 . . Qnxnα, kde každý ze symbolů Qi je některý
z kvantiﬁkátorů, x1, . . , xn jsou navzájem různé proměnné a α je otevřená formule.
Formule ϕ je existenční formule, jestliže ϕ je prenexní formule, jejíž všechny kvantiﬁkátory
jsou existenční. Formule ϕ je naopak univerzální formule, jestliže ϕ je
prenexní formule, jejíž všechny kvantiﬁkátory jsou univerzální.
Věta 3.1.23 Každá predikátová formule je ekvivalentní s jistou formulí v prenexním
normálním tvaru.
Důkaz indukcí podle počtu kroků, kterými je ϕ utvořena z atomických formulí,
tj. podle souhrnného počtu logických spojek a kvantiﬁkátorů ve ϕ.
Když ϕ neobsahuje logické spojky ani kvantiﬁkátory, pak ϕ je prenexní formulí.
Nechť ϕ je tvaru ∀yψ. Formule ψ je z atomických formulí utvořena méně kroky
než ϕ. Podle indukčního předpokladu tedy existuje formule tvaru Q1x1 . . Qnxnα,
která je ekvivalentní s ψ. Přitom x1, . . , xn jsou navzájem různé a α je otevřená
formule. Formule ∀yQ1x1 . . Qnxnα je podle lemmatu 3.1.20(d) ekvivalentní s ∀yψ
a je to prenexní formule, ledaže by proměnná y byla totožná s některou xi. V tom
případě jsou formule ∀yQ1x1 . . Qnxnα a Q1x1 . . Qnxnα ekvivalentní (cvičení), a
formule ∀yψ je tedy ekvivalentní s prenexní formulí Q1x1 . . Qnxnα.
Nechť ϕ je tvaru ψ1 → ψ2. Podle indukčního předpokladu existuje formule tvaru
Q1x1 . . Qnxnα ekvivalentní s ψ1 a formule tvaru Qn+1y1 . . Qn+mymβ ekvivalentní
s ψ2. Přitom x1, . . , xn jsou navzájem různé, y1, . . , ym jsou navzájem různé a
formule α a β jsou otevřené. Zvolme navzájem různé proměnné v1, . . , vn tak, že
vi je xi, když xi se nevyskytuje volně ani vázaně ve formuli Qn+1y1 . . Qn+mymβ,
a vi je nová proměnná v opačném případě. To lze, protože množina Var všech
proměnných je nekonečná. Předpokládejme, že pro nějaké i, kde 0 < i ≤ n, platí,
že formule
Qi+1vi+1 . . Qnvnαxi+1,..,xn (vi+1, . . , vn) a Qi+1xi+1 . . Qnxnα (∗)
3.1 Formule a sémantika predikátové logiky 151
jsou spolu ekvivalentní. Ověříme, že v tom případě to platí i pro i − 1. Ze tří
formulí
QiviQi+1vi+1 . . Qnvnαxi,xi+1,..,xn (vi, vi+1, . . , vn),
QixiQi+1vi+1 . . Qnvnαxi+1,..,xn (vi+1, . . , vn),
QixiQi+1xi+1 . . Qnxnα
jsou totiž první dvě ekvivalentní vzhledem k tvrzení 3.1.20 (c) nebo (d), druhá s třetí
díky předpokladu o formulích v (∗) a tvrzení 3.1.20(d). Pro i = n jsou formule
v (∗) totožné, tedy ekvivalentní. Sestupnou indukcí jsme dokázali, že formule v (∗)
jsou ekvivalentní pro i = 0: formule Q1v1 . . Qnvnαx(v), kde x a v značí x1, . . , xn
resp. v1, . . , vn, je ekvivalentní s Q1x1 . . Qnxnα, a tedy také s ψ1. Nechť dále Qi
označuje kvantiﬁkátor opačný ke Qi. Formule ψ1 →ψ2, tj. formule ϕ, je ekvivalentní
s každou z formulí
Q1v1 . . Qnvnαx(v) → Qn+1y1 . . Qn+mymβ,
Q1v1(Q2v2 . . Qnvnαx(v) → Qn+1y1 . . Qn+mymβ),
Q1v1Q2v2(Q3v3 . . Qnvnαx(v) → Qn+1y1 . . Qn+mymβ),
...
Q1v1 . . Qnvn(αx(v) → Qn+1y1 . . Qn+mymβ),
neboť první s druhou je ekvivalentní vzhledem k 3.1.22(e), druhá s třetí díky
3.1.22(e) a 3.1.20(d), třetí se čtvrtou díky 3.1.22(e) a dvojímu užití 3.1.20(d) atd.
Podobně, opakované užití tvrzení 3.1.22(d) a 3.1.20(d) dává ekvivalentní formuli
Q1v1 . . QnvnQn+1y1 . . Qn+mym(αx(v) → β),
která je v prenexním normálním tvaru.
Úvahy ve všech ostatních případech, kdy ϕ je utvořena z jednodušších formulí
pomocí existenční kvantiﬁkace nebo pomocí logické spojky jiné než implikace, jsou
podobné. QED
Příklad 3.1.24 Nechť K, < a R jsou jeden ternární a dva binární predikátové
symboly. Formule
∃xR(x, y) → ∃zK(z, x, y) & ¬∀z(z < x)
je ekvivalentní s formulemi
∃xR(x, y) → ∃zK(z, x, y) & ∃z¬(z < x),
∃xR(x, y) → ∃zK(z, x, y) & ∃v¬(v < x),
∃xR(x, y) → ∃v∃z(K(z, x, y) & ¬(v < x)),
∀u∃v∃z(R(u, y) → K(z, x, y) & ¬(v < x)),
z nichž poslední je v prenexním normálním tvaru.
152 3 Predikátová logika
Podíváme-li se znovu na důkaz věty 3.1.23, vidíme, že k převedení libovolné formule
na ekvivalentní prenexní formuli jsme použili tvrzení (c) a (d) lemmatu 3.1.20
a lemma 3.1.22. Záměna vázané proměnné x novou proměnnou v popsaná v tvrzení
3.1.20(c) se nazývá přejmenování vázané proměnné. Souhrnné označení pro
přejmenování vázaných proměnných a pro ekvivalence z lemmatu 3.1.22 použité
zprava doleva je prenexní operace. Kromě prenexních operací jsme implicitně použili
také tvrzení ze cvičení 14.
Před závěrečnými poznámkami tohoto oddílu o sémantice predikátové logiky
zaveďme ještě konvenci týkající se vyznačování volných proměnných ve formulích
a alternativního způsobu zapisování substitucí termů. Řekneme-li například
„nechť ϕ(x1, . . , xn) je formule , míníme tím, že proměnné x1, . . , xn jsou navzájem
různé a že každá proměnná, která se ve ϕ vyskytuje volně, je některá z proměnných
x1, . . , xn (není ale nutné, aby všechny x1, . . , xn skutečně měly ve ϕ volné
výskyty). Mluvíme-li například o formuli ϕ(t1(x, y), t2(x, y)), rozumí se, že za
nějaké (nedůležité nebo dříve speciﬁkované) dvě různé volné proměnné byly do
formule ϕ dosazeny (ne nutně různé) termy t1 a t2, ve kterých se nevyskytují jiné
proměnné než x a y, a navíc že ve výsledné formuli se nevyskytují jiné volné výskyty
proměnných x a y než ty, které se tam octly onou substitucí. Takto je třeba chápat
také zápisy typu ϕ(x, x), proměnná je také termem. Kdybychom chtěli připustit
případ, kdy třeba proměnná x má ve formuli ϕ i jiné výskyty než ty, které se
tam octly substitucí termů t1 a t2, mluvili bychom o formuli ϕ(t1(x, y), t2(x, y), x).
Řekneme-li například „uvažujme formuli tvaru y < z & ϕ(y, x) , rozumí se, že
proměnné y a x1, . . , xn mohou mít volné výskyty ve formuli ϕ, ale proměnná z je
nemá.
Příklad 3.1.25 Ověřme, že je-li ϕ(x, y) libovolná aritmetická formule, pak formule
ϕ(0, y) & ∀x(ϕ(x, y) → ϕ(S(x), y)) → ∀xϕ(x, y) (∗)
platí ve struktuře N přirozených čísel. Především, formule (∗) neobsahuje jiné
volné proměnné než případně y1, . . , yn a žádná z těchto proměnných není x. Nechť
b1, . . , bn je ohodnocení proměnných y1, . . , yn takové, že N |= ϕ(0, y)[b] a zároveň
N |= (∀x(ϕ(x, y) → ϕ(S(x), y)))[b]. Ověřme, že platí N |= (∀xϕ(x, y))[b]. Nechť ne
a nechť a0 je nejmenší číslo a, pro které neplatí N |= ϕ[a, b]. Máme N /|= ϕ[a0, b] a
N |= ϕ[a, b] pro každé a < a0. Z podmínek 0N
= 0, N |= ϕ(0, y)[b] a N /|= ϕ[a0, b]
plyne a0 = 0. Protože a0 − 1 < a0, máme N |= ϕ[a0 − 1, b]. Ale N |= ϕ[a0 − 1, b]
a N /|= ϕ[a0, b] je ve sporu s N |= (∀x(ϕ(x, y) → ϕ(S(x), y)))[b].
Chceme-li ukázat, že nějaká formule ϕ nevyplývá z nějaké množiny předpokladů
∆, znamená to podle deﬁnice najít strukturu D a ohodnocení proměnných e
takové, že D |= ∆[e] a D /|= ϕ[e]. Máme tedy najít strukturu D a ohodnocení proměnných
e, které v D splňuje všechny formule z množiny Γ = ∆ ∪ {¬ϕ}. Přitom
by nás mohly napadnout následující otázky.
1. Máme-li najít strukturu D splňující nějakou množinu formulí Γ, je někdy
nutné volit strukturu D nekonečnou?
3.1 Formule a sémantika predikátové logiky 153
2. Je někdy nutné volit strukturu D dokonce nespočetnou?
3. Když D1 a D2 jsou různé struktury pro nějaký jazyk L, znamená to, že v D1
platí nějaká sentence, která v D2 neplatí?
4. Je možné, aby všechny sentence platné v nějaké struktuře byly důsledkem nějaké
přehledné množiny předpokladů?
První otázka je uvedena jen pro úplnost. Víme už totiž, že odpověď je ano: množina
∆ z příkladu 3.1.19(f) je splněna například ve struktuře N, 0, s , není ale splněna
v žádné konečné struktuře. Chceme-li ukázat, že formule ¬∀x(S(x) = 0) nevyplývá
z formule ∀x∀y(S(x) = S(y) → x = y), musíme použít nekonečnou strukturu.
Ke třetí otázce poznamenejme toto. Snadno lze dokázat (a plyne to také z lemmatu
3.2.11), že jsou-li D1 a D2 dvě izomorfní struktury pro nějaký jazyk, pak
v D1 a v D2 platí tytéž sentence. Slovo „různé tedy čtěme „neizomorfní . Úvahou
o mohutnostech lze zdůvodnit, že i v tomto případě je obecná odpověď na třetí
otázku záporná. Množin sentencí v jazyce L je totiž jen omezeně mnoho (je-li například
jazyk L nejvýše spočetný, pak množina všech sentencí je nekonečná spočetná
a množina všech množin sentencí má mohutnost 2ℵ0
), ale neizomorfních struktur
pro jazyk L je ve smyslu mohutností neomezeně mnoho, protože struktury mohou
mít libovolně velkou mohutnost. To ale stále není vyčerpávající odpověď na třetí
otázku. Můžeme totiž tuto otázku klást pro konkrétní dvojici struktur. Lze například
strukturu R, < všech reálných čísel s uspořádáním a strukturu Q, < všech
racionálních čísel s uspořádáním odlišit platností nějaké sentence v jazyce {<}?
Ve čtvrté otázce může slovo „přehledná nejspíš znamenat „konečná nebo „rekurzívní
.
Úvahy o kalkulech, úplnosti a kompaktnosti v následujících oddílech vrhnou
určité světlo na všechny otázky 2–4.
Všimněme si ještě, že deﬁnice logicky platné formule v predikátové logice se podobá
deﬁnici tautologie ve výrokové logice. Tam, kde jsme ve výrokové logice volili
pravdivostní hodnoty atomů, abychom ukázali, že nějaká formule není tautologie,
v predikátové logice volíme strukturu a ohodnocení proměnných. Podstatný rozdíl
je ale v tom, že sémantika predikátové logiky nenaznačuje žádný algoritmus, který
by zjistil, zda daná formule je logicky platnou formulí. A na této situaci by se nic
nezměnilo dokonce ani v hypotetickém případě, kdy odpověď na první otázku by
byla ne: i konečných neizomorfních struktur pro daný jazyk je nekonečně mnoho.
Cvičení
Ve všech cvičeních, v nichž se vyskytuje rovnítko, předpokládejte, že pracujete
v predikátové logice s rovností.
1. Určete, které z následujících formulí platí ve struktuře B z obrázku 3.1.1:
∃x∀v(v /∈ x), ∃x∀v(v ∈ x ≡ v ∈ v),
∃x∀v(v ∈ x), ∀x∀y∃z∀v(v ∈ z ≡ v = x ∨ v = y),
154 3 Predikátová logika
∃x∀v(v ∈ x ≡ v /∈ v), ∃x∃y(x ∈ y & y ∈ x).
2. Nechť P a Q jsou unární a R binární predikát. Dokažte, že následující formule
jsou logicky platné, ale obrátíme-li (vnější) implikaci, ve všech případech
vznikne formule, která není logicky platná:
∃x(P(x) & Q(x)) → ∃xP(x) & ∃xQ(x),
∀xP(x) ∨ ∀xQ(x) → ∀x(P(x) ∨ Q(x)),
∃x∀yR(x, y) → ∀y∃xR(x, y),
∀x(P(x) → Q(x)) → (∀xP(x) → ∀xQ(x)),
∀x(P(x) → Q(x)) → (∃xP(x) → ∃xQ(x)).
3. (a) Najděte sentenci v jazyce {+, ·, 0, 1}, která platí jen v jedné ze struktur
R a Q.
(b) Pro každou ze tří struktur N, < , Z, < a Q, < najděte sentenci v jazyce
{<}, která v ní platí a ve zbývajících dvou neplatí.
(c) Zdůvodněte, že také struktury Z, + a Q, + lze odlišit platností nějaké
sentence. Lze i struktury R, +, · a Q, +, · odlišit platností nějaké sentence?
4. Nechť ϕ je formule, která nemá volné výskyty proměnné x (může ale mít volné
výskyty proměnné v). Rozhodněte, zda každá formule tvaru
∃vϕ & ∃x∀v(x < v → ¬ϕ) →
→ ∃x(∀v(x < v → ¬ϕ) & ∀y(y < x → ∃v(y < v & ϕ)))
platí ve struktuře R. Řešte analogickou úlohu také pro struktury Q a N.
5. Dokažte, že předpoklad v lemmatu 3.1.17(b), že ϕ je sentence, je podstatný, tj.
nalezněte formuli ϕ a strukturu D takové, že D /|= ϕ a D /|= ¬ϕ.
6. Určete, pro které trojice přirozených čísel n, m a k platí sentence n + m = k
ve struktuře A z obrázku 3.1.1. Totéž udělejte pro strukturu N.
7. Dokažte podrobně, že predikátová formule ψ je důsledkem formule ϕ, právě
když ϕ → ψ je logicky platná formule.
8. Nechť ϕ a ψ jsou formule v jazyce L a nechť pro každou strukturu D pro jazyk L
platí D |= ϕ, právě když D |= ψ. Musí být formule ϕ a ψ ekvivalentní?
Návod. Viz příklad 3.1.19(d).
9. Najděte příklad množiny formulí ∆ a formule ϕ takové, že ∆ |= ϕ a ∆ |= ¬ϕ.
10. Která z formulí
∀x(x = 0 ∨ ∃y(S(y) = x)), ∀x(S(x) = x), ∀x∃y(S(x) = y)
vyplývá z množiny ∆ z příkladu 3.1.19(f)? Které z formulí tvaru n = m
vyplývají z ∆?
3.1 Formule a sémantika predikátové logiky 155
Návod. Uvažujte například strukturu
0 1 2 3 · · · 0 1 2 3 · · ·E E E E E E E E
,
která obsahuje dvě kopie množiny všech přirozených čísel (s následnickou funkcí
vyznačenou šipkami) a kterou bychom mohli označit N, 0, s + N, s .
11. Dokažte, že každá z následujících formulí je logicky platná:
∀x∀yϕ ≡ ∀y∀xϕ, ∃x∃yϕ ≡ ∃y∃xϕ,
∀x∀yϕ → ∀xϕy(x), ∃xϕy(x) → ∃x∃yϕ,
∀xϕ & ∀xψ ≡ ∀x(ϕ & ψ), ∃xϕ ∨ ∃xψ ≡ ∃x(ϕ ∨ ψ),
∃x∀yϕ → ∀y∃xϕ, ∀xϕ → ∃xψ ≡ ∃x(ϕ → ψ),
∃x(ϕ → ∀yϕx(y)), ∀xϕ → ∃xϕ.
12. Užijte lemma 3.1.20 k důkazu, že nemá-li x volné výskyty ve formuli ϕ, pak
formule ϕ, ∀xϕ a ∃xϕ jsou spolu ekvivalentní.
13. Určete, ve kterých případech je v lemmatu 3.1.22 podstatný předpoklad, že x
se nevyskytuje volně ve formuli χ.
14. Nahradíme-li ve formuli ϕ libovolnou podformuli formulí s ní ekvivalentní, pak
je výsledná formule ekvivalentní s ϕ. Dokažte.
15. Rozhodněte, zda platí: každá formule tvaru (ϕ ≡ ψ) → (∀xϕ ≡ ∀xψ) je logicky
platná formule.
16. Převeďte následující formule na prenexní normální tvar:
∀x(P(x) → ∀y(Q(x, y) → ¬∀zR(y, z))),
∃xA(x, y) → (B(x) → ¬∃uA(x, u)),
P(x, y) → ∃y(Q(y) → (∃xQ(x) → R(y))).
17. Dokažte, že každá predikátová formule délky n je ekvivalentní s jistou formulí
v prenexním tvaru, jejíž délka je O(n·log n), zapisujeme-li indexy u proměnných
binárně, a O(n2
), zapisujeme-li je unárně.
18. Nechť L1 a L2 jsou jazyky takové, že L1 ⊆ L2, nechť D1 je struktura pro L1 a
nechť D2 je struktura pro L2, která má tutéž nosnou množinu jako D1 a v níž
každý symbol z L1 má tutéž realizaci jako v D1. Dokažte, že je-li ϕ formule
v L1, pak ϕ platí v D1, právě když ϕ platí v D2.
19. Nechť ϕ je formule v jazyce L2 a nechť L1 ⊆ L2 je seznam všech mimologických
symbolů vyskytujících se ve ϕ. Pak ϕ platí v každé struktuře pro L1, právě
když ϕ platí v každé struktuře pro L2. Dokažte.
156 3 Predikátová logika
20. Struktura D1 je podstruktura struktury D2, jestliže platí inkluze D1 ⊆ D2 pro
jejich nosné množiny a jestliže realizace ID
1 libovolného symbolu I jejich jazyka
je restrikcí jeho realizace ID2
na množinu D1. Podstruktury struktury D2 lze
ztotožnit s neprázdnými podmnožinami D1 množiny D2, které jsou uzavřeny
na všechny operace (tj. pro které platí FD2
(a1, . . , an) ∈ D1, kdykoliv F je
n-ární funkční symbol a a1, . . , an jsou prvky množiny D1). Je-li struktura D1
podstrukturou struktury D2, říkáme také, že struktura D2 je rozšíření struktury
D1. Nechť D1 je podstruktura struktury D2. Dokažte, že platí
(a) D1 |= ϕ[e] ⇔ D2 |= ϕ[e], kdykoliv je ϕ otevřená formule a e ohodnocení
proměnných, jehož všechny hodnoty jsou v D1.
(b) D1 |= ϕ ⇒ D2 |= ϕ, kdykoliv je ϕ existenční sentence.
(c) D2 |= ϕ ⇒ D1 |= ϕ, kdykoliv je ϕ univerzální formule.
Najděte příklady na to, že tvrzení (a)–(c) nelze zesílit: (a) neplatí pro existenční
ani univerzální sentence, implikace v (b) ani v (c) nelze obrátit a (b) neplatí
pro existenční formule.
21. Použijte předchozí cvičení k důkazu, že formule ∀x∃y(x < y) není ekvivalentní
s žádnou existenční ani s žádnou univerzální formulí.
22. Rozhodněte, zda platí toto tvrzení: je-li ϕ otevřená formule jazyka L a formule
∃yϕ je logicky platná, pak existuje term t jazyka L takový, že ϕy(t) je
logicky platná.
Návod. Uvažujte jazyk {P, F} a formuli ∃y(P(F(y)) ∨ ¬P(y)).
23. Rozhodněte, zda platí toto tvrzení: je-li ϕ formule jazyka L a formule ∃yϕ je
logicky platná, pak existují termy t1, . . , tn jazyka L takové, že také formule
ϕy(t1) ∨ . . ∨ ϕy(tn) je logicky platná.
Návod. Uvažujte formuli ∃y(P(y) → ∀vP(v)).
24. Najděte formuli ϕ takovou, že formule ϕv(0)&∀x(ϕv(x)→ϕv(S(x)))→∀xϕv(x)
neplatí v N.
Návod. Při tomto způsobu zápisu není vyloučeno, že například formule ϕv(0)
obsahuje volné výskyty proměnné x.
25. Přepište formuli z cvičení 4 v duchu úmluvy o vyznačování volných proměnných,
kterou jsme učinili před příkladem 3.1.25.
3.2 Hilbertovský predikátový kalkulus
3.2.1 Korektnost a úplnost
Důkaz a dokazatelnost se v predikátové logice deﬁnují stejně jako ve výrokové logice:
posloupnost formulí je důkaz z množiny předpokladů ∆, jestliže každý člen
3.2 Hilbertovský predikátový kalkulus 157
je prvkem množiny ∆, nebo je logickým axiomem kalkulu pro predikátovou logiku,
nebo je odvozen z předchozích členů pomocí některého odvozovacího pravidla
příslušného kalkulu. Hilbertovský kalkulus pro predikátovou logiku získáme tak,
že k výrokovému kalkulu z oddílu 1.3 přidáme dvě axiomatická schémata a dvě
pravidla týkající se kvantiﬁkátorů:
B1: ∀xϕ → ϕx(t),
B2: ϕx(t) → ∃xϕ,
Gen-A: ψ → ϕ / ψ → ∀xϕ,
Gen-E: ϕ → ψ / ∃xϕ → ψ,
kde v případě axiomů B1 a B2 je ϕ formule, ve které je term t substituovatelný
za proměnnou x, a v případě pravidel Gen-A a Gen-E je ψ formule, která neobsahuje
volné výskyty proměnné x. Výsledný kalkulus označme HK stejně jako ve
výrokové logice. Kalkulus HK (přesněji řečeno predikátová verze hilbertovského
kalkulu HK) má tedy axiomatická schémata A1–A7, B1 a B2 a tři odvozovací pravidla
MP, Gen-A a Gen-E. Pravidlům Gen-A a Gen-E říkáme pravidla generalizace
a axiomům B1 a B2 axiomy speciﬁkace.
Ukažme si dva příklady důkazů v kalkulu HK. Nechť R je binární predikátový
symbol. Formule
∀x∀y(R(x, y) → ¬R(y, x)) → ∀y(R(y, y) → ¬R(y, y))
je logicky platná, téměř má tvar požadovaný ve schématu B1, není ale logickým axiomem,
protože ve formuli ∀y(R(x, y)→¬R(y, x)) není proměnná y substituovatelná
za x. Zato formule v následujících dvou řádcích
1: ∀x∀y(R(x, y) → ¬R(y, x)) → ∀y(R(x, y) → ¬R(y, x))
2: ∀y(R(x, y) → ¬R(y, x)) → (R(x, x) → ¬R(x, x))
mají požadovaný tvar, a můžeme o nich tedy tvrdit, že jsou instancemi schématu
B1, a tudíž dokazatelnými formulemi.
I v predikátové logice můžeme v dobrém smyslu mluvit o tautologiích. Predikátová
formule v jazyce L je tautologií, jestliže ji lze získat z nějaké výrokové tautologie
A substitucí predikátových formulí za atomy, tj. nahrazením všech atomů formule
A predikátovými formulemi v jazyce L, přičemž všechny výskyty téhož atomu
jsou nahrazeny vždy toutéž predikátovou formulí. Formule R(x, y)∨¬R(x, y) je příklad
predikátové formule, která je tautologií. Formule ∀x∀yR(x, y) → ∀y∀xR(x, y)
je logicky platná formule, ale není to tautologie. Z hlediska výrokové logiky je to
formule tvaru p → q sestavená ze dvou různých „atomů .
Protože jsme do kalkulu HK přijali všechny axiomy a pravidla jeho výrokové
varianty, tj. axiomy A1–A7 a pravidlo MP, je jasné, že substitucí predikátových
formulí za atomy v libovolném výrokovém důkazu vznikne důkaz v predikátové
158 3 Predikátová logika
variantě kalkulu HK. Protože axiomy A1–A7 a pravidlo MP dohromady tvoří
kalkulus úplný vůči sémantice klasické výrokové logiky, je dále jasné, že každá
predikátová formule, která je tautologií, je v predikátové variantě kalkulu HK
dokazatelná. Označme A formuli ∀x∀y(R(x, y) → ¬R(y, x)) a označme B formuli
∀y(R(x, y) → ¬R(y, x)). Platí
3: (A → B) → ((B → (R(x, x) → ¬R(x, x))) → (A → ¬R(x, x))).
Snadno lze totiž ověřit, že tato dlouhá formule je opravdu tautologií. Dále
4: (B → (R(x, x) → ¬R(x, x))) → (A → ¬R(x, x)) ; MP na 1, 3
5: ∀x∀y(R(x, y) → ¬R(y, x)) → ¬R(x, x) ; MP na 2, 4
6: ∀x∀y(R(x, y) → ¬R(y, x)) → ∀x¬R(x, x) ; Gen-A na 5.
Přesvědčili jsme se, že tvrzení je-li relace R antisymetrická, pak je i antireﬂexivní
je v kalkulu HK dokazatelné. Domluvme se, že kdybychom to měli zdůvodnit
podruhé, vynechali bychom body (3) a (4) a místo toho bychom řekli, že formule (5)
je tautologickým důsledkem formulí (1) a (2).
Nyní uvažujme unární predikát P a sentenci ∃z(P(z) → ∀xP(x)). Napišme si
nejprve neformální důkaz této sentence:
Když ¬∀xP(x), vezměme za z některý z objektů, které nesplňují P. Takový
objekt z splňuje každou implikaci tvaru P(z) → (. .). Když naopak ∀xP(x), je
implikace P(z)→∀xP(x) splněna bez ohledu na z, a za z lze tedy vzít libovolný
objekt.
Použijeme-li úmluvu o vynechávání výrokových kroků, formalizací právě uvedeného
neformálního důkazu můžeme získat například takovýto důkaz v kalkulu HK:
1: (P(x) → ∀xP(x)) → ∃z(P(z) → ∀xP(x)) ; B2
2: ¬∃z(P(z) → ∀xP(x)) → P(x) ; Taut. důsledek formule 1
3: ¬∃z(P(z) → ∀xP(x)) → ∀xP(x) ; Gen-A na 2
4: ¬∀xP(x) → ∃z(P(z) → ∀xP(x)) ; Taut. důsledek formule 3
5: ∀xP(x) → (P(x) → ∀xP(x)) ; Tautologie
6: ∀xP(x) → ∃z(P(z) → ∀xP(x)) ; Taut. důsledek formulí 1, 5
7: ∃z(P(z) → ∀xP(x)) ; Taut. důsledek formulí 4, 6.
Všimněme si, že důkaz by bylo možno ještě zkrátit vynecháním kroků (4)–(6):
formule (7) je tautologickým důsledkem formulí (1) a (3).
Lemma 3.2.1 Nechť ϕ je formule neobsahující volné výskyty proměnné z. Pak
formule ∃z(ϕx(z) → ∀xϕ) a ∃z(∃xϕ → ϕx(z)) jsou dokazatelné v HK.
3.2 Hilbertovský predikátový kalkulus 159
Důkaz Formule (ϕx(z)→∀xϕ)z(x) a ϕ→∀xϕ jsou totožné, neboť z se nevyskytuje
volně ve ϕ. To znamená, že nahradíme-li v řádku (1) před okamžikem sestrojeného
formálního důkazu formuli P(x) formulí ϕ a formuli P(z) formulí ϕx(z), dostaneme
opět instanci axiomu B2. Provedeme-li tytéž záměny i v ostatních řádcích, dostaneme
důkaz formule ∃z(ϕx(z) → ∀xϕ). Přitom použití pravidla Gen-A v řádku (3)
je oprávněné, neboť formule ϕx(z) → ∀xϕ nemá volné výskyty proměnné x. Zdůvodnění
dokazatelnosti formule ∃z(∃xϕ → ϕx(z)) je podobné a ponecháváme je za
cvičení. QED
Lemma 3.2.2 (věta o dedukci) Nechť ψ je sentence a nechť ∆, ψ ϕ. Pak
∆ ψ → ϕ.
Důkaz Nechť ϕ1, . . , ϕn(=ϕ) je důkaz formule ϕ z předpokladů ∆, ψ. Tvrdíme, že
všechny implikace ψ → ϕi jsou dokazatelné z ∆. Věnujme se třeba případu, kdy
ϕi je odvozena z některého předchozího členu pomocí pravidla Gen-E. Případ, kdy
ϕi je odvozena pomocí pravidla Gen-A, je podobný a všechny ostatní případy jsou
úplně stejné jako ve výrokové logice.
Je-li ϕi odvozena pravidlem Gen-E z ϕj, kde j < i, znamená to, že formule ϕi má
tvar ∃xα → β, formule ϕj má tvar α → β a proměnná x nemá volné výskyty v β.
Indukční předpoklad říká
1: ∆ ψ → (α → β).
Z toho snadno zdůvodníme dokazatelnost formule ψ → (∃xα → β):
2: ∆ α → (ψ → β) ; Taut. důsledek formule 1
3: ∆ ∃xα → (ψ → β) ; Gen-E
4: ∆ ψ → (∃xα → β) ; Taut. důsledek formule 3.
Přitom v kroku (3) jsme opravdu použili předpoklad, že ψ je sentence. QED
Věta 3.2.3 (o silné korektnosti kalkulu HK) Nechť ϕ je formule a nechť ∆
je množina formulí v jazyce L. Když ∆ ϕ, pak ϕ platí v každé struktuře pro L,
ve které platí všechny formule z ∆.
Důkaz Nechť struktura D pro jazyk L je dána. Nechť e je ohodnocení proměnných
ve struktuře D. Z podmínky T4 (viz 3.1.9) plyne, že když D |= (ψ → χ)[e]
a D |= ψ[e], pak také D |= χ[e]. Tím je ověřeno, že množina všech formulí, které
jsou v D splněny daným ohodnocením e, je uzavřena na pravidlo MP. Podobně
lze ověřit, že množina všech formulí splněných v D daným ohodnocením obsahuje
všechny výrokové axiomy tvaru A1–A7. Lemma 3.1.20(a) říká, že obsahuje také
všechny axiomy speciﬁkace tvaru B1 nebo B2.
Když daným, pak také každým. Množina všech formulí splněných v D každým
ohodnocením e, tj. platných v D, obsahuje všechny formule z množiny ∆, všechny
axiomy tvaru A1–A7, B1 a B2 a je uzavřena na pravidlo MP.
160 3 Predikátová logika
O pravidlech Gen-A a Gen-E lze říci pouze „každým , ale to nám stačí a je to
přesně to, co jsme dokázali v 3.1.20(b): množina všech formulí platných v D, tj.
splněných v D každým ohodnocením, je uzavřena na obě pravidla Gen-A i Gen-E.
Je-li ϕ1, . . , ϕn(= ϕ) důkaz formule ϕ z množiny předpokladů ∆, předchozí úvahy
a indukce podle i dávají, že každá formule ϕi platí v D. Tedy D |= ϕ. QED
Napišme si ještě jednou symbolicky podmínku, o které jsme v důkazu věty o
silné korektnosti dokázali, že platí pro každou formuli ϕ dokazatelnou z množiny ∆:
∀D(∀e∀ψ ∈ ∆(D |= ψ[e]) ⇒ ∀e(D |= ϕ[e])), (∗)
a porovnejme ji s podmínkou z deﬁnice 3.1.18 vyjadřující, že ϕ vyplývá z ∆:
∀D∀e(∀ψ ∈ ∆(D |= ψ[e]) ⇒ D |= ϕ[e]). (∗∗)
Není pravda, že podmínky (∗) a (∗∗) jsou ekvivalentní, protipříklad je zřejmý třeba
z příkladu 3.1.19(d). Podmínky (∗) a (∗∗) jsou ale ekvivalentní v případě, kdy
všechny formule v ∆ jsou uzavřené. To opravňuje následující deﬁnici a umožňuje
přehlednější reformulaci věty o korektnosti, která užívá pojem důsledku a kterou
vyslovíme v 3.2.8(b). Po formulaci věty 3.2.8 se pro jistotu o ekvivalenci podmínek
(∗) a (∗∗) ještě jednou zmíníme.
Deﬁnice 3.2.4 (Axiomatická) teorie je dvojice L, T , kde L je jazyk a T je množina
sentencí v L. Prvkům množiny T říkáme (vlastní) axiomy teorie L, T .
Struktura D pro jazyk L je model teorie L, T , jestliže v D platí všechny prvky
množiny T. Formule ϕ v jazyce L je dokazatelná v (teorii) L, T , jestliže ϕ je
dokazatelná z předpokladů T. Formule ϕ je vyvratitelná v L, T , jestliže ¬ϕ je
dokazatelná v T. Formule ϕ je nezávislá na L, T , jestliže ϕ není v L, T dokazatelná
ani vyvratitelná.
Příklad 3.2.5 Teorie (ostrého) uspořádání má jazyk L = {<} s jedním binárním
predikátem a množinu axiomů
T = { ∀x∀y∀z(x < y & y < z → x < z), ∀x∀y(x < y → ¬(y < x)) },
které postulují, že uspořádání < je tranzitivní a antisymetrické. Na začátku tohoto
oddílu jsme vlastně sestrojili důkaz sentence ∀x¬(x < x) z předpokladů T. Nevadí,
že tranzitivitu jsme přitom nepotřebovali. To znamená, že sentence ¬∀x¬(x < x)
je v teorii L, T vyvratitelná a sentence ∀x¬(x < x) je v ní dokazatelná. Modelem
teorie L, T je každá struktura D, R , kde D = ∅ a R ⊆ D2
je ostré uspořádání
na množině D. Mezi modely teorie L, T jsou jak struktury D, R , ve kterých
platí sentence ∀x∃y(x < y), tak struktury, ve kterých platí její negace. Z věty 3.2.3
plyne, že ∀x∃y(x < y) je sentence nezávislá na teorii L, T .
Je zřejmé, že daná teorie může mít více modelů a že daná struktura může být
modelem více teorií.
3.2 Hilbertovský predikátový kalkulus 161
V dalším výkladu budeme často místo L, T psát jen T, jako kdyby na volbě
jazyka nezáleželo. A ono opravdu moc nezáleží, neboť z cvičení 19 předchozího
oddílu je zřejmé, že symboly, které se nevyskytují ve formulích, neovlivňují logickou
platnost ani vztah důsledku. Dále se domluvme, že kdybychom někdy nedodrželi
požadavek deﬁnice 3.2.4 a řekli třeba, že axiom je x + y = y +x, myslíme to tak, že
axiom je formule ∀x∀y(x + y = y + x). Za skutečný axiom považujeme univerzální
uzávěr dané formule.
Zápis T, ϕ označuje jako obvykle množinu T ∪ {ϕ}. Místo T, ϕ budeme také
psát (T + ϕ) a mluvit o rozšíření teorie T o axiom ϕ.
Všimněme si ještě, že o axiomech teorie T mluvíme jako o vlastních axiomech
teorie, abychom je odlišili od logických axiomů daných volbou kalkulu. Ve formálním
důkazu ϕ1, . . , ϕn z předpokladů T se mohou vyskytnout jak vlastní axiomy,
tj. prvky množiny T, tak logické axiomy, v našem případě tvaru A1–A7, B1, B2.
Volba logických axiomů je oprávněna tím, že pro příslušný kalkulus jsme schopni
dokázat věty o korektnosti a úplnosti.
Deﬁnice 3.2.6 Řekneme, že teorie T je sporná, jestliže existuje formule ϕ taková,
že T ϕ a T ¬ϕ. V opačném případě je T bezesporná (konzistentní).
Lemma 3.2.7 (a) Když T ϕ, pak ϕ platí v každém modelu teorie T.
(b) Je-li teorie T sporná, pak T nemá žádný model.
(c) Teorie T je sporná, právě když každá formule ψ je v T dokazatelná.
(d) Je-li ϕ sentence, pak T ϕ, právě když (T + ¬ϕ) je sporná.
Důkaz (a) plyne bezprostředně z věty 3.2.3.
(b) Nechť T je sporná, ϕ je formule současně dokazatelná i vyvratitelná v T a nechť
M je model teorie T. Z tvrzení (a) plyne M |= ϕ a M |= ¬ϕ. To je spor s 3.1.17(a).
(c) Jsou-li v teorii T dokazatelné všechny formule, pak je jistě mezi nimi i nějaká
dvojice ϕ, ¬ϕ. Nechť naopak každá z formulí ϕ i ¬ϕ je dokazatelná v T. Protože
formule ϕ → (¬ϕ → ψ) je tautologie bez ohledu na formuli ψ, je dokazatelná v T.
Dvojí užití pravidla MP dává T ψ.
(d) Nechť teorie (T +¬ϕ) je sporná. Z již dokázaného tvrzení (c) plyne (T +¬ϕ) ϕ.
Lemma 3.2.2 dává T ¬ϕ→ϕ. Z toho plyne T ϕ, protože formule (¬ϕ→ϕ)→ϕ
je tautologie, a je tedy dokazatelná v T. QED
Nechť T je teorie s jazykem L. Pro použití hlavně v následujících oddílech
deﬁnujme Thm(T) jako množinu všech sentencí jazyka L dokazatelných v T a
deﬁnujme Ref(T) jako množinu všech sentencí jazyka L vyvratitelných v T. Je
zřejmé, že teorie T je bezesporná, právě když platí Thm(T) ∩ Ref(T) = ∅. Dále
z tvrzení 3.2.7(c) plyne, že je-li T sporná, pak Thm(T) = Ref(T) = Sent(L), kde
Sent(L) je množina všech sentencí v L.
Věta 3.2.8 (o silné úplnosti kalkulu HK) (a) Je-li T libovolná teorie, pak T
má model, právě když T je bezesporná.
(b) Je-li T teorie a ϕ formule, pak T ϕ, právě když T |= ϕ.
162 3 Predikátová logika
Větu o silné úplnosti dokázal Gödel v roce 1930. Stejně jako ve výrokové logice
jsou obě implikace ⇒ označovány (také, vedle tvrzení 3.2.3) jako věta o silné korektnosti
(predikátové verze) kalkulu HK. Větou o korektnosti a větou o úplnosti
(bez přívlastku) se i v predikátové logice myslí tvrzení, které bychom z věty o silné
korektnosti resp. z věty o silné úplnosti dostali volbou T := ∅.
Než přistoupíme k důkazu obtížnější části věty o úplnosti, uvědomme si, že
některé implikace jsou lehké. Předpokládejme T ϕ. Nechť D je struktura a e
ohodnocení proměnných takové, že D |= T[e]. Každá ψ ∈ T je tedy sentence splněná
v D naším ohodnocením e. Lemma 3.1.11 říká, že v tom případě je ψ splněna
každým ohodnocením, neboli platí D |= ψ. Z tvrzení 3.2.7(a) nebo z věty 3.2.3
plyne okamžitě D |= ϕ, tedy D |= ϕ[e]. Tím jsme ověřili implikaci ⇒ v 3.2.8(b) a
zároveň jsme podrobně dokázali, že podmínky (∗) a (∗∗), které jsme uvažovali na
str. 160 před deﬁnicí axiomatické teorie, jsou v případě, kdy všechny předpoklady
jsou sentence, spolu ekvivalentní.
Další úvahy o vztazích mezi podmínkami věty 3.2.8 jsou podobné jako ve výrokové
logice. Implikaci ⇒ v (a) jsme již zdůvodnili v 3.2.7(b). A nemá-li teorie T
model, pak z T vyplývá každá formule ψ, a platí-li k tomu (b), T musí být sporná.
To znamená, že implikace ⇐ v (a) plyne z implikace ⇐ v (b).
Důkaz věty 3.2.8 bude dokončen, dokážeme-li implikaci ⇐ v (b). Budeme postupovat
zhruba podle Barwisova Úvodu [5] k příručce [4] a dá nám to trochu práce.
Použijeme pomocný pojem henkinovského rozšíření teorie, větu o kompaktnosti pro
výrokovou logiku a (opět) také fakt, že každá tautologie je v HK dokazatelná, tedy
větu o úplnosti výrokové varianty kalkulu HK.
Nechť T je teorie v jazyce L. Jazyk L může mít libovolnou mohutnost. Nejprve
ve spočetně mnoha krocích sestrojíme rozšíření L+
jazyka L. V kroku 0 vezměme
všechny sentence tvaru ∀xψ nebo ∃xψ, tj. všechny sentence v L začínající kvantiﬁkátorem,
a každé z nich přidělme konstantu c∀xψ nebo c∃xψ tak, aby všechny
takto přidělené konstanty byly navzájem různé a různé od všech konstant jazyka L.
Konstantám přiděleným v kroku 0 říkejme henkinovské konstanty řádu 0. V každém
dalším kroku m + 1 přidělme henkinovské konstanty řádu m + 1 všem těm
sentencím začínajícím kvantiﬁkátorem, které jsou sestaveny ze symbolů jazyka L a
henkinovských konstant řádu 0, . . , m a kterým dosud henkinovská konstanta nebyla
přidělena, tj. které obsahují alespoň jednu henkinovskou konstantu řádu m.
Označme L+
výsledný jazyk vzniklý přidáním henkinovských konstant všech
řádů m ∈ N k jazyku L. Každá sentence jazyka L+
tvaru ∀xψ nebo ∃xψ má v L+
„svou konstantu c∀xψ resp. c∃xψ.
Henkinovské axiomy jsou všechny sentence jazyka L+
tvaru ∃xψ → ψx(c∃xψ)
a ψx(c∀xψ) → ∀xψ, kde ∃xψ resp. ∀xψ je sentence v L+
. Označme H(L) množinu
všech sentencí, které jsou henkinovským axiomem, nebo mají tvar ∀xψ → ψx(t)
či ψx(t) → ∃xψ, kde ∀xψ resp. ∃xψ je sentence jazyka L+
a t je uzavřený term
jazyka L+
. Každá henkinovská konstanta má tedy v množině H(L) „svůj henkinovský
axiom a v H(L) jsou dále všechny axiomy speciﬁkace tvaru B1 či B2, pokud
jsou sentencemi jazyka L+
. Henkinovský axiom ψx(c∀xψ) → ∀xψ příslušný ke konstantě
c∀xψ řádu m může obsahovat konstanty řádu nižšího než m, ale neobsahuje
3.2 Hilbertovský predikátový kalkulus 163
jinou konstantu řádu m než c∀xψ a neobsahuje žádnou konstantu řádu i > m. Totéž
lze říci o axiomu ∃xψ → ψx(c∃xψ) a konstantě c∃xψ.
Lemma 3.2.9 Když ϕ je sentence v jazyce L a T |= ϕ, pak ϕ je tautologickým
důsledkem množiny T ∪ H(L).
Důkaz Dokážeme, že pokud ϕ není tautologickým důsledkem množiny T ∪ H(L),
pak existuje struktura D pro jazyk L+
, ve které platí všechny formule z T a neplatí
ϕ, takže T /|= ϕ.
Když ϕ není tautologickým důsledkem množiny T ∪ H(L), existuje pravdivostní
ohodnocení, které přiřazuje hodnotu 1 všem formulím v T ∪ H(L) a hodnotu 0
formuli ϕ. Označme v0 jedno takové ohodnocení.
Strukturu D zkonstruujeme ze syntaktického materiálu, který máme k dispozici.
Nosnou množinu D struktury D deﬁnujme jako množinu všech uzavřených termů
jazyka L+
. Na množině D deﬁnujme realizaci symbolů jazyka L+
následovně.
Je-li F ∈ L+
funkční symbol libovolné četnosti n ≥ 0, jeho realizace FD
je dána
předpisem
FD
(s1, . . , sn) = F(s1, . . , sn). (1)
Prvky s1, . . , sn množiny D jsou uzavřené termy a operace FD
jim přiřazuje uzavřený
term F(s1, . . , sn). Je-li c ∈ L+
konstanta, rovnost (1) říká cD
= c. Každá
konstanta je tedy svou vlastní realizací, a to bez ohledu na to, zda je nebo není
v L. Všimněte si rozdílného významu závorek v (1): na pravé straně jsou závorky
formálními symboly, tj. jsou součástí syntaxe termu F(s1, . . , sn). Je-li nyní
P ∈ L+
predikátový symbol (musí ovšem platit P ∈ L) libovolné četnosti n ≥ 1,
jeho realizaci PD
deﬁnujme předpisem
PD
= { [s1, . . , sn] ; v0(P(s1, . . , sn)) = 1 }. (2)
Každá n-tice [s1, . . , sn] tedy je nebo není v PD
podle toho, jakou hodnotu přiřazuje
naše pravdivostní ohodnocení otevřené sentenci P(s1, . . , sn). O struktuře D postupně
vyslovíme a dokážeme tři tvrzení, a to o hodnotách (i neuzavřených) termů,
o tom, kdy jsou a nejsou v D splněny atomické formule, a konečně o tom, kdy jsou
a nejsou v D splněny všechny formule.
Je-li t term jazyka L+
, jehož všechny volné proměnné jsou mezi x1, . . , xk, a je-li
e ohodnocení proměnných, jehož hodnoty v x1, . . , xk jsou s1, . . , sk, pak
tD
[e] = tx1,..,xk
(s1, . . , sk). (3)
Je-li t proměnná, pak t je jedna z x1, . . , xk, řekněme xi. Pak ale dosazením termů
s1, . . , sk za x1, . . , xk v t dostaneme si, a si je zároveň hodnota tD
[e] termu xi při
ohodnocení e. Je-li t term tvaru F(t1, . . , tn), pak
(F(t1, . . , tn))D
[e] = FD
(tD
1 [e], . . , tD
n [e])
= FD
((t1)x1,..,xk
(s1, . . , sk), . . , (tn)x1,..,xk
(s1, . . , sk))
= F((t1)x1,..,xk
(s1, . . , sk), . . , (tn)x1,..,xk
(s1, . . , sk))
= (F(t1, . . , tn))x1,..,xk
(s1, . . , sk),
164 3 Predikátová logika
kde první rovnost je podmínka T2, druhá platí díky indukčnímu předpokladu pro
termy t1, . . , tn, třetí vzhledem k deﬁnici funkce FD
v (1) a čtvrtá je jasná z toho,
jak se dosazuje za proměnné ve složeném termu.
Je-li ψ atomická formule, jejíž všechny volné proměnné jsou mezi x1, . . , xk, a je-li
e ohodnocení proměnných, jehož hodnoty v x1, . . , xk jsou s1, . . , sk, pak
D |= ψ[e] ⇔ v0(ψx1,..,xk
(s1, . . , sk)) = 1. (4)
Formule ψ totiž musí být tvaru P(t1, . . , tn), kde P je predikátový symbol četnosti n
a t1, . . , tn jsou termy. Podmínka T3 říká
D |= ψ[e] ⇔ [tD
1 [e], . . , tD
n [e]] ∈ PD
,
tedy, vzhledem k (2) a (3),
D |= ψ[e] ⇔ v0(P((t1)x1,..,xk
(s1, . . , sk), . . , (tn)x1,..,xk
(s1, . . , sk))) = 1.
Zbývá uvážit, jak se substituuje za termy v atomických formulích: (P(t1, . . , tn))x(s)
a P((t1)x(s), . . , (tn)x(s)) jsou tytéž formule.
Je-li ψ libovolná formule, jejíž všechny volné proměnné jsou mezi x1, . . , xk, a je-li
e ohodnocení proměnných, jehož hodnoty v x1, . . , xk jsou s1, . . , sk, pak
D |= ψ[e] ⇔ v0(ψx(s)) = 1. (5)
Pro případ, kdy ψ je atomická, jsme (5) již dokázali. Případy, kdy ψ je sestavena
z jednodušších formulí pomocí některé logické spojky, jsou zcela rutinní a jejich
důkaz ponecháváme na čtenáři. Předpokládejme, že ψ je tvaru ∃yχ a že (5) platí
pro χ a pro všechna ohodnocení e. Předpokládejme dále, že proměnná y je různá
od všech x1, . . , xk. Pak
D |= (∃yχ)[e] ⇔ ∃t ∈ D(D |= χ[e(y/t)])
⇔ ∃t ∈ D(v0(χy,x(t, s)) = 1)
⇔ v0(∃yχx(s)) = 1
⇔ v0((∃yχ)x(s)) = 1,
kde první ekvivalence je podmínka T8, druhá je indukční předpoklad pro formuli χ,
čtvrtá je triviální a třetí si všimněme podrobněji. Formule χy,x(t, s) → ∃yχx(s) je
v H(L) pro každý term t, a pravdivostní ohodnocení v0 jí tedy přiřazuje hodnotu 1.
Když tedy v0(χy,x(t, s)) = 1 pro nějaký term t, musí platit i v0(∃yχx(s)) = 1, jinak
by v0 porušovalo pravdivostní tabulku implikace. Naopak, když v0(∃yχx(s)) = 1,
pak existuje term t, totiž c∃yχx(s), pro který platí v0(χy,x(t, s)) = 1, neboť v H(L)
je implikace ∃yχx(s) → χy,x(c∃yχx(s), s), a její hodnota při ohodnocení v0 je tedy 1.
Případy, kdy y je jedna z x1, . . , xk nebo ψ je tvaru ∀yχ, jsou podobné a jejich
rozmyšlení necháváme na čtenáři.
Je-li ψ sentence, (5) říká, že ψ platí v D, právě když v0(ψ) = 1. V D tedy platí
všechny formule z T a neplatí ϕ, tedy opravdu T /|= ϕ. QED
3.2 Hilbertovský predikátový kalkulus 165
Důkaz (zbývající části) věty o úplnosti Předpokládejme, že pro nějakou formuli
ϕ platí T |= ϕ, zdůvodníme T ϕ. Můžeme předpokládat, že ϕ je sentence.
Kdyby totiž ϕ měla volné proměnné x1, . . , xr, pracovali bychom se sentencí
∀x1 . . ∀xrϕ a využili bychom implikace T |= ϕ ⇒ T |= ∀xϕ a T ∀xϕ ⇒ T ϕ.
Podle tvrzení 3.2.9 je formule ϕ tautologickým důsledkem množiny T ∪H(L). Podle
věty o kompaktnosti ve výrokové logice existuje konečná množina F ⊆ T ∪ H(L)
taková, že ϕ je tautologickým důsledkem množiny F. Pišme F ve tvaru
F = {α1, . . , αk, β1, . . , βn},
kde každá z formulí αi je axiom speciﬁkace nebo prvek množiny T a β1, . . , βn
jsou henkinovské axiomy. Předpokládejme, že henkinovské axiomy βj jsou uspořádány
tak, že axiomy příslušné henkinovským konstantám vyšších řádů předcházejí
axiomy příslušné konstantám nižších řádů. Na pořadí henkinovských axiomů příslušných
konstantám téhož řádu a na pořadí formulí αi nezáleží. Protože ϕ je
tautologický důsledek množiny F, formule
α1 → (α2 → ( . . → (αk → (β1 → ( . . → (βn → ϕ) . .)
je tautologie. Zvolme navzájem různé proměnné v1, . . , vn, které se nevyskytují
v F ani ve ϕ. Pro 1 ≤ j ≤ n označme cj henkinovskou konstantu, ke které přísluší
axiom βj, a pro libovolnou formuli γ v jazyce L+
označme γ formuli, která vznikne
z γ nahrazením všech výskytů konstant c1, . . , cn proměnnými v1, . . , vn. Je zřejmé,
že tímto nahrazením vznikne z tautologie opět tautologie, tedy formule dokazatelná
v teorii T. Takže
1: T α1 → (α2 → ( . . → (αk → (β1 → ( . . → (βn → ϕ ) . .).
Platí ovšem ϕ = ϕ, protože ϕ neobsahuje henkinovské konstanty. Je-li αi vlastní
axiom teorie T, pak rovněž αi = αi. Je-li αi axiom speciﬁkace, pak αi je opět
axiom speciﬁkace. V obou případech platí T αi. Užijeme-li k-krát pravidlo MP,
dostaneme
2: T β1 → (β2 → ( . . → (βn → ϕ) . .).
Předpokládejme, že axiom β1 má tvar ψx(c∀xψ) → ∀xψ, kde c∀xψ je konstanta
řádu m. Úvaha pro druhý případ, kdy β1 má tvar ∃xψ →ψx(c∃xψ), je téměř stejná.
Máme
3: T (ψx(v1) → ∀xψ) → (β2 → ( . . → (βn → ϕ) . .).
Protože konstanta c∀xψ má maximální řád, nevyskytuje se ve formulích β2, . . , βn, a
v1 se tedy nevyskytuje v β2, . . , βn (a ovšem ani ve ϕ). Jsme tedy oprávněni použít
pravidlo Gen-E. Tím a užitím lemmatu 3.2.1 dostaneme
4: T ∃v1(ψx(v1) → ∀xψ) → (β2 → ( . . → (βn → ϕ) . .)
5: T (β2 → ( . . → (βn → ϕ) . .).
Tím jsme se zbavili formule β1. Užijeme-li pravidlo Gen-E a lemma 3.2.1 ještě
(n − 1)-krát, zbavíme se i formulí β2 až βn, a dostaneme T ϕ. QED
166 3 Predikátová logika
Věta o úplnosti je tedy dokázána, ale zatím pouze pro predikátovou logiku bez
rovnosti. Do kalkulu jsme dosud nepřijali žádné axiomy nebo pravidla o rovnítku.
To neznamená, že rovnítko nesmíme užívat. Nejsme ale schopni o něm dokázat
nic speciﬁckého. V predikátové logice bez rovnosti není předepsáno, že realizace
symbolu „= je vždy rovnost. Může to být libovolná binární relace.
Příklad 3.2.10 Formule ∃x∀y(x = y) → ∀y∃x(x = y) platí v každé struktuře
bez ohledu na realizaci rovnítka, a podle věty o úplnosti je tedy dokazatelná v HK.
Je-li ale povoleno realizovat rovnítko libovolnou binární relací, snadno lze nalézt
strukturu, ve které neplatí formule ∀x∀y(x = y → y = x). Ta tedy v dosud
uvažovaném kalkulu není dokazatelná.
Naším cílem je nyní stanovit modiﬁkaci HKe kalkulu HK tak, aby byla adekvátní
pro predikátovou logiku s rovností. Chceme tedy, aby věta 3.2.8 zůstala v platnosti
i v případě, kdy dokazatelností se myslí dokazatelnost v kalkulu HKe a strukturou
se myslí struktura, ve které je rovnítko povinně realizováno rovností. Uvidíme, že
v důkazu věty o úplnosti pro predikátovou logiku s rovností půjde vlastně pouze o
to, jak z modelu, ve kterém je rovnítko realizováno nějak, sestrojit model, v němž
je realizováno rovností. Použijeme konstrukci, které se v algebře říká faktorizace.
Nechť A a B jsou struktury pro jazyk L a nechť f : A → B. Řekneme, že f
zachovává (n-ární) funkční symbol F ∈ L, jestliže pro libovolnou n-tici a1, . . , an
prvků z A platí rovnost
f(FA
(a1, . . , an)) = FB
(f(a1), . . , f(an)).
Řekneme, že f zachovává (n-ární) predikátový symbol P ∈ L, jestliže pro libovolnou
n-tici a1, . . , an prvků z A platí ekvivalence
[a1, . . , an] ∈ PA
⇔ [f(a1), . . , f(an)] ∈ PB
.
Řekneme, že f je homomorﬁsmus struktur A a B, jestliže f zachovává všechny
(funkční i predikátové) symboly jazyka L.
Lemma 3.2.11 (a) Homomorﬁsmus f : A → B struktur A a B pro jazyk L zachovává
všechny otevřené formule. To znamená, že pro libovolnou otevřenou formuli
ϕ(x1, . . , xn) a libovolnou n-tici a1, . . , an prvků z množiny A platí ekvivalence
A |= ϕ[a1, . . , an] ⇔ B |= ϕ[f(a1), . . , f(an)].
(b) Pokud navíc f zobrazuje A na B, pak f zachovává všechny formule jazyka L,
tj. ekvivalence z tvrzení (a) platí pro libovolnou formuli ϕ jazyka L.
Důkaz Je-li t(x1, . . , xn) libovolný term jazyka L a jsou-li a1, . . , an prvky struktury
A, pak f(tA
[a1, . . , an]) = tB
[f(a1), . . , f(an)]. Jinými slovy, homomorﬁsmus
zachovává všechny termy. To se dokáže indukcí podle složitosti termu t a využitím
podmínek T1 a T2 a předpokladu, že f zachovává všechny funkční symboly. Nechť
3.2 Hilbertovský predikátový kalkulus 167
dále P ∈ L je m-ární predikátový symbol, t1(x1, . . , xn) až tm(x1, . . , xn) jsou termy
jazyka L a a1, . . , an jsou prvky struktury A. Pak
A |= P(t1, . . , tm)[a1, . . , an] ⇔ [t1[a], . . , tm[a]] ∈ PA
⇔ [f(tA
1 [a]), . . , f(tA
m[a])] ∈ PB
⇔ [tB
1 [f(a1), . . , f(an)], . . , tB
m[f(a1), . . , f(an)]] ∈ PB
⇔ B |= P(t1, . . , tm)[f(a1), . . , f(an)],
kde první a poslední ekvivalence je podmínka T3, druhá plyne z toho, že f zachovává
symbol P, a třetí je fakt, že f zachovává termy. Tím je ověřeno, že f
zachovává atomické formule. Zbytek je indukce podle souhrnného počtu logických
spojek (v (b) podle souhrnného počtu logických spojek a kvantiﬁkátorů) ve formuli
ϕ. Nechť například ϕ(x1, . . , xn) je tvaru ∃vψ(v, x1, . . , xn) a pro ψ již tvrzení
platí. Když B |= ϕ[f(a1), . . , f(an)], tj. B |= (∃vψ(v, x))[f(a1), . . , f(an)], pak (dle
podmínky T8) existuje b ∈ B takové, že B |= ψ[b, f(a1), . . , f(an)]. Protože f zobrazuje
A na B, existuje a ∈ A takové, že b = f(a). Tedy B |= ψ[f(a), f(a1), . . , f(an)],
indukční předpoklad dává A |= ψ[a, a1, . . , an] a dále A |= (∃vψ)[a1, . . , an]. Tím
jsme na ukázku provedli ten z kroků důkazu tvrzení (b), ve kterém se uplatní podmínka,
že Rng(f) = B. QED
Kalkulus HKe pro predikátovou logiku s rovností deﬁnujme jako rozšíření kalkulu
HK o následující axiomy:
E1: ∀x(x = x),
E2: ∀x∀y(x = y → y = x),
E3: ∀x∀y∀z(x = y & y = z → x = z),
E4: ∀x∀y(x1 = y1 & . . & xn = yn → F(x1, . . , xn) = F(y1, . . , yn)),
E5: ∀x∀y(x1 = y1 & . . & xn = yn → (P(x1, . . , xn) ≡ P(y1, . . , yn))),
kde F je libovolný funkční a P libovolný predikátový symbol. Axiomům E1–E5
říkáme axiomy rovnosti. E1–E3 jsou jednotlivé axiomy, E4 a E5 jsou schémata.
Každý funkční a predikátový symbol (zvoleného jazyka) má jeden axiom tvaru E4
resp. E5. Kalkulus HKe má tedy odvozovací pravidla MP, Gen-A a Gen-E a logické
axiomy trojího druhu: výrokové axiomy tvaru A1–A7, axiomy o kvantiﬁkátorech
B1 a B2 a axiomy rovnosti E1–E5. Jednoduchý (ne zcela kompletní) důkaz v kalkulu
HKe může vypadat například takto:
1: ∀x∀y(x = y → y = x) → ∀y(x = y → y = x) ; B1
2: ∀y(x = y → y = x) → (x = x + y → x + y = x) ; B1
3: x = x + y → x + y = x ; 1, 2, E2
4: y = x + y & x + y = x → y = x ; B1, E3
168 3 Predikátová logika
5: y = x + y & x = x + y → y = x ; 3, 4
6: ∀v(v = x + v) → y = x + y ; B1
7: ∀v(v = v + y) → x = x + y ; B1
8: ∀v(v = x + v) & ∀v(v = v + y) → y = x ; 5, 6, 7.
Důkaz jsme opět zkrátili vynecháním výrokových kroků: formule (5) je tautologickým
důsledkem formulí (3) a (4) a formule (8) je tautologickým důsledkem formulí
(5)–(7). Formule (4) je z axiomu E3 odvozena trojnásobným užitím axiomu B1
podobně, jako byla formule (3) odvozena z (E2) (viz cvičení 10). Uvedený důkaz
je formálním důkazem tvrzení pokud x je levý a y pravý neutrální prvek operace +,
pak x a y se sobě rovnají. Další příklady důkazů v kalkulu HKe budou uvedeny za
důkazem věty 3.2.13 spolu s příklady axiomatických teorií.
V následující větě 3.2.12 dokážeme, že kalkulus HKe je silně korektní i silně
úplný vůči sémantice predikátové logiky s rovností. Znění věty 3.2.12, věty o silné
úplnosti kalkulu HKe, je do písmene stejné jako znění věty 3.2.8. Dokonce i deﬁnice
relace |= je stejná: T |= ϕ, jestliže ϕ platí ve všech modelech teorie T. Rozdíl
je v tom, že modelem teorie T se nyní myslí struktura pro predikátovou logiku
s rovností (v níž platí všechny axiomy teorie T) a dokazatelnost a bezespornost se
nyní vztahují ke kalkulu HKe.
Věta 3.2.12 (o silné úplnosti kalkulu HKe) (a) Je-li T libovolná teorie, pak
T má model, právě když T je bezesporná.
(b) Je-li T teorie a ϕ formule, pak T ϕ, právě když T |= ϕ.
Důkaz Obě implikace ⇒ vyjadřují silnou korektnost kalkulu HKe a jejich platnost
plyne ze silné korektnosti kalkulu HK a z faktu, že axiomy E1–E5 evidentně platí
v každé struktuře, ve které je rovnítko realizováno rovností. Implikace ⇐ v (a)
plyne z implikace ⇐ v (b) stejně jako v důkazu věty 3.2.8. Zbývá tedy dokázat
implikaci ⇐ v (b).
Nechť tedy T je teorie v jazyce L a ϕ je formule, kterou nelze (pomocí pravidel a
axiomů kalkulu HKe) dokázat z předpokladů T. Chceme sestrojit model K teorie T,
který je strukturou pro predikátovou logiku s rovností a pro který platí K /|= ϕ.
Označme E množinu všech axiomů rovnosti pro jazyk L. Nedokazatelnost formule
ϕ v kalkulu HKe z množiny předpokladů T znamená, že ϕ není v kalkulu HK
dokazatelná z množiny předpokladů T ∪ E. Podle věty o úplnosti 3.2.8 existuje
struktura M taková, že M |= T, M |= E a M /|= ϕ. Deﬁnujme na nosné množině
M struktury M relaci ≈ předpisem a1 ≈ a2 ⇔ M |= (x = y)[a1, a2]. Protože
v M platí axiomy E1–E3, relace ≈ je ekvivalence. Pro každé a ∈ M označme [a]
třídu ekvivalence ≈, která obsahuje a. Tedy [a] = { a ∈ M ; a ≈ a }. Označme K
množinu M/≈, tj. množinu { [a] ; a ∈ M }, a označme f funkci a → [a]. Funkce f
zobrazuje M na K. Je-li F ∈ L n-ární funkční symbol, deﬁnujme jeho realizaci
FK
: Kn
→ K předpisem
FK
([a1], . . , [an]) = [FM
(a1, . . , an)]. (∗)
3.2 Hilbertovský predikátový kalkulus 169
Jsou-li tedy b1, . . , bn libovolné prvky struktury K, funkce FK
určí jejich obraz tak,
že zvolí „reprezentanty a1, . . , an tříd b1, . . , bn, tj. prvky a1, . . , an množiny M
takové, že a1 ∈ b1 až an ∈ bn, a za obraz n-tice [b1, . . , bn] prohlásí onu třídu
ekvivalence ≈, která obsahuje prvek FM
(a1, . . , an). Protože v M platí axiom E4
pro symbol F, na volbě reprezentantů nezáleží, deﬁnice operace FK
je korektní.
Analogicky, je-li P libovolný n-ární predikátový symbol jazyka L, z platnosti jemu
příslušného axiomu E5 v M plyne, že předpis
[[a1], . . , [an]] ∈ PK
⇔ [a1, . . , an] ∈ PM
(∗∗)
korektně deﬁnuje n-ární relaci PK
na struktuře K. Podmínky (∗) a (∗∗) navíc
znamenají, že funkce f zachovává všechny funkční i predikátové symboly jazyka L.
Máme tedy strukturu K pro jazyk L a funkci f z M na K, která je homomorﬁsmem
struktur M a K. Podle lemmatu 3.2.11(b) v M a v K platí tytéž sentence. Tedy
K |= T a K /|= ϕ. Když třídy [a1] a [a2] ekvivalence ≈ splňují v K formuli x = y,
pak, protože f zachovává i symbol =, prvky a1 a a2 ve struktuře M také splňují
formuli x = y. Podle deﬁnice relace ≈ tedy platí a1 ≈ a2 a [a1] = [a2]. Tím jsme
ověřili, že rovnítko je v K realizováno rovností.
Získali jsme model K teorie T, který je strukturou pro predikátovou logiku s rovností
a ve kterém neplatí formule ϕ. Tím jsme dokázali, že ϕ v predikátové logice
s rovností nevyplývá z T. QED
Následující věta, slabá verze Löwenheimovy-Skolemovy věty, je důsledkem důkazů
vět 3.2.8 a 3.2.12. K jejímu znění poznamenejme, že mohutnost libovolné
množiny X značíme |X|. Jsou-li κ a λ kardinální čísla a alespoň jedno z nich je nekonečné,
pak κ+λ = max{κ, λ}. Jsou-li navíc obě nenulová, platí i κ·λ = max{κ, λ}.
Součet ℵ0 + |L| ve znění věty 3.2.13 je tedy roven |L| v případě, kdy jazyk L je
nekonečný, a je roven ℵ0 v případě, kdy je konečný. Věta 3.2.13 tedy pro žádnou
teorii nezaručuje existenci konečného modelu (a z příkladu 3.1.19(f) víme, že
některé bezesporné teorie s konečným jazykem a konečně mnoha axiomy žádný konečný
model nemají). Nicméně bezprostředním důsledkem věty 3.2.13 je tvrzení, že
každá bezesporná teorie s jazykem, který je konečný nebo spočetný (říká se nejvýše
spočetný), má model, který je také nejvýše spočetný. Mohutnost modelu deﬁnujeme
jako mohutnost jeho nosné množiny. V kontextu věty 3.2.13 by ale nevadilo,
kdybychom uvažovali i mohutnost realizací symbolů jazyka L.
Věta 3.2.13 Nechť T je bezesporná teorie s jazykem L. Pak T má model, jehož
mohutnost je nejvýše ℵ0 + |L|.
Důkaz Označme κ = ℵ0 + |L| a vraťme se k důkazu lemmatu 3.2.9. Každá henkinovská
konstanta c∃xψ a c∀xψ řádu 0 jednoznačně určuje sentenci ∃xψ resp. ∀xψ.
Počet sentencí jazyka L je omezen počtem všech konečných posloupností prvků
množiny, jejíž mohutnost je nejvýše κ, tedy opět kardinálním číslem κ. Henkinovských
konstant řádu 0 je tedy nejvýše κ. Indukce dle m dává, že také henkinovských
170 3 Predikátová logika
konstant řádu m je nejvýše κ, a všech henkinovských konstant (všech řádů dohromady)
je tak ℵ0 · κ = κ. Jazyk L+
vznikl přidáním henkinovských konstant k L
a jeho mohutnost je rovněž omezena číslem κ. Také všech uzavřených termů jazyka
L+
je nejvýše κ. Tedy pro nosnou množinu D struktury D sestrojené v důkazu
lemmatu 3.2.9 platí |D| ≤ κ. V důkazu věty 3.2.12 můžeme tedy předpokládat,
že |M| ≤ κ. Protože f zobrazuje M na K, platí také |K| ≤ κ. QED
3.2.2 Příklady důkazů a teorií
Ve zbytku tohoto oddílu uveďme několik axiomatických teorií, které pokládáme
za důležité nebo za užitečné pro další výklad. Ukážeme si také další příklady
formálních důkazů. Uvažujme nejprve strukturu N, 0, s přirozených čísel s nulou
a s následnickou funkcí, tj. s funkcí x → x + 1. Tato struktura je strukturou pro
jazyk {0, S} s konstantou a s unárním funkčním symbolem. Snadno lze ověřit, že
ve struktuře N, 0, s platí následující sentence:
Q1: ∀x∀y(S(x) = S(y) → x = y),
Q2: ∀x(S(x) = 0),
Q3: ∀x(x = 0 → ∃y(x = S(y))),
Lm: ∀x(S(m)
(x) = x), m ≥ 1.
Zápis S(m)
(x) ve čtvrtém řádku označuje term S(S(. . (x) . .) s m výskyty symbolu S.
Například sentence L3 tvrdí, že třemi skoky následnické funkce se z žádného objektu
x nelze dostat zpět do x. Označme SUCC teorii s axiomy Q1–Q3 a Lm,
kde m ≥ 1. Teorie SUCC má tedy nekonečně mnoho axiomů: tři jednotlivé axiomy
a dále schéma, jehož instance zakazují „konečné cykly . Teorii SUCC říkejme teorie
následnické funkce nebo krátce teorie následníka.
Každá struktura D, e, f taková, že e ∈ D je vytčený prvek a f : D → D
je prostá funkce, pro kterou platí Rng(f) = D − {e} a která neporušuje žádný
z axiomů Lm, je modelem teorie SUCC. A naopak, každý model teorie SUCC vypadá
takto. Jak už bylo řečeno, jedním z modelů teorie SUCC je struktura N, 0, s .
V oddílu 3.4 se dozvíme více o modelech teorie SUCC. Budeme se tam věnovat
otázkám, zda teorie SUCC má i jiné modely, než je „preferovaný model N, 0, s (na
tuto otázku dovede čtenář pravděpodobně odpovědět již nyní), jak takové modely
vypadají a zda je lze vyloučit (zakázat) přidáním dalších axiomů k teorii SUCC.
Připomeňme si, viz str. 144, že term tvaru S(S(. . (0) . .) s m výskyty symbolu S
nazýváme numerál a značíme jej m. Položme si otázku, zda v teorii SUCC lze
dokázat sentenci 2 = 1 nebo sentenci ∀x∃y(S(y) = x). Jako obvykle, chceme-li
zdůvodnit dokazatelnost nějaké formule z nějaké množiny předpokladů, může být
užitečné utvořit nejprve neformální důkaz. Neformální důkaz sentence 2 = 1 může
vypadat například takto:
Nechť S(S(0)) = S(0). Axiom Q1 a volba x := S(0) a y := 0 dávají S(0) = 0.
To je spor s Q2.
3.2 Hilbertovský predikátový kalkulus 171
Sentenci ∀x∃y(S(y) = x) lze neformálně dokázat takto:
Nechť x je dáno. Platí x = S(0) nebo x = S(0). Když x = S(0), lze zvolit
y := S(0), neboť z předchozí úvahy víme, že S(S(0)) = S(0). Když x = S(0),
lze zvolit y := 0.
Neformální důkaz zpravidla umožňuje odhadnout, jaké instance logických axiomů
máme použít, chceme-li sestrojit formální důkaz, tj. důkaz vyhovující deﬁnici důkazu
v kalkulu HKe:
1: ∀x(S(x) = 0) → S(0) = 0 ; B1
2: S(0) = 0 ; 1, Q2
3: S(S(0)) = S(0) → S(0) = 0 ; Podobně z B1 a Q1
4: S(S(0)) = S(0) ; 2, 3
5: S(S(0)) = S(0) → ∃y(S(y) = S(0)) ; B2
6: ∃y(S(y) = S(0)) ; 4, 5
7: S(y) = x & x = S(0) → S(y) = S(0) ; E3, B1
8: S(y) = x → ∃y(S(y) = x) ; B2
9: S(y) = S(0) → (x = S(0) → ∃y(S(y) = x)) ; 7, 8
10: ∃y(S(y) = S(0)) → (x = S(0) → ∃y(S(y) = x)) ; Gen-E
11: x = S(0) → ∃y(S(y) = x) ; 10, 6
12: S(0) = x → x = S(0) ; E2, B1
13: S(0) = x → ∃y(S(y) = x) ; B2
14: ∃y(S(y) = x) ; 11, 12, 13
15: S(0) = 0 → ∃y(S(y) = x) ; 14
16: S(0) = 0 → ∀x∃y(S(y) = x) ; Gen-A, 15
17: ∀x∃y(S(y) = x) ; 16, 2.
Při odvození formulí (6), (9), (11) a (14) jsme opět použili úmluvu o vynechání
výrokových kroků. Odvození formulí (3), (7) a (12) jsme zkrátili v duchu cvičení 10.
Ve cvičení 5 se pracuje s pravidlem Gen tvaru ϕ / ∀xϕ. Při odvození formule (17)
jsme ukázali, jak lze pravidlo Gen simulovat pomocí pravidla Gen-A a libovolné
dokazatelné sentence, tj. naznačili jsme část řešení cvičení 5.
Protože tvrdíme, že je pouze věcí zkušenosti, jak správný a dostatečně podrobný
neformální důkaz přepsat (přeložit) na důkaz v kterémkoliv (korektním a úplném)
172 3 Predikátová logika
kalkulu, a protože jistou zkušenost s formálními důkazy již máme, v dalším textu
budeme neformální důkazy užívat velmi často. K jejich odlišení od ostatního textu
užíváme bezpatkové písmo. Bezpatkovým písmem je tedy zapsána úvaha, kterou lze
formalizovat, tj. zapsat pomocí formulí daného jazyka tak, aby se vyhovělo deﬁnici
důkazu v daném kalkulu. Někdy bezpatkovým písmem vyznačujeme také podmínky
vyjadřující vlastnosti formálních objektů nebo tvrzení o formálních objektech. I
v těchto případech platí, že čtenář si za nimi má představit formule příslušného
jazyka. V některých případech (zejména v kapitole 2) užíváme bezpatkové písmo
také k zápisu algoritmů. I tam označuje něco, co může být (má být) formalizováno.
Lze také argumentovat, že neformální důkaz je vlastně ověření faktu, že daná
formule je v každé struktuře splněna všemi ohodnoceními, která splňují všechny
předpoklady, a že tedy existenci formálního důkazu, který je překladem našeho
neformálního, zaručuje věta o úplnosti 3.2.12.
V některých případech lze dokazatelnost nějaké formule ϕ z množiny předpokladů
∆ rychle zdůvodnit přímým užitím věty o úplnosti, tj. úvahou o strukturách,
o které netvrdíme, že je neformálním důkazem. Pěkný a v dalším textu užitečný
příklad je tento: každá sentence tvaru
∀x1 . . ∀xk∃y(S(m)
(y) = x1 & . . & S(m)
(y) = xk) (∗)
vyplývá z axiomů Q1 a Q2 teorie SUCC, a je tedy v teorii SUCC dokazatelná. Všimněme
si, že sentence ∀x∃y(S(y) = x), kterou jsme dokázali, je speciálním případem
schématu (∗). Vyplývání každé sentence tvaru (∗) se zdůvodní následovně. Nechť
D je libovolná struktura pro jazyk {0, S}, ve které platí sentence Q1 a Q2, a nechť
a1, . . , ak je ohodnocení proměnných x1, . . , xk ve struktuře D. V množině D existuje
nejvýše jedno ohodnocení b proměnné y takové, že ohodnocení a1, . . , ak, b splňuje
formuli S(m)
(y) = xi, a tedy v D existuje nejvýše k prvků b takových, že ohodnocení
a1, . . , ak, b splňuje disjunkci S(m)
(y) = x1 ∨ . . ∨ S(m)
(y) = xk. Nekonečně
mnoho prvků d ∈ D tedy splňuje její negaci S(m)
(y) = x1 & . . & S(m)
(y) = xk,
neboť struktura D musí být nekonečná (viz 3.1.19(f)). Tím je ověřeno, že ke každému
ohodnocení proměnných x1, . . , xk lze zvolit ohodnocení proměnné y tak, aby
výsledné ohodnocení splňovalo v D formuli S(m)
(y) = x1 & . . & S(m)
(y) = xk.
Teorie ostrého lineárního uspořádání má jazyk {<} s jediným binárním predikátem
a axiomy
LO1: ∀x∀y∀z(x < y & y < z → x < z),
LO2: ∀x∀y(x < y → ¬(y < x)),
LO3: ∀x∀y(x < y ∨ x = y ∨ y < x),
které vyjadřují, že relace < je tranzitivní, antisymetrická a lineární. Teorii s axiomy
LO1–LO3 značíme LO. Teorie LO vznikla přidáním axiomu LO3 k teorii ostrého
uspořádání z příkladu 3.2.5. Modely teorie ostrého uspořádání jsou všechny (ostře)
uspořádané množiny, a nic jiného. Modely teorie LO jsou všechny lineárně ostře
uspořádané množiny (tj. takové, které jsou uspořádané a ve kterých každé dva prvky
3.2 Hilbertovský predikátový kalkulus 173
jsou srovnatelné), a nic jiného. Důležité příklady modelů teorie LO jsou struktury
N, < , Q, < nebo R, < přirozených (racionálních, reálných) čísel s (obvyklým)
uspořádáním.
Teorie DNO, teorie hustého lineárního uspořádání bez minima a maxima, má
jazyk {<}, axiomy LO1–LO3 teorie LO a dále axiomy
Dn1: ∀x∀y(x < y → ∃z(x < z & z < y)),
Dn2: ∀x∃y1∃y2(y1 < x & x < y2).
Je zřejmé, že struktury Q, < a R, < nebo třeba reálný interval (0, 1) s obvyklým
uspořádáním jsou modely teorie DNO. Na druhé straně struktury Z, < a N, <
jsou příklady struktur, které nejsou modely teorie DNO.
Teorie neostrého lineárního uspořádání má rovněž jazyk s jediným binárním
predikátem, který se v tomto případě píše ≤, a axiomy
∀x∀y∀z(x ≤ y & y ≤ z → x ≤ z),
∀x(x ≤ x),
∀x∀y(x ≤ y & y ≤ x → x = y),
∀x∀y(x ≤ y ∨ y ≤ x),
které postulují, že relace ≤ je tranzitivní, reﬂexivní, slabě antisymetrická a lineární.
Snadno lze ověřit (cvičení), že pokládáme-li formuli x ≤ y za zkratku pro formuli
x < y ∨ x = y, všechny axiomy teorie neostrého lineárního uspořádání lze dokázat
v teorii LO. Teorii neostrého lineárního uspořádání lze tedy pokládat za obsaženou
v teorii LO v tom smyslu, že každá její formule je vlastně současně formulí teorie LO
a každý důkaz v ní je vlastně současně důkazem v teorii LO.
V teorii neostrého lineárního uspořádání označme Dn(x1, . . , xn, y) formuli
x1 ≤ y & . . & xn ≤ y & (x1 = y ∨ . . ∨ xn = y),
kde n ≥ 1. Formuli Dn(x1, . . , xn, y) lze číst objekt y je maximální mezi x1, . . , xn.
Sentence ∀x1 . . ∀xn∃yDn(x1, . . , xn, y) tedy tvrdí, že mezi každými n objekty (ne
nutně různými) existuje maximální objekt. Je jasné, že tato sentence platí v každé
neostře lineárně uspořádané množině. Dle věty 3.2.12 je tedy dokazatelná v teorii
neostrého lineárního uspořádání a ve smyslu předchozího odstavce je dokazatelná
také v teorii LO. Abychom ještě jednou ukázali, jak fungují pravidla a axiomy
kalkulu HKe, dokážeme existenci důkazu sentence ∀x1 . . ∀xn∃yDn(x1, . . , xn, y)
přímo, indukcí podle n. Přesněji řečeno, předvedeme pouze indukční krok. Sestrojíme
tedy (víceméně kompletní) důkaz sentence ∀x1 . . ∀xn+1∃yDn+1(x1, . . , xn+1, y)
z axiomů teorie neostrého uspořádání za podmínky, že je již sestrojen důkaz sentence
∀x1 . . ∀xn∃yDn(x1, . . , xn, y). Pišme x místo x1, . . , xn.
1: ∀x1 . . ∀xn∃yDn(x, y) ; Již dokázáno
174 3 Predikátová logika
2: ∀x(x ≤ x) → xn+1 ≤ xn+1 ; B1
3: ∀x(x = x) → xn+1 = xn+1 ; B1
4: xn+1 ≤ xn+1 ; 2, axiom
5: xn+1 = xn+1 ; 3, E1
6: x1 ≤ y & y ≤ xn+1 → x1 ≤ xn+1 ; B1, axiom
...
...
n + 5: xn ≤ y & y ≤ xn+1 → xn ≤ xn+1 ; ...
n + 6: y ≤ xn+1 & Dn(x, y) → Dn+1(x, xn+1, xn+1) ; 6 až n + 5, 4 a 5
n + 7: y ≤ xn+1 & Dn(x, y) → ∃yDn+1(x, xn+1, y) ; n + 6, B2
n + 8: xn+1 ≤ y & Dn(x, y) → Dn+1(x, xn+1, y) ; Tautologie
n + 9: xn+1 ≤ y & Dn(x, y) → ∃yDn+1(x, xn+1, y) ; n + 8, B2
n + 10: ∀x∀y(x ≤ y ∨ y ≤ x) → xn+1 ≤ y ∨ y ≤ xn+1 ; B1
n + 11: xn+1 ≤ y ∨ y ≤ xn+1 ; n + 10, axiom
n + 12: Dn(x, y) → ∃yDn+1(x, xn+1, y) ; n + 11, n + 9, n + 7
n + 13: ∃yDn(x, y) → ∃yDn+1(x, xn+1, y) ; Gen-E
n + 14: ∀x∃yDn(x, y) → ∃yDn(x, y) ; B1
n + 15: ∀x∃yDn(x, y) → ∃yDn+1(x, xn+1, y) ; n + 14, n + 13
n + 16: ∀x∃yDn(x, y) → ∀x∀xn+1∃yDn+1(x, xn+1, y) ; n + 15, Gen-A
n + 17: ∀x1 . . ∀xn+1∃yDn+1(x, xn+1, y) ; n + 16, 1.
Je samozřejmé, že při odvození formule n + 14 a při odvození formule n + 16 z formule
n + 15 je třeba axiom B1 resp. pravidlo Gen-A užít n-násobně.
Je-li D libovolná struktura pro nějaký jazyk L, deﬁnujme množinu Th(D) jako
množinu všech sentencí platných v D. Množině Th(D) říkáme teorie struktury D.
Naše ostatní příklady axiomatických teorií uvedené v tomto oddílu mají vždy množinu
axiomů tvaru konečně mnoho sentencí plus případně konečně mnoho schémat.
Teorie Th(D) nějaké struktury D se od těchto příkladů liší tím, že množina všech
sentencí ϕ, které jsou jejími axiomy, netvoří „úhledný seznam , nýbrž je určena
podmínkou, totiž podmínkou D |= ϕ. To však deﬁnice axiomatické teorie připouští.
Pro libovolnou strukturu D platí Thm(Th(D)) = Th(D), každá sentence
dokazatelná v teorii Th(D) je současně jejím axiomem.
3.2 Hilbertovský predikátový kalkulus 175
Zermelova-Fraenkelova teorie množin ZF má jazyk {∈} sestávající z jediného
binárního predikátového symbolu. Objektům teorie ZF se říká množiny. Teorie ZF
má (tj. obvykle se formuluje tak, že má) šest jednotlivých axiomů (axiom existence,
extenzionality, dvojice, sumy, potence a nekonečna) a dvě axiomatická schémata
(schéma vydělení a schéma nahrazení). Na ukázku uveďme axiom dvojice:
∀x∀y∃z∀v(v ∈ z ≡ v = x ∨ v = y),
který postuluje, že k libovolným dvěma množinám x a y existuje množina z, jejímiž
prvky jsou x a y, a nic jiného. Ostatní axiomy neuvádíme, lze je nalézt v libovolné
učebnici věnované teorii množin (doporučujeme například [2]). Kromě vyjmenovaných
axiomů a schémat se k teorii ZF obvykle přidávají další více nebo méně
„volitelné axiomy, jako je axiom regularity nebo axiom výběru AC.
Vedle Zermelovy-Fraenkelovy teorie množin se často lze setkat také s Gödelovou-Bernaysovou
teorií množin GB. Objektům teorie GB se říká třídy, množina je
v GB deﬁnována jako třída, která je prvkem nějaké (jiné nebo stejné) třídy. Třídám,
které nejsou množiny, se říká vlastní třídy. V GB lze dokázat existenci vlastních
tříd. Teorie ZF a GB spolu úzce souvisejí, neboť se shodují v tom, jaká tvrzení o
množinách v nich lze dokázat. Důležitým metamatematickým rozdílem mezi teoriemi
ZF a GB je to, že při formulaci axiomů teorie GB se lze obejít bez axiomatických
schémat. Gödelova-Bernaysova teorie množin je konečně axiomatizovatelná.
Význam různých variant teorie množin (ZF, GB nebo ještě dalších) je v tom, že
všechny matematické pojmy (čísla, funkce, prostory, struktury, . . . ) lze redukovat
na pojem množiny a v důkazech tvrzení o těchto pojmech lze vystačit s axiomy
teorie množin. To znamená, že teorie množin je světem matematiky1
v tom smyslu,
že o veškeré matematice si můžeme myslet, že se děje uvnitř teorie množin. Říká
se také, že matematika je nebo může být formalizována v teorii množin. Zajímavá
otázka z hlediska logického i ﬁlozoﬁckého zní, zda roli metamatematiky, tj. roli
teorie, která je světem matematiky, by nemohla nebo dokonce neměla hrát jiná
teorie než ZF nebo GB, které jsou pro tento účel nejčastěji přijímány.
V knihách jako je tato, věnovaných logice, tedy teorie množin hraje dvojakou
úlohu. Jako v každé jiné matematice je arbitrem, který určuje, co platí o
zkoumaných objektech (což v případě logiky jsou struktury, axiomatické teorie,
algoritmy, . . . ), a zároveň je jako jedna z řady axiomatických teorií předmětem
zkoumání.
Rozmysleme si podrobně, že teorie ZF nemá žádné konečné modely. Nejprve si
uvědomme, že struktura pro jazyk s jedním binárním predikátem je přesně to, čemu
jsme v dřívějších kapitolách říkali orientovaný graf. Modely teorie ZF tvoří tedy
podtřídu třídy všech orientovaných grafů. Dále si připomeňme, že acyklický graf je
deﬁnován jako orientovaný graf neobsahující cykly a že je to takový graf, v němž
z žádného vrcholu c nevede sled nenulové délky zpět do c. Postupujme sporem,
předpokládejme, že G = G, R je konečný model teorie ZF. Deﬁnujme dočasně, že
vrchol d grafu G je fundovaný, jestliže d není v G dosažitelný z žádného vrcholu c
1Tento obrat známe od P. Vopěnky.
176 3 Predikátová logika
takového, že z c do c vede sled nenulové délky. Například v grafu B na str. 141
jsou vrcholy a a b fundované, zbývající vrcholy shodou okolností pojmenované c a d
fundované nejsou. Protože v ZF lze dokázat sentenci existuje množina, která nemá
žádné prvky, v našem grafu G existuje (alespoň jeden) vrchol, do kterého nevedou
žádné hrany. Je zřejmé, že každý vrchol, do kterého nevedou hrany, je fundovaný,
a dále je zřejmé, že existuje-li sled nenulové délky z c do c, pak c není fundovaný.
Označme G0 množinu všech fundovaných vrcholů grafu G a označme R0 restrikci
relace R na množinu G0. Graf G0, R0 je (neprázdný) acyklický podgraf grafu G.
Lze dokázat (cvičení), že každý konečný acyklický graf má maximální vrchol, tj.
vrchol, ze kterého nevedou žádné hrany. Označme c0 (některý) maximální vrchol
grafu G0, R0 . V grafu G0, R0 z vrcholu c0 nevedou hrany, v G mohou vést,
ale jen do vrcholů, které nejsou fundované. Aplikujme axiom dvojice na x := c0
a y := c0. V grafu G k vrcholu c0 existuje vrchol d, který v G splňuje formuli množina
c0 je jediným prvkem množiny d. Vrchol d je fundovaný, neboť kdyby existoval
vrchol c, sled nenulové délky z c do c a sled z c do d, pak tento sled z c do d by
nemohl minout vrchol c0, a c0 by nebyl fundovaný. Současně ale d není fundovaný,
neboť z c0 nevedou hrany do fundovaných vrcholů. Tím jsme dospěli ke sporu.
Na našem zdůvodnění, že teorie ZF nemá žádné konečné modely, je snad zajímavé
také to, že jsme se v něm obešli bez většiny axiomů teorie ZF včetně axiomu
extenzionality.
Čtenář by mohl namítnout, že existuje jednodušší postup, jak dokázat neexistenci
konečných modelů teorie ZF: v ZF lze dokázat, že existují nekonečné množiny,
musí to tedy platit v každém modelu; do prvku modelu, o kterém v takovém modelu
platí, že je nekonečnou množinou, musí vést nekonečně mnoho hran, tj. musí
do něj vést hrany z nekonečně mnoha různých vrcholů. Pokud by ale takovýto
argument měl být bez dalšího přijat jako správný, proč nepřijmout i tento argument:
v ZF lze dokázat i existenci nespočetných množin, a do vrcholu, o kterém
v grafu G, R platí, že je nespočetnou množinou, musí vést nespočetně mnoho
různých hran. Tento druhý argument ale rozhodně správný není, neboť má-li ZF
jakékoliv modely, pak podle Löwenheimovy-Skolemovy věty má i spočetné modely.
Modelem teorie ZF je každý orientovaný graf, ve kterém platí všechny axiomy
ZF, a takové modely existují, je-li ZF bezesporná teorie. V tom případě existují
i spočetné (nutně nekonečné) modely ZF. Žádná přímá konstrukce modelu ZF není
známa. K tomuto faktu se ještě vrátíme v souvislosti s Druhou Gödelovou větou o
neúplnosti v kapitole 4. Tvrzení, že ZF má spočetné modely, je známo jako Skolemův
paradox. Nic paradoxního na něm ale není. Je-li a ∈ G a G, R |= ZF, může se
stát, že množina všech vrcholů, ze kterých vede hrana do a, je spočetná, a přitom
žádný prvek f ∈ G nesplňuje v G, R formuli množina f je funkce, která prostě
zobrazuje množinu a do množiny všech přirozených čísel. V tom případě vrchol a
v grafu G, R splňuje formuli množina a je nespočetná.
Teorie komutativních těles má jazyk {+, ·, 0, 1} se dvěma binárními funkčními
symboly a se dvěma konstantami 0 a 1, a axiomy
R1: ∀x∀y∀z(x + (y + z) = (x + y) + z),
3.2 Hilbertovský predikátový kalkulus 177
R2: ∀x∀y(x + y = y + x),
R3: ∀x(x + 0 = x),
R4: ∀x∃y(x + y = 0),
R5: ∀x∀y∀z(x · (y · z) = (x · y) · z),
R6: ∀x∀y(x · y = y · x),
R7: ∀x(x · 1 = x),
R8: ∀x(x = 0 → ∃y(x · y = 1)),
R9: ∀x∀y∀z(x · (y + z) = x · y + x · z),
R10: 0 = 1.
Objektům teorie komutativních těles říkejme čísla. Číslo y takové, že x + y = 0,
nazýváme číslem opačným k x a číslo y takové, že x · y = 1, nazýváme číslem
inverzním k x. V teorii komutativních těles lze snadno dokázat, že číslo 0 je jediné
číslo neutrální vůči sčítání a že číslo 1 je jediné číslo neutrální vůči násobení. To
vyjadřují sentence (e) a (f) v následujícím lemmatu. Ze sentencí (a)–(c) snadno
plyne, že ke každému x existuje jediné číslo opačné k x, ke každému nenulovému x
existuje jediné číslo inverzní k x a žádné číslo není inverzní k nule.
Přestože v jazyce teorie komutativních těles nemáme symbol „S pro označení
následnické funkce, můžeme v něm deﬁnovat numerály 0, 1, 2, . . . , a to jako termy
0, (0 + 1), ((0 + 1) + 1) atd. Například zápis 4 tedy v teorii komutativních těles
označuje term ((((0 + 1) + 1) + 1) + 1).
Lemma 3.2.14 Následující sentence (a)–(f) lze dokázat v teorii komutativních těles.
Sentence (g) a (h) lze v teorii komutativních těles dokázat pro každou dvojici
čísel n a m.
(a) ∀x∀y∀z(y + x = z + x → y = z), (e) ∀x(∀v(v + x = v) → x = 0),
(b) ∀x∀y∀z(x = 0 & y · x = z · x → y = z), (f) ∀x(∀v(v · x = v) → x = 1),
(c) ∀x(x · 0 = 0), (g) n + m = n + m,
(d) ∀x∀y(x · y = 0 → x = 0 ∨ y = 0), (h) n · m = n · m.
Důkaz Důkazy sentencí (a)–(f) jsou známé z algebry. Připomeňme z nich pouze
důkazy sentencí (a), (c) a (d), ostatní přenecháváme čtenáři:
Nechť čísla x, y a z jsou dána. Podle axiomu R4 existuje v takové, že x+v = 0.
Nechť y + x = z + x. Užití tohoto předpokladu, dvojí užití axiomu R3 a dvojí
užití axiomu R1 dává y = y + 0 = y + (x + v) = (y + x) + v = (z + x) + v =
z + (x + v) = z + 0 = z.
Nechť x je dáno. Platí 0 + x · 0 = x · 0 + 0 = x · 0 = x · (0 + 0) = x · 0 + x · 0.
Již dokázané tvrzení (a) dává 0 = x · 0.
Nechť x · y = 0. Z již dokázaného tvrzení (c) a axiomu R6 plyne x · y = 0 · y.
Je-li y = 0, tvrzení (b) dává x = 0.
178 3 Predikátová logika
Existence důkazů sentencí (f) a (g) se snadno dokáže indukcí podle m. Protože 0, 0
a n · 0 jsou tytéž termy a také n + 0 a n jsou tytéž termy, sentenci n+0 = n + 0 lze
odvodit užitím axiomu R3 a sentenci n·0 = 0 lze odvodit z již dokázané sentence (d).
Dále se snadno dokáže sentence n+m + 1 = n + m + 1, máme-li již důkaz sentence
n+m = n + m a uvědomíme-li si, že m + 1 je týž term jako (m+1), a n + m + 1 je
týž term jako (n + m + 1). Podobně se dokáže n · m + 1 = n · m + n užitím axiomů
R9 a R7, máme-li již dokázáno n · m = n · m. Rovnost n · m + n = n · (m + 1) lze
odvodit z již dokázané sentence (g). QED
V souladu s předchozími komentáři k větě o úplnosti jsme se v důkazu lemmatu
3.2.14 spokojili s neformálními důkazy. Připomeňme si, že formální důkaz
podobné sentence jako je 3.2.14(e), totiž sentence každý levý neutrální prvek je roven
každému pravému, jsme dříve také sestrojili.
Nadále budeme vypouštět nadbytečné závorky: místo (x+y)+z nebo x+(y+z)
píšeme pouze x + y + z, místo (x · y) · z nebo x · (y · z) píšeme pouze x · y · z. Dále
se domluvme, že tn
značí term t · t · . . · t s n výskyty (téhož) termu t. A konečně,
násobení má přednost před sčítáním. Zápis x2
+y·z je tedy zkratka za (x·x)+(y·z).
Lemma 3.2.15 Nechť t(x, y1, . . , yr) je term v jazyce teorie komutativních těles.
Pak existuje číslo n a termy s0(y), . . , sn(y) neobsahující x takové, že rovnost
∀y∀x(t(x, y) = s0(y) · xn
+ s1(y) · xn−1
+ . . + sn(y))
je dokazatelná v teorii komutativních těles.
Důkaz Indukcí podle složitosti termu t. Když t je konstanta 0 nebo 1 nebo některá
z proměnných yi, lze za n zvolit nulu a za s0 zvolit t. Když t je proměnná x, zvolme
n = 1, za s0 zvolme term 1 a za s1 zvolme term 0.
Nechť t je tvaru t1(x, y) + t2(x, y) a nechť pro term t1 již máme číslo n1 a termy
q0(y), . . , qn1 (y) a pro term t2 již máme číslo n2 a termy u0(y), . . , un2 (y). Lze předpokládat,
že n1 = n2, neboť tu z posloupností q0(y), . . , qn1 (y) a u0(y), . . , un2 (y),
která je kratší, můžeme doplnit nulami. K termu t volme n = n1 (čili n = n2) a
pro 0 ≤ i ≤ n1 volme qi(y) + ui(y) za term si(y).
Nechť t má tvar t1(x, y) · t2(x, y) a nechť pro t1 a t2 máme čísla n1 a n2 a termy
q0(y), . . , qn1
(y) a u0(y), . . , un2
(y) jako výše. Opět předpokládejme n1 = n2. Volme
n = 2n1, za termy s0(y), . . , sn(y) volme termy tvaru
i
j=0 qj(y)·ui−j(y), tj. termy
q0 · u0, q0 · u1 + q1 · u0, q0 · u2 + q1 · u1 + q2 · u0, . . .
Snadno lze ověřit, že rovnost t(x, y) =
2n1
i=0(
i
j=0 qj(y) · ui−j(y)) · xi
vyplývá
z předpokladu t1(x, y) =
n1
i=0 qi(y) · xi
a z předpokladu t2(x, y) =
n2
i=0 ui(y) · xi
.
QED
Lemma 3.2.15 tvrdí, že zvolíme-li proměnnou x, můžeme se na libovolný term
v jazyce komutativních těles dívat jako na polynom v x s koeﬁcienty neobsahujícími
x. V důkazu lemmatu 3.2.15 se uplatnily známé vědomosti o tom, že součet
3.2 Hilbertovský predikátový kalkulus 179
polynomů se stupni n1 a n2 je polynom stupně max{n1, n2} a jejich součin je polynom
stupně n1 + n2.
Modely teorie komutativních těles jsou ovšem všechna komutativní tělesa, a nic
jiného. Snadno lze nalézt dvouprvkové komutativní těleso, ve kterém platí 1+1 = 0.
Sentence 2 = 0 tedy není v teorii komutativních těles dokazatelná. Dalšími příklady
modelů teorie komutativních těles jsou struktury Q, +, ·, 0, 1 a R, +, ·, 0, 1 , kde
Q a R jsou jako obvykle množiny všech racionálních resp. reálných čísel. V oddílu
3.5 přidáme k axiomům R1–R10 další axiomy R11–R16 týkající se uspořádání.
Modelem výsledné teorie bude struktura R, +, ·, 0, 1, < , modelem ale nebude
struktura Q, +, ·, 0, 1, < a nebude jím ani žádná konečná struktura. K získání dalších
informací o teorii s axiomy R1–R16 se uplatní úvahy ve směru, který naznačuje
lemma 3.2.15, totiž úvahy o počtu kořenů polynomu stupně n a o jejich poloze.
V tomto oddílu jsme zjistili, že volba pravidel a (logických) axiomů kalkulu HKe
je zdůvodněná a oprávněná: v žádné teorii T nelze z jejích (vlastních, tj. mimologických)
axiomů odvodit žádný nesprávný závěr, tj. závěr, který z T nevyplývá, a
naopak lze odvodit každý správný závěr, tj. závěr, který vyplývá z T. Užitečným
nástrojem, chceme-li se přesvědčit, že nějaký závěr je dokazatelný z určitých předpokladů,
je neformální důkaz. Skutečné, tj. formální důkazy vyhovující deﬁnici
kalkulu HKe, jsou užitečné do okamžiku, než dokážeme větu o úplnosti. Sestrojení
formálního důkazu je užitečné také tehdy, chceme-li o něm tvrdit něco víc,
třeba odpovědět na otázky o počtu nebo složitosti formulí, které se v něm vyskytují.
Například díky důkazu sentence ∀x∃yDn(x, y) v teorii neostrého lineárního
uspořádání, který jsme sestrojili, můžeme tvrdit, že tato sentence má důkaz obsahující
O(n2
) formulí. Složitost formulí vyskytujících se v nějakém důkazu bude
jednou z otázek, kterými se budeme zabývat v příštím oddílu při úvahách o gentzenovském
kalkulu pro predikátovou logiku. Chceme-li se ale pouze přesvědčit
o existenci důkazu určitého závěru z určitých předpokladů a máme-li už větu o
úplnosti, je neformální důkaz stejně dobrý jako formální.
V tomto oddílu jsme si dále ukázali několik příkladů axiomatických teorií. Viděli
jsme, že teorie T může vzniknout například tak, že zvolíme nějakou strukturu D a za
axiomy teorie T pak zvolíme některé ze sentencí platných v D. Struktura D je pak
jedním z modelů teorie T. I v případě, kdy T nevznikne takto, tj. vypozorováním
axiomů z nějaké předem zvolené struktury (což je případ teorie množin), nic nám
nebrání uvažovat o modelech teorie T.
Na začátku oddílu 3.1, když jsme poprvé mluvili o volbě jazyka, tj. o volbě
mimologických symbolů, jsme řekli, že volbou jazyka je dáno, o čem se v dané
teorii může mluvit. Na příkladech teorií z tohoto oddílu vidíme, že někdy lze v dané
teorii mluvit opisně i o takových vlastnostech a operacích, kterým bezprostředně
neodpovídají symboly zvoleného jazyka. Například v teorii LO lze mluvit o maximu
objektů x a y, v teorii komutativních těles lze mluvit o kořenech polynomu s danými
koeﬁcienty. Dokonce ještě víc: pro každé n můžeme v teorii LO vyslovit (a dokázat)
sentenci v každé n-tici objektů je některý z objektů maximální a v teorii komutativních
těles bychom mohli vyslovit sentenci každý netriviální polynom stupně n má nejvýše n
různých kořenů. To by opět byla pro každé n jiná sentence (delší pro větší n).
180 3 Predikátová logika
Není ale vidět, jak bychom v teorii komutativních těles mohli mluvit najednou o
všech polynomech, a není také vidět, jak v teorii LO vyjádřit jednou sentencí, že
každá konečná množina má maximální prvek. V oddílu 3.4 uvidíme, že existují
metody, které dovolují dokázat, že určitá vlastnost struktury není v daném jazyce
vyjádřitelná.
Pro některé teorie T můžeme snadno nalézt nezávislou sentenci, tj. sentenci, kterou
v T nelze dokázat ani vyvrátit. Pro některé teorie, například pro teorii SUCC,
nezávislou sentenci uvést nedokážeme. Také problémem, jak lze pro danou teorii T
dokázat, že neexistuje sentence nezávislá na T, se v dalším výkladu, v oddílech
3.4 a 3.5, budeme zabývat. Oddíly 3.4 a 3.5 lze číst nezávisle na oddílu 3.3 a téměř
nezávisle na sobě.
Cvičení
1. Zdůvodněte bez užití věty o úplnosti, že všechny formule z cvičení 2 předchozího
oddílu jsou v kalkulu HK dokazatelné.
2. Zdůvodněte přímo, bez užití věty o úplnosti, dokazatelnost druhé formule z lemmatu
3.2.1.
3. Je-li x libovolná proměnná a ϕ formule dokazatelná v HK z množiny předpokladů
∆, pak i ∀xϕ je dokazatelná z ∆. Dokažte.
4. Uvažujte modiﬁkovaný kalkulus HK , který má místo pravidla Gen-E třetí axiomatické
schéma
B3: ∃xϕ ≡ ¬∀x¬ϕ.
Dokažte, že kalkulus HK je ekvivalentní s kalkulem HK.
5. Uvažujte kalkulus HK , který má místo pravidel Gen-A a Gen-E schéma B3,
a dále axiom a pravidlo:
B4: ∀x(ψ → ϕ) → (ψ → ∀xϕ), pokud x není volně ve ψ,
Gen: ϕ / ∀xϕ.
Dokažte, že i kalkulus HK je ekvivalentní s kalkulem HK.
6. Ke každé predikátové formuli ϕ existuje důkaz v kalkulu HK, jehož délka je
polynomiální ve |ϕ| a který je důkazem formule ϕ ≡ ϕ , kde ϕ je v prenexním
tvaru. Dokažte. Zdůvodněte, že přitom nezáleží na tom, zda délka |ϕ| formule ϕ
je deﬁnována jako souhrnný počet všech výskytů logických a predikátových
symbolů ve ϕ, nebo jako počet všech symbolů ve ϕ (včetně funkčních symbolů
a číslic v indexech proměnných).
7. Nalezněte příklad na to, že tvrzení 3.2.7(d) by neplatilo bez předpokladu, že ϕ
je sentence.
3.2 Hilbertovský predikátový kalkulus 181
8. Zdůvodněte, že v lemmatu 3.2.9 platí i opačná implikace: je-li sentence ϕ tautologickým
důsledkem množiny T ∪ H(L), pak T |= ϕ.
9. Zdůvodněte podrobně obě implikace v prvním odstavci důkazu věty 3.2.8.
10. Formulujte zobecnění deﬁnice substituovatelného termu pro simultánní substituci
(tj. pro případ, kdy za n-tici proměnných se dosazuje n-tice termů).
Dokažte bez užití věty o úplnosti, že jsou-li termy t1, . . , tn substituovatelné za
proměnné x1, . . , xn ve formuli ϕ, pak formule ϕx1,..,xn (t1, . . , tn) je dokazatelná
z předpokladu ∀x1 . . ∀xnϕ.
Návod. Užijte „nové proměnné tak, jak bylo naznačeno na začátku pododdílu
3.1.3.
11. Rozmyslete si, že lemma 3.2.7 platí i pro predikátovou logiku s rovností.
12. Zdůvodněte, že každá formule tvaru
∀x∀y(x1 = y1 & . . & xn = yn → (ϕ(x1, . . , xn) ≡ ϕ(y1, . . , yn)))
je dokazatelná v kalkulu HKe.
13. Dokažte, že kdybychom axiom E3 nahradili axiomem
E3 : ∀x∀y∀z(x = y & x = z → y = z),
mohli bychom axiom E2 vypustit.
14. Dokažte, že je-li schéma E5 myšleno tak, že se vztahuje na všechny predikátové
symboly včetně rovnítka, pak lze vypustit i axiom E3 .
15. Zdůvodněte bez užití věty 3.2.12, že sentence
∀x(L(x) & ∃yR(y) → ∀z(L(z) → x = z))
je v kalkulu HKe dokazatelná z předpokladu ∀x∀y(L(x) & R(y) → x = y).
Toto cvičení navazuje na jeden z našich příkladů formálních důkazů. Pokud
L(x) znamená objekt x je levý neutrální prvek a R(y) znamená objekt y je pravý
neutrální prvek, máte dokázat, že je-li každý levý neutrální objekt roven každému
pravému neutrálnímu objektu a existují-li pravé neutrální objekty, pak existuje nejvýše
jeden levý neutrální objekt.
16. Zdůvodněte bez užití věty 3.2.12, že sentence ∀x∃y(S(y) = x) je v kalkulu HKe
dokazatelná z axiomu L1 teorie SUCC (bez užití zbývajících axiomů).
17. Nalezněte model teorie SUCC, který není izomorfní se strukturou N, 0, s .
18. Dokažte, že žádný z axiomů Q1–Q3 není dokazatelný z ostatních axiomů teorie
SUCC a že z Q1–Q3 a L1–Lm nelze dokázat žádnou sentenci Ln pro n > m.
19. Dokažte, že značí-li x ≤ y formuli x < y ∨ x = y, pak všechny axiomy teorie
neostrého lineárního uspořádání jsou dokazatelné v teorii LO.
182 3 Predikátová logika
20. Dokažte, že značí-li naopak x < y formuli x ≤ y & x = y, pak všechny axiomy
teorie LO jsou dokazatelné v teorii neostrého lineárního uspořádání.
21. Nechť teorie T má jazyk teorie množin a axiomy
∀x∀y(∀v(v ∈ x ≡ v ∈ y) → x = y),
∃x∀v¬(v ∈ x),
∀x∀y∃z∀v(v ∈ x ∨ v = y → v ∈ z).
(a) Dokažte pomocí konečných modelů, že v T nelze dokázat žádnou ze sentencí
∀x(x /∈ x) a ¬∃x∀v(v ∈ x).
(b) Dokažte, že žádný ze tří axiomů teorie T není dokazatelný z ostatních dvou.
22. Dokažte, že každý konečný acyklický graf má vrchol, ze kterého nevedou žádné
hrany.
Návod. Postupujte indukcí podle počtu vrcholů grafu. V tomto případě se
nepokoušejte sestavit formální důkaz.
23. Zdůvodněte, že existuje pouze jedno dvouprvkové komutativní těleso.
3.3 Gentzenovský predikátový kalkulus
Máme-li důkaz ϕ1, . . , ϕm, kde ϕm je ϕ, formule ϕ z množiny předpokladů Σ v hilbertovském
kalkulu HK, je dobře možné, že některé z formulí ϕi jsou mnohem delší
nebo v nějakém smyslu složitější než kterákoliv formule z množiny Σ∪{ϕ}. Jinými
slovy, deﬁnice důkazu v hilbertovském kalkulu připouští, abychom při důkazu nějaké
formule z nějaké množiny předpokladů postupovali oklikou, přes formule, které
nemají „nic společného ani s dokazovanou formulí, ani s množinou předpokladů.
Uvědomme si, že ve výrokové variantě gentzenovského kalkulu GK, kterou jsme
popsali v oddílu 1.4, je pravidlo řezu pravidlem, které umožňuje dokazovat oklikou:
chceme-li dokázat sekvent Γ ⇒ ∆ , máme právo vymyslet si libovolnou formuli θ,
dokázat zvlášť sekventy Γ ⇒ θ a θ ⇒ ∆ , a formuli θ pak odstranit užitím
pravidla Cut.
V tomto oddílu stanovíme predikátovou variantu gentzenovského kalkulu GK
a rozmyslíme si, že pravidlo Cut je v jistém smyslu jediným pravidlem, které při
dokazování umožňuje postupovat oklikou. Pak se budeme zabývat větou o eliminovatelnosti
řezů a některými jejími souvislostmi. Budeme tedy především řešit
otázku, zda v deﬁnici důkazu je nutné připustit okliky.
Do gentzenovského kalkulu GK pro (klasickou) predikátovou logiku přijměme
všechna pravidla uvedená na str. 41 s tím, že ϕ a ψ nyní označují predikátové
formule a Γ atd. jsou množiny predikátových formulí. Dále přijměme čtyři kvantiﬁkátorová
pravidla:
∃-r: Γ ⇒ ∆, ϕx(t) / Γ ⇒ ∆, ∃xϕ ,
∀-l: Γ, ϕx(t) ⇒ ∆ / Γ, ∀xϕ ⇒ ∆ ,
3.3 Gentzenovský predikátový kalkulus 183
∃-l: Γ, ϕx(y) ⇒ ∆ / Γ, ∃xϕ ⇒ ∆ ,
∀-r: Γ ⇒ ∆, ϕx(y) / Γ ⇒ ∆, ∀xϕ ,
kde v případě pravidel ∃-r a ∀-l je term t substituovatelný za x ve ϕ a v případě
pravidel ∃-l a ∀-r je proměnná y substituovatelná za x ve ϕ a nemá žádné
volné výskyty v množině Γ ∪ ∆ ∪ {∃xϕ} resp. v množině Γ ∪ ∆ ∪ {∀xϕ}. Výsledný
kalkulus má tedy devět výrokových pravidel (pravidlo A a jedno „levé a
jedno „pravé pravidlo pro každou ze čtyř logických spojek), čtyři kvantiﬁkátorová
pravidla a dále dvě strukturální pravidla W a Cut. Všimněme si, že u všech
čtyř kvantiﬁkátorových pravidel máme co dělat s dosazením za proměnnou a že
dosazení vždy směřuje „proti směru úvahy . Abychom ověřili, že formule ∀xϕ
nebo ∃xϕ je správně odvozena ze vstupní formule ψ, musíme ověřit, že formuli ψ
lze získat z formule ϕ (tj. z té formule, kterou získáme z principální formule odstraněním
nejvnějšnějšího kvantiﬁkátoru) dosazením za x (tj. za tu proměnnou,
která je určena oním nejvnějšnějším kvantiﬁkátorem). Například každý ze sekventů
Γ ⇒ ∆, ∃x(x < S(v)) a Γ ⇒ ∆, ∃x(S(x) < x) je pomocí pravidla ∃-r
správně odvozen ze sekventu Γ ⇒ ∆, S(S(v)) < S(v) , a to bez ohledu na formule
v Γ ∪ ∆. Viz též příklad 3.1.21.
Pravidlům ∃-l a ∀-r říkejme pravidla generalizace, pravidlům ∃-r a ∀-l říkejme
pravidla speciﬁkace (konkretizace). Pravidlo ∃-l je formalizací následujícího kroku
v nějakém neformálním důkazu:
. . . Máme zdůvodnit, že platí ∆, přičemž víme, že existuje objekt s vlastností ϕ.
Zvolme takový objekt a označme jej y. Stačí zdůvodnit, že ∆ platí za předpokladu
ϕx(y).
Analogicky je pravidlo ∀-r formalizací takovéhoto kroku:
. . . Máme zdůvodnit, že všechny objekty mají vlastnost ϕ. Nechť je tedy dán
nějaký objekt, označme jej y. Stačí zdůvodnit ϕx(y).
Oba kroky jsou správné za předpokladu, že y zatím (v předchozí úvaze naznačené
tečkami) nic neoznačuje. Tomu odpovídá podmínka u pravidel generalizace, že y
se nevyskytuje volně v množinách Γ a ∆ ani ve formuli ∃xϕ resp. ∀xϕ. Tato podmínka
bývá v literatuře označena německo-anglickým názvem eigenvariable condition.
V našem textu jí říkejme podmínka EVC. Všimněme si ještě, že pravidla
generalizace připouštějí, aby x a y byla tatáž proměnná. V tom případě se pravidla
∃-l a ∀-r podobají pravidlům Gen-E a Gen-A hilbertovského kalkulu a je automaticky
splněno, že proměnná y nemá volné výskyty ve formuli ∃xϕ resp. ∀xϕ.
Na obrázku 3.3.1 nahoře je příklad důkazu v kalkulu GK. Všimněme si na levé
straně, že formule ∀yP(y) byla odvozena z formule P(v) až poté, kdy byl užitím
pravidla ∃-l odstraněn druhý volný výskyt proměnné v (ve formuli P(v)→∀yP(y)).
Použít pravidla ∀-l a ∃-l v opačném pořadí by nebylo možné, to by nebyla splněna
podmínka EVC. Finální sekvent je odvozen užitím pravidla Cut. Také ﬁnální
sekvent spodního důkazu je odvozen řezem. V tomto důkazu si všimněme, že u
184 3 Predikátová logika
P(v) ⇒ P(v), ∀yP(y)
⇒ P(v), P(v) → ∀yP(y)
⇒ P(v), ∃x(P(x) → ∀yP(y))
⇒ ∀yP(y), ∃x(P(x) → ∀yP(y))
∀yP(y), P(z) ⇒ ∀yP(y))
∀yP(y) ⇒ P(z) → ∀yP(y))
∀yP(y) ⇒ ∃x(P(x) → ∀yP(y))
⇒ ∃x(P(x) → ∀yP(y))
P(x) & Q(x) ⇒ P(x) & Q(x)
∀y(P(x) & Q(y)) ⇒ P(x) & Q(x)
∀x∀y(P(x) & Q(y)) ⇒ P(x) & Q(x)
∀x∀y(P(x) & Q(y)) ⇒ ∀x(P(x) & Q(x))
P(y) ⇒ P(y)
P(y) & Q(y) ⇒ P(y)
∀x(P(x) & Q(x)) ⇒ P(y)
∀x∀y(P(x) & Q(y)) ⇒ P(y)
Obrázek 3.3.1: Příklady důkazu v kalkulu GK
pravidel speciﬁkace nevadí, obsahuje-li term t proměnné, které jsou volné v ostatních
formulích. Formule ∀y(P(x) & Q(y)) v levé větvi důkazu je správně odvozena
z formule P(x) & Q(x). V důkazu z obrázku 3.3.2 nahoře si všimněme, že pravidlo
∃-r je užito dvakrát, přičemž term t má v jednom případě tvar x a v druhém
tvar F(x). Principální formule ∃xϕ je ale v obou případech táž. Všimněme si
také, že o formuli ∃x(P(F(x)) ∨ ¬P(x)) již byla řeč ve cvičení 22 oddílu 3.1. Na
tomtéž obrázku dole jsou ještě dva příklady důkazů. Útvar úplně vpravo důkazem
není, neboť v prvním za dvou kroků je porušena podmínka EVC. Rozšíříme-li de-E
ﬁnici logicky platné formule i na sekventy, snadno užitím věty o korektnosti 3.3.1
dokážeme, že sekvent ∃xP(x) ⇒ ∀yP(y) nemá v kalkulu GK žádný důkaz.
Důkaz formule ϕ v kalkulu GK deﬁnujme jako důkaz sekventu ⇒ ϕ . Důkaz
formule ϕ z množiny předpokladů Σ deﬁnujme jako důkaz sekventu tvaru F ⇒ ϕ ,
kde F ⊆ Σ je konečná množina. Nechť zápis Σ GK ϕ označuje, že formule ϕ je
v kalkulu GK dokazatelná z množiny předpokladů Σ. Řekneme, že struktura D
je protipříklad na sekvent Γ ⇒ ∆ , jestliže existuje ohodnocení e proměnných
ve struktuře D, které v D splňuje všechny formule z Γ a nesplňuje žádnou formuli
z ∆. Sekvent Γ ⇒ ∆ platí ve struktuře D, jestliže D není protipříklad
na sekvent Γ ⇒ ∆ , tj. jestliže pro každé ohodnocení proměnných e splňující
v D všechny formule z Γ existuje formule ψ ∈ ∆ taková, že D |= ψ[e]. Sekvent
Γ ⇒ ∆ je logicky platný, platí-li v každé struktuře (pro příslušný předem zvolený
jazyk). Sekventy ∃xP(x) ⇒ ∀yP(y) a ⇒ jsou příklady sekventů, které
nejsou logicky platné. Je zřejmé, že sekvent Γ ⇒ ϕ je logicky platný právě
tehdy, platí-li Γ |= ϕ.
Věta 3.3.1 Každý sekvent S dokazatelný v kalkulu GK je logicky platný. Když
Σ GK ϕ, pak Σ |= ϕ.
Důkaz Když je sekvent tvaru F ⇒ ϕ logicky platný, pak F |= ϕ. Když navíc
F ⊆ Σ, pak i Σ |= ϕ. Stačí tedy dokázat první část věty. Nechť tedy P je důkaz
3.3 Gentzenovský predikátový kalkulus 185
v kalkulu GK a nechť D je struktura. Ověříme indukcí dle počtu kroků v důkazu P,
že každý sekvent v důkazu P platí ve struktuře D.
Ukažme si úvahu například pro pravidlo ∃-l. Všechny ostatní úvahy jsou analogické
a ponecháváme je za cvičení. Nechť tedy sekvent Γ, ∃xϕ ⇒ ∆ je užitím pravidla
∃-l odvozen ze sekventu Γ, ϕx(y) ⇒ ∆ a nechť e je ohodnocení proměnných
ve struktuře D, které v D splňuje všechny formule z množiny Γ a formuli ∃xϕ.
Pišme zkráceně D |= Γ[e] atd. Z podmínky D |= (∃xϕ)[e] plyne existence prvku
a ∈ D takového, že D |= ϕ[e(x/a)]. Uvažujme ohodnocení e(y/a) a předpokládejme
složitější případ, kdy x a y jsou různé proměnné. Platí
D |= ϕ[e(x/a)] ⇔ D |= (ϕx(y))y(x)[e(x/a)]
⇔ D |= ϕx(y)[e(x/a, y/a)]
⇔ D |= ϕx(y)[e(y/a)].
Nemá-li proměnná volné výskyty ve formuli ∀xϕ, a to nemá, formule ϕx(y) obsa- E
huje pouze takové výskyty proměnné y, které se v ní ocitly substitucí za proměnnou
x, a (ϕx(y))y(x) a ϕ jsou tedy stejné formule. Tím je zdůvodněna první ze tří
ekvivalencí. Druhá plyne z lemmatu 3.1.14(b), třetí z lemmatu 3.1.11(b). Ohodnocení
e(y/a) tedy splňuje všechny formule v antecedentu sekventu Γ, ϕx(y) ⇒ ∆ .
Protože podle indukčního předpokladu tento sekvent platí v D, existuje formule ψ
v množině ∆ taková, že D |= ψ[e(y/a)]. Proměnná y nemá volné výskyty ve formuli
ψ. Tedy D |= ψ[e]. QED
P(F(x)) ⇒ P(F(x))
⇒ P(F(x)), ¬P(F(x))
⇒ P(F(x)) ∨ ¬P(x), ¬P(F(x))
⇒ ∃x(P(F(x)) ∨ ¬P(x)), ¬P(F(x))
⇒ ∃x(P(F(x)) ∨ ¬P(x)), P(F(F(x))) ∨ ¬P(F(x))
⇒ ∃x(P(F(x)) ∨ ¬P(x))
P(x) ⇒ P(x)
∀xP(x) ⇒ P(x)
∀xP(x) ⇒ ∀yP(y)
P(x) ⇒ P(x)
∀xP(x) ⇒ P(x)
∀xP(x) ⇒ ∃yP(y)
P(x) ⇒ P(x)
∃xP(x) ⇒ P(x)
∃xP(x) ⇒ ∀yP(y)
Obrázek 3.3.2: Další důkazy (?) v kalkulu GK
Neuvádíme přímý důkaz věty o úplnosti kalkulu GK, a to přestože je — alespoň
v případě jazyka bez funkčních symbolů — spíše jednodušší a názornější než důkaz
věty o úplnosti kalkulu HK. Místo toho ukážeme, že kalkuly GK a HK jsou ekvivalentní
a vzájemně polynomiálně simulovatelné. Z ekvivalence kalkulů GK a HK
a úplnosti kalkulu HK ovšem plyne úplnost kalkulu GK.
186 3 Predikátová logika
Nejprve stanovme, jaké množiny předpokladů připouštíme, a rozšiřme deﬁnici
polynomiální simulovatelnosti uvedenou v závěru oddílu 1.4. Kalkuly GK a HK
nejsou ekvivalentní v nejobecnějším možném smyslu: platí {P(x)} HK ∀xP(x),
neplatí ale {P(x)} GK ∀xP(x). Jako předpoklady tedy připusťme pouze sentence,
tj. mluvme pouze o dokazatelnosti v (axiomatických) teoriích. Dále deﬁnujme, že
kalkulus C2 polynomiálně simuluje kalkulus C1, jestliže existuje polynom p takový,
že ke každému důkazu délky nejvýše n libovolné formule ϕ z libovolné teorie T
v kalkulu C1 existuje důkaz délky nejvýše p(n) téže formule z téže teorie v kalkulu C2.
Délku formule ϕ, množiny formulí T, sekventu S či důkazu P značíme |ϕ|, |T|,
|S| resp. |P| a deﬁnujeme ji jako souhrnný počet výskytů všech logických spojek,
kvantiﬁkátorů a predikátových symbolů v oné formuli, množině formulí, sekventu či
důkazu. Atomické formule tedy mají délku 1. Lze si rozmyslet, že při podrobnějším
počítání délek, například kdybychom brali v úvahu i funkční symboly a délku zápisu
indexů proměnných, by se nic nepokazilo na polynomiální simulovatelnosti.
V kapitole 1 jsme vlastně uvažovali dvě varianty kalkulu HK: s důkazy-posloupnostmi
a se stromovými důkazy. Lze říci, že posloupnost ϕ1, . . , ϕn je stromový
důkaz v kalkulu HK, jestliže pro každé i existuje nejvýše jedno j > i takové, že
formule ϕj je z formule ϕi (a případně dalších formulí) odvozena jedním užitím
nějakého pravidla. Také u kalkulu GK lze uvažovat dvě varianty: se stromovými
důkazy a s důkazy-posloupnostmi (sekventů). Ve cvičeních oddílu 1.4 jsme se zmínili,
že výroková varianta kalkulu HK s důkazy-posloupnostmi a výroková varianta
kalkulu GK s důkazy-posloupnostmi jsou navzájem polynomiálně simulovatelné a
že totéž platí pro kalkuly HK a GK se stromovými důkazy. Nyní uvidíme, že stejná
tvrzení platí i pro predikátovou logiku. Ukážeme si také obtížnější výsledek, totiž
že jak v kalkulu HK, tak v kalkulu GK lze důkazy-posloupnosti polynomiálně simulovat
pomocí stromových důkazů. Po dokončení důkazu věty 3.3.2 budeme důkazy
v kalkulu GK považovat za stromy.
Věta 3.3.2 Následující kalkuly jsou navzájem polynomiálně simulovatelné:
(i) Kalkulus HK s důkazy-posloupnostmi,
(ii) Kalkulus HK se stromovými důkazy,
(iii) Kalkulus GK s důkazy-posloupnostmi,
(iv) Kalkulus GK se stromovými důkazy,
(v) Kalkulus GK se stromovými důkazy a navíc s omezením, že jako principální
formule iniciálních sekventů se připouštějí pouze atomické formule.
Důkaz Nejprve simulujme kalkulus (i) pomocí kalkulu (ii). Nechť ϕ1, . . , ϕm,
kde ϕm je ϕ, je daný důkaz délky nejvýše n formule ϕ z množiny sentencí T
v kalkulu HK. Máme sestrojit důkaz téže formule z téže množiny předpokladů,
který je stromový a jehož délka navíc není o mnoho větší než délka n daného důkazu
ϕ1, . . , ϕm. Deﬁnujme formuli ∀ϕi jako univerzální uzávěr formule ϕi, tj. jako
formuli ∀v1 . . ∀vrϕi, kde v1, . . , vr je seznam všech volných proměnných formule ϕi.
Dále pro 1 ≤ i ≤ m deﬁnujme formuli θi jako konjunkci
((. . (∀ϕ1 & ∀ϕ2) & . . ) & ∀ϕi−1) & ∀ϕi.
3.3 Gentzenovský predikátový kalkulus 187
Formule θi je tedy konjunkcí univerzálních uzávěrů formulí ϕ1, . . , ϕi s tím, že závorky
se kumulují doleva. Mysleme si chvíli, že i < m je pevné, a konstruujme
stromový důkaz implikace θi → θi+1. Předpokládejme například, že formule ϕi+1
je v původním důkazu odvozena pravidlem MP, a to například z formule ϕ1 a
z formule ϕi, která má tvar ϕ1 → ϕi+1. Uvažujme formule
1: ∀ϕ1 & ∀(ϕ1 → ϕi+1) → ∀ϕi+1
2: ∀ϕ1 & ∀(ϕ1 → ϕi+1) → (∀ϕ1 & ∀ϕi) & ∀ϕi+1
3: (∀ϕ1 & ∀ϕ2) & ∀ϕi → ((∀ϕ1 & ∀ϕ2) & ∀ϕi) & ∀ϕi+1
...
i: (. . (∀ϕ1 & ∀ϕ2) & . . ) & ∀ϕi → ((. . (∀ϕ1 & ∀ϕ2) & . . ) & ∀ϕi) & ∀ϕi+1.
Formule (2) a (3) mají tvar A&B→(A&B)&C a (A&D)&B→((A&D)&B)&C.
Formuli (3) tedy můžeme získat z formule (2) tak, že vezmeme (výrokový stromový)
důkaz tautologie
(p & q → (p & q) & r) → ((p & s) & q) → ((p & s) & q) & r), (∗)
dosadíme do něj formule ∀ϕ1, ∀ϕi, ∀ϕi+1 a ∀ϕ2 za atomy p, q, r a s, a na ﬁnální
formuli výsledného důkazu a na formuli (2) pak použijeme pravidlo MP. Tentýž důkaz
tautologie (∗) použijeme ještě (i−3)-krát (k odvození formule (4) z formule (3)
atd.), přičemž za p postupně dosazujeme formule ∀ϕ1 & ∀ϕ2 až ∀ϕ1 & . . & ∀ϕi−2,
za s postupně dosazujeme formule ∀ϕ3 až ∀ϕi−1, za q a r dosazujeme vždy tutéž
formuli ∀ϕi resp. ∀ϕi+1. Dosazením vznikne vždy fragment predikátového důkazu
délky O(n). Celý důkaz formule v i-tém řádku, tj. formule θi → θi+1, z formule (3)
má tedy délku O(n2
). Vezmeme-li v úvahu i důkaz formule (2) z formule (1) a důkaz
formule (1), pořád máme důkaz délky O(n2
). Kdyby ony dvě formule v daném důkazu,
na které se aplikuje pravidlo MP, byly jiné než ϕ1 a ϕi, kromě tautologie (∗)
by se uplatnily ještě tautologie
(p & q → (p & q) & r) → ((s & p) & q → ((s & p) & q) & r),
(p & q → (p & q) & r) → ((p & q) & s → ((p & q) & s) & r).
Úvahy v případě, kdy ϕi+1 je odvozena některým pravidlem generalizace, je logickým
axiomem nebo je prvkem množiny předpokladů, jsou podobné. Z důkazů
formulí θ1, θ1 → θ2 až θm−1 → θm, z nichž každý má délku O(n2
), můžeme sestavit
stromový důkaz formule θm a pak i důkaz formule ϕm, jejichž délka je O(n3
).
Nyní simulujme kalkulus (iii) pomocí kalkulu (i). Nechť P je daný důkaz délky
nejvýše n formule θ z množiny předpokladů T v kalkulu GK. Je-li S libovolný
sekvent tvaru Γ ⇒ ∆ , deﬁnujme formuli f(S) následovně. Když Γ = ∅ a ∆ = ∅,
pak f(S) je Γ→ ∆. Když Γ = ∅ a ∆ = ∅, pak f(S) je Γ→⊥, kde ⊥ je předem
zvolená vyvratitelná sentence. Když Γ = ∅ a ∆ = ∅, pak f(S) je ∆, a konečně
když Γ = ∆ = ∅, pak f(S) je ⊥. Lze ověřit, že je-li sekvent S v důkazu P odvozen
jedním krokem ze sekventu S1 nebo ze dvou sekventů S1 a S2, pak formuli f(S) lze
188 3 Predikátová logika
v kalkulu HK odvodit z formule f(S1) resp. z formulí f(S1) a f(S2) důkazem délky
O((|S1|+|S|)2
) resp. O((|S1|+|S2|+|S|)2
). Uvažujme podrobněji třeba o případu,
kdy Γ = ∅, ∆ = ∅, x a y jsou různé proměnné a sekvent S tvaru Γ ⇒ ∆, ∀xϕ
je v důkazu P jedním krokem odvozen ze sekventu S1 tvaru Γ ⇒ ∆, ϕx(y) .
V příslušném místě důkazu v kalkulu HK se uplatní formule
1: Γ → ∆ ∨ ϕx(y)
2: Γ & ¬ ∆ → ϕx(y)
3: Γ & ¬ ∆ → ∀yϕx(y)
4: ∀yϕx(y) → ∀xϕ
5: Γ & ¬ ∆ → ∀xϕ
6: Γ → ∆ ∨ ∀xϕ.
Přitom formule (3) je z formule (2) odvoditelná pomocí pravidla Gen-A a formule
(4) je dokazatelná, neboť nemá-li y volné výskyty ve ϕ, pak (ϕx(y))y(x)
je ϕ. Souhrnná délka těchto šesti formulí je O(|S1|+|S2|). Indukční předpoklad aleE
nezaručuje, že v disjunkci ∆ ∨ ϕx(y) jsou závorky a pořadí členů tak, jak potřebujeme,
s formulí ϕx(y) vpravo na nejvyšší úrovni. Abychom formuli ϕx(y) dostali
na požadovanou pozici, můžeme potřebovat až O(|S1| + |S|) formulí, jejichž délka
je stále O(|S1| + |S|). Také mezi formulemi (2) a (3) a mezi formulemi (5) a (6)
je ve skutečnosti O(|S1| + |S|) takových formulí. Máme tedy fragment důkazu,
jehož velikost je O((|S1| + |S|)2
). Celkově to vypadá tak, že původní důkaz P
délky n byl rozdělen na fragmenty (v podstatě jednotlivé formule), z nichž každý
se při překladu do kalkulu HK kvadraticky prodloužil. Dohromady to dává důkaz
v kalkulu HK velikosti O(n2
). Finální sekvent důkazu P má tvar F ⇒ θ , kde
F ⊆ T je konečná. V kalkulu HK pokračujeme od formule F → θ k formuli θ.
Na odhadu O(n2
) se přitom již nic nezmění.
Uvažujme o simulaci kalkulu (ii) pomocí kalkulu (iv). Nechť θ1, . . , θm, kde θm je θ,
je daný stromový důkaz délky nejvýše n formule θ z teorie T v kalkulu HK. Nechť F
je množina těch prvků množiny T, které jsou v důkazu θ1, . . , θm skutečně použity.
Platí |F| ≤ n. Konstruujme postupně důkazy sekventů F ⇒ θi a všímejme si
jejich délky. Důkaz sekventu F ⇒ θm je hledaným důkazem formule θ v kalkulu
GK. Když θi ∈ F, pak F ⇒ θi je iniciální sekvent. Když θi je logickým
axiomem, například axiomem B1 tvaru ∀xϕ → ϕx(t), pak sekvent F ⇒ θi je
dokazatelný dvěma kroky:
F, ϕx(t) ⇒ ϕx(t)
F, ∀xϕ ⇒ ϕx(t)
F ⇒ ∀xϕ → ϕx(t) .
Ostatní úvahy o logických axiomech kalkulu HK jsou podobné. Když formule θi je
tvaru ∃xϕ→ψ a je z některé předchozí formule θj tvaru ϕ→ψ odvozena generalizací,
3.3 Gentzenovský predikátový kalkulus 189
pak v kalkulu GK můžeme utvořit takovýto důkaz:
F ⇒ ϕ → ψ
e
e
e
£
£
£
Pj
ϕ ⇒ ϕ ψ ⇒ ψ
ϕ, ϕ → ψ ⇒ ψ
F, ϕ ⇒ ψ
F, ∃xϕ ⇒ ψ
F ⇒ ∃xϕ → ψ ,
kde Pj je již sestrojený důkaz sekventu F ⇒ θj , sekvent F, ϕ ⇒ ψ je z předchozích
dvou odvozen řezem, následující sekvent je (oprávněně) odvozen pomocí
pravidla ∃-l a nakonec je užito pravidlo →-r. Když je formule θi z některých
předchozích formulí θj a θk, kde θk je tvaru θj → θi, odvozena pravidlem MP,
v kalkulu GK užijeme dva řezy: E
F ⇒ θj → θi
e
e
e
£
£
£
Pk
F ⇒ θj
e
e
e
£
£
£
Pj
θj ⇒ θj θi ⇒ θi
θj, θj → θi ⇒ θi
F, θj → θi ⇒ θi
F ⇒ θi .
K již sestrojeným důkazům Pj a Pk jsme v tomto případě přidali pět nových sekventů.
V předchozím případě, kdy jsme se zabývali simulací pravidla Gen-E, to
bylo šest nových sekventů. Jejich celková délka je v obou případech O(n). Protože
(přinejhorším) toto se děje pro každé i, máme důkaz v kalkulu GK délky O(n2
).
Nakonec simulujme kalkulus (iv) pomocí kalkulu (v). Tím bude důkaz dokončen,
protože simulace (v) ⇒ (iv) a (iv) ⇒ (iii) jsou triviální, každý stromový důkaz s dodatečnou
podmínkou na iniciální sekventy je stromovým důkazem a každý stromový
důkaz je zároveň důkazem-posloupností. Lze dokázat indukcí dle |ϕ|, že každý sekvent
S tvaru Γ, ϕ ⇒ ∆, ϕ má důkaz, v němž jsou všechny iniciální sekventy
atomické a v němž je nejvýše 4|ϕ| + 1 sekventů, z nichž každý má délku O(|S|).
V případech, kdy ϕ je tvaru ∀xψ nebo ψ ∨ χ, postupujeme takto:
Γ, ψx(y) ⇒ ∆, ψx(y)
Γ, ∀xψ ⇒ ∆, ψx(y)
Γ, ∀xψ ⇒ ∆, ∀xψ
Γ, ψ ⇒ ∆, ψ
Γ, ψ ⇒ ∆, ψ ∨ χ
Γ, χ ⇒ ∆, χ
Γ, χ ⇒ ∆, ψ ∨ χ
Γ, ψ ∨ χ ⇒ ∆, ψ ∨ χ ,
kde proměnnou y volíme tak, aby se nevyskytovala v Γ, ∆ ani ∀xψ. V prvním
případě platí |ψx(y)| = |ϕ| − 1, sekvent Γ, ψx(y) ⇒ ∆, ψx(y) má dle indukčního
předpokladu důkaz se 4(|ϕ| − 1) + 1 sekventy, a sekvent Γ, ϕ ⇒ ∆, ϕ má tedy
důkaz se 4(|ϕ|−1)+1+2 ≤ 4|ϕ|+1 sekventy. V druhém případě pro délku a počet
sekventů platí |ψ ∨ χ| = |ψ| + |χ| + 1 a (4|ψ| + 1) + (4|χ| + 1) + 3 = 4|ψ ∨ χ| + 1.
Podobně se uvažuje v případě ostatních logických symbolů. Máme-li důkaz délky n
190 3 Predikátová logika
a nahradíme-li v něm každý iniciální sekvent S, jehož principální formule není
atomická, jeho důkazem délky O(|S|2
), v němž principální formule všech iniciálních
sekventů už jsou atomické, dostaneme důkaz délky O(n2
). QED
Tvrzení o polynomiální simulovatelnosti důkazů-posloupností pomocí stromových
důkazů dokázal J. Krajíček. Důkaz, který jsme uvedli, je převzat z jeho
knihy [50]. Vzájemná simulovatelnost (nikoliv polynomiální) kalkulů GK a HK je
dokázána například v [49].
Řekneme, že důkaz v kalkulu GK je bezřezový, není-li v něm použito pravidlo
Cut. V oddílu 1.4 jsme viděli, že v bezřezovém důkazu se mohou vyskytnout
jen podformule formulí obsažených ve ﬁnálním sekventu daného důkazu. Něco podobného
platí i v predikátové logice.
Následující rekurzí deﬁnujme vztah býti s-podformulí mezi predikátovými formulemi.
S-podformulemi formule ∀xϕ (nebo formule ∃xϕ) jsou jednak sama formule
∀xϕ (resp. ∃xϕ), dále každá s-podformule kterékoliv formule tvaru ϕx(t), kde
t je term substituovatelný za x ve ϕ, a nic jiného. S-podformulemi formule ϕ → ψ
(nebo formule ϕ&ψ, nebo formule ϕ∨ψ) jsou jednak sama formule ϕ→ψ (resp. ϕ&ψ,
resp. ϕ ∨ ψ), dále každá s-podformule formule ϕ, každá s-podformule formule ψ, a
nic jiného. S-podformulemi formule ¬ϕ jsou jednak sama formule ¬ϕ a dále každá
s-podformule formule ϕ. Atomická formule je sama svou jedinou s-podformulí.
Příklad 3.3.3 Uvažujme jazyk {P, Q} se dvěma unárními predikáty. Jedinými
termy jsou v tomto případě proměnné. Uvažujme formuli ∀x∀y(P(x) & Q(y)).
Termy substituovatelné za x ve formuli ∀y(P(x) & Q(y)) jsou právě ty proměnné z,
které jsou různé od proměnné y. S-podformulemi formule ∀x∀y(P(x) & Q(y)) jsou
tedy, kromě ní samé, formule ∀y(P(z) & Q(y)), P(z) & Q(v), P(z) a Q(v), kde
proměnná z je jiná než y (může to být x) a proměnná v je libovolná.
Věta 3.3.4 Každá formule v bezřezovém důkazu P je s-podformulí některé formule
ve ﬁnálním sekventu důkazu P. Není-li v bezřezovém důkazu P užito žádné
z pravidel pro implikaci a negaci, pak každá formule obsažená v antecedentu (sukcedentu)
kteréhokoliv sekventu důkazu P je s-podformulí některé formule obsažené
v antecedentu (sukcedentu) ﬁnálního sekventu důkazu P.
Důkaz Je-li například sekvent Γ ⇒ ∆, ϕ → ψ odvozen jedním krokem ze sekventu
Γ, ϕ ⇒ ∆, ψ , pak formule ϕ a ψ jsou s-podformulemi formule ϕ → ψ a
každá formule v Γ ∪ ∆ je svou vlastní s-podformulí, tedy s-podformulí některé formule
v sekventu Γ ⇒ ∆, ϕ → ψ . Podobně lze prověřit všechna ostatní pravidla
kalkulu GK kromě pravidla Cut (které je vyloučené). QED
Příklad 3.3.5 Nechť S je sekvent ∀x∀y(P(x)&Q(y)) ⇒ P(y) a nechť P je jeho
bezřezový důkaz. Protože ve ﬁnálním sekventu důkazu P se nevyskytují symboly
→ a ¬, v P není užito žádné z pravidel pro implikaci a negaci. Můžeme tedy užít
druhou část věty 3.3.4. Uvažujme (kterýkoliv) iniciální sekvent Γ, ϕ ⇒ ∆, ϕ důkazu
P. Formule ϕ musí být s-podformulí některé formule v sukcedentu a současně
3.3 Gentzenovský predikátový kalkulus 191
s-podformulí některé formule v antecedentu sekventu S. Formule P(y) je jedinou
s-podformulí (jediné) formule obsažené v sukcedentu sekventu S. V příkladu 3.3.3
jsme ale zjistili, že formule P(y) není s-podformulí žádné formule obsažené v antecedentu
sekventu S. Tím jsme dokázali, že sekvent S nemá žádný bezřezový důkaz.
Připomeňme, že důkaz sekventu S, který není bezřezový, je na obr. 3.3.1 dole.
Příklad 3.3.6 Sekvent ⇒ nemá žádný bezřezový důkaz.
O sekventu ⇒ ovšem víme, že nemá žádný důkaz (protože není logicky
platný). Zajímavé ale je, že neexistenci bezřezových důkazů jsme v příkladech
3.3.5 a 3.3.6 dokázali bez užití jakékoliv sémantiky.
Deﬁnujme, že formule je regulární, jestliže žádná proměnná v ní nemá současně
volné i vázané výskyty. Deﬁnujme dále, že sekvent je regulární, jestliže žádná
proměnná v něm nemá současně volné i vázané výskyty. Důkaz P v kalkulu GK
je regulární, jestliže žádná proměnná nemá v P současně volné i vázané výskyty a
jestliže navíc pro každý sekvent Γ ⇒ ∆, ∀xϕ a Γ, ∃xϕ ⇒ ∆ důkazu P, který je
v P odvozen jedním krokem z bezprostředně předchozího sekventu Γ ⇒ ∆, ϕx(y)
resp. Γ, ϕx(y) ⇒ ∆ , platí, že proměnná y se v P nevyskytuje nikde mimo
příslušný podstrom důkazu P, tj. nikde kromě sekventů, do kterých vede v P cesta
(nahoru) z onoho sekventu Γ ⇒ ∆, ∀xϕ či Γ, ∃xϕ ⇒ ∆ . Například důkaz na
obrázku 3.3.1 nahoře je regulární. Na obrázku 3.3.2 jsou celkem tři důkazy, z nichž
žádný není regulární. Jsou to ale důkazy regulárních sekventů. Na obrázku 3.3.1
dole je dokázán sekvent, který není regulární. Postupně chceme dospět k větě o
eliminovatelnosti řezů pro kalkulus GK, která tvrdí, že každý regulární sekvent
dokazatelný v kalkulu GK má v kalkulu GK i bezřezový důkaz.
Deﬁnujme hloubku d(ϕ) formule ϕ jako délku nejdelší větve ve formuli ϕ chápané
jako strom. Jinak řečeno, d(ϕ ψ) = 1 + max{d(ϕ), d(ψ)}, kde je kterákoliv ze
spojek →, & nebo ∨, dále d(¬ϕ) = 1 + d(ϕ) a konečně d(ϕ) = 0, je-li ϕ atomická. E
Dále deﬁnujme hloubku d(P) důkazu P jako délku nejdelší větve v P. Například
na obrázku 3.3.1 nahoře je důkazem hloubky 4 dokázána formule, jejíž hloubka
je 3. A konečně deﬁnujme (řezovou) hodnost r(P) (anglicky cut rank) důkazu P
jako maximální z čísel 1 + d(ϕ), kde ϕ je formule, na kterou je v důkazu P užit
řez, a jako nulu v případě, kdy důkaz P je bezřezový. Podmínka r(P) = 0 tedy
platí právě tehdy, není-li v P užito pravidlo Cut. Důkazy na obrázcích 3.3.1 mají
hodnost 2 a 3. Důkaz na obrázku 3.3.2 nahoře má hodnost 0.
Lemma 3.3.7 Ke každému důkazu regulárního sekventu existuje regulární důkaz
téhož sekventu, který nemá větší hloubku ani hodnost.
Důkaz Nechť P je daný důkaz regulárního sekventu S. Nechť x1, . . , xn je seznam
těch proměnných, které mají volné výskyty v sekventu S a současně mají vázané
výskyty kdekoliv v důkazu P. Zvolme navzájem různé proměnné v1, . . , vn, které
se v P nevyskytují (volně ani vázaně). Pišme v P všude v1, . . , vn místo vázaných
výskytů proměnných x1, . . , xn, a označme P(1)
výsledek této záměny. Probráním
všech pravidel kalkulu GK lze ověřit, že P(1)
je opět důkazem. Například je-li v P
192 3 Predikátová logika
užit krok Γ ⇒ ∆, ϕx(t) / Γ ⇒ ∆, ∃xϕ , na odpovídajícím místě v P(1)
je
krok tvaru Γ(1)
⇒ ∆(1)
, (ϕx(t))(1)
/ Γ(1)
⇒ ∆(1)
, (∃xϕ)(1)
. Je-li x některá
z proměnných xi, platí (∃xϕ)(1)
= ∃vi(ϕx(vi))(1)
a (ϕx(t))(1)
= ((ϕx(vi))(1)
)vi (t).
Není-li, platí (∃xϕ)(1)
= ∃xϕ(1)
a (ϕx(t))(1)
= (ϕ(1)
)x(t). V obou případech máme
v P(1)
legální krok, tj. krok v souladu s pravidlem ∃-r. Protože ﬁnální sekvent S
důkazu P je regulární, P(1)
je důkazem téhož sekventu S.
Označme dále xn+1, . . , xn+m proměnné, které se v důkazu P(1)
vyskytují současně
volně i vázaně. Vzhledem k již provedeným úpravám (kterými jsme důkaz P
přepracovali na důkaz P(1)
) žádná z těchto proměnných nemá volné výskyty v sekventu
S. Může tam ale mít vázané výskyty. Opět zvolme navzájem různé proměnné
vn+1, . . , vn+m, které se nevyskytují v P(1)
, a pišme v P(1)
všude vn+1, . . , vn+m
místo volných výskytů proměnných xn+1, . . , xn+m. Opět lze probíráním všech pravidel
kalkulu GK ověřit, že výsledek P(2)
této záměny je důkazem, a to důkazem
stále téhož sekventu S.
Nechť v důkazu P(2)
je právě r-krát použito některé z pravidel generalizace, a to
na proměnné y1, . . , yr (tentokrát ne nutně různé). Zvolme navzájem různé proměnné
z1, . . , zr nevyskytující se v důkazu P(2)
. Pro 1 ≤ i ≤ r označme Pi ten
podstrom důkazu P(2)
, v jehož posledním kroku je generalizována proměnná yi,
a označme Si ﬁnální sekvent důkazu Pi. Zvolme takové j, že sekvent Sj je v důkazu
P(2)
maximální, tj. takové, že důkaz Pj neobsahuje jako podstrom žádný
z ostatních důkazů Pi pro i = j. Všude v Pj pišme zj místo yj. Všechny kroky
uvnitř podstromu Pj zůstanou legální díky důvodům, které byly naznačeny v předchozím
odstavci. Podmínka EVC (viz str. 183) zaručuje, že proměnná yj nemá volné
výskyty v sekventu Sj. Se sekventem Sj se tedy nic neděje. Všechny kroky v důkazu
P(2)
mimo podstrom Pj, včetně onoho, který je aplikován na sekvent Sj, zůstávají,
jak byly, tedy legální. Popsaný postup opakujme s ostatními podstromy Pi
s tím, že pro záměnu proměnných volíme vždy ten z nich, jehož ﬁnální sekvent je
maximální z dosud neuvažovaných. Výsledkem je regulární důkaz P(3)
původního
sekventu. Důkaz P(3)
nemá větší (má stejnou) hloubku a hodnost. QED
Lemma 3.3.8 (o substituci) Nechť P je důkaz, nechť z je proměnná, která v důkazu
P není generalizována, nechť s je term, jehož žádná proměnná není v důkazu
P generalizována ani kvantiﬁkována. Pak Pz(s), výsledek substituce termu s
za všechny volné výskyty proměnné z v důkazu P, je opět důkazem.
Důkaz Plný důkaz lze provést pečlivým probráním všech pravidel kalkulu GK.
Ponecháváme jej za cvičení, uvádíme ale hlavní myšlenky. Není-li žádná proměnná
termu s v důkazu P kvantiﬁkována, pak term s je v každé formuli důkazu P substituovatelný
za z. Pravidla generalizace umožňují generalizovat proměnné, nikoliv
termy. Na tom se ale nic nepokazí, neboť term s nedosazujeme za proměnnou, která
je kdekoliv v důkazu P generalizována. Protože žádná proměnná termu s není v důkazu
P generalizována, substituce termu s nezanese nežádoucí volné proměnné do
žádného místa, kde je v P použito pravidlo generalizace, tj. nikde nepokazí platnost
podmínky EVC. QED
3.3 Gentzenovský predikátový kalkulus 193
Lemma 3.3.9 (o oslabení) Nechť P je důkaz sekventu Γ ⇒ ∆ a nechť Π a Λ
jsou množiny formulí takové, že žádná proměnná, která má volný výskyt v některé
formuli v Π ∪ Λ, není v důkazu P generalizována. Pak přidáním všech formulí
z množiny Π do všech antecedentů a přidáním všech formulí z množiny Λ do všech
sukcedentů vznikne opět důkaz.
Důkaz je zřejmý.
Pravidlem &-r lze odvodit sekvent Γ ⇒ ∆, ϕ & ψ ze sekventů Γ ⇒ ∆, ϕ
a Γ ⇒ ∆, ψ . Myslitelné a korektní by bylo i opačné pravidlo, které by dovolilo
odvodit například sekvent Γ ⇒ ∆, ϕ ze sekventu Γ ⇒ ∆, ϕ & ψ . Do kalkulu
GK ale takové pravidlo z dobrých důvodů nebylo přijato. Jednak by přestala
platit věta 3.3.4 a jednak takové pravidlo ani není potřeba. Máme-li totiž důkaz P
sekventu Γ ⇒ ∆, ϕ &ψ , snadno z něj utvoříme důkaz P sekventu Γ ⇒ ∆, ϕ :
Γ ⇒ ∆, ϕ & ψ
e
e
e
£
£
£
P
ϕ ⇒ ϕ
ϕ & ψ ⇒ ϕ
Γ ⇒ ∆, ϕ .
Přitom takto sestrojený důkaz P má větší hloubku než důkaz P a jeho hodnost
max{r(P), 1 + d(ϕ & ψ)} také může být větší. Následující lemma, lemma o inverzi,
tvrdí, že existuje jiný důkaz sekventu Γ ⇒ ∆, ϕ , který nemá větší hloubku
ani hodnost, a že podobným způsobem lze „obrátit všechna ostatní pravidla kalkulu
GK s výjimkou pravidel speciﬁkace. Cvičení 22 oddílu 3.2 ukazuje, že je-li E
sekvent tvaru Γ ⇒ ∆, ∃xϕ dokazatelný, nemusí to znamenat dokazatelnost žádného
sekventu tvaru Γ ⇒ ∆, ϕx(t) . Pro pravidla speciﬁkace lemma o inverzi
neplatí.
Domluvme se, že nadále nepřipouštíme, aby principální formule iniciálních sekventů
byly neatomické. Kalkulem GK tedy nadále rozumíme kalkulus z bodu (d) E
věty 3.3.2.
Lemma 3.3.10 (o inverzi) (a) Má-li kterýkoliv sekvent v levém sloupci následující
tabulky regulární důkaz P, pak (každý) sekvent v tomtéž řádku vpravo má důkaz,
jehož hloubka a hodnost není větší než hloubka a hodnost důkazu P:
Γ ⇒ ∆, ϕ → ψ Γ, ϕ ⇒ ∆, ψ
Γ ⇒ ∆, ϕ & ψ Γ ⇒ ∆, ϕ , Γ ⇒ ∆, ψ
Γ ⇒ ∆, ϕ ∨ ψ Γ ⇒ ∆, ϕ, ψ
Γ ⇒ ∆, ¬ϕ Γ, ϕ ⇒ ∆
Γ, ϕ → ψ ⇒ ∆ Γ ⇒ ∆, ϕ , Γ, ψ ⇒ ∆
Γ, ϕ & ψ ⇒ ∆ Γ, ϕ, ψ ⇒ ∆
Γ, ϕ ∨ ψ ⇒ ∆ Γ, ϕ ⇒ ∆ , Γ, ψ ⇒ ∆
Γ, ¬ϕ ⇒ ∆ Γ ⇒ ∆, ϕ .
194 3 Predikátová logika
(b) Nechť P je regulární důkaz sekventu Γ ⇒ ∆, ∀xϕ nebo Γ, ∃xϕ ⇒ ∆ a
nechť žádná proměnná vyskytující se v termu t není v důkazu P kvantiﬁkována ani
generalizována. Pak sekvent Γ ⇒ ∆, ϕx(t) resp. Γ, ϕx(t) ⇒ ∆ má důkaz,
jehož hloubka a hodnost není větší než hloubka a hodnost důkazu P.
Důkaz V tvrzení (a) uvažujme například o druhém řádku. Máme tedy regulární
důkaz P sekventu Γ ⇒ ∆, ϕ & ψ a chceme získat důkaz sekventu Γ ⇒ ∆, ϕ ,
který nemá větší hloubku ani hodnost. Postupujme indukcí dle hloubky důkazu P.
Platí-li ϕ & ψ ∈ ∆, pak sekvent Γ ⇒ ∆, ϕ lze ze sekventu Γ ⇒ ∆, ϕ & ψ
získat pouhým přidáním formule ϕ do sukcedentu. Protože důkaz P je regulární,
žádná proměnná volná ve formuli ϕ není v P generalizována. Lemma 3.3.9 v tomto
případě zaručuje, že přidáním formule ϕ do sukcedentů všech sekventů důkazu P
vznikne důkaz sekventu Γ ⇒ ∆, ϕ . Přidání formule ϕ do všech sukcedentů
ovšem nezvýší hloubku ani hodnost. Nadále tedy předpokládejme, že ϕ & ψ /∈ ∆.
Rozlišme případy, kdy formule ϕ & ψ je a kdy není principální formulí v posledním
kroku důkazu P. Přitom počítejme s tím, že je-li principální, může současně být
také postranní. Nechť tedy formule ϕ & ψ není principální v posledním kroku
důkazu P. Důkaz P tedy může mít tvar například
Π, Σ1 ⇒ Λ, Ω1
e
e
e
¡
¡
¡
P1
Π, Σ ⇒ Λ, Ω ,
kde Π a Λ jsou množiny postranních formulí, Σ ∪ Ω je množina všech principálních
formulí (takže jedna z množin Σ a Ω je prázdná a druhá je jednoprvková), Σ1 ∪ Ω1
je množina všech vstupních formulí (takže každá z nich je nejvýše jednoprvková)
a platí d(P1) < d(P). Musí platit Γ = Π ∪ Σ a ∆ ∪ {ϕ & ψ} = Λ ∪ Ω. Protože
formule ϕ&ψ není principální, máme ϕ&ψ /∈ Ω a ϕ&ψ ∈ Λ. Indukční předpoklad
užitý na důkaz P1 dává důkaz P1 sekventu Π, Σ1 ⇒ Λ − {ϕ & ψ}, ϕ, Ω1 , pro
který platí d(P1) ≤ d(P1) = d(P) − 1 a r(P1) ≤ r(P1) = r(P). Pak
Π, Σ1 ⇒ Λ − {ϕ & ψ}, ϕ, Ω1
e
e
e
¡
¡
¡
P1
Π, Σ ⇒ Λ − {ϕ & ψ}, ϕ, Ω
je požadovaný důkaz sekventu Γ ⇒ ∆, ϕ . V případech, kdy v posledním kroku
důkazu P je užito pravidlo se dvěma předpoklady nebo kdy v posledním (a jediném)
kroku je užito pravidlo A, se uvažuje naprosto analogicky.
Nechť nyní formule ϕ&ψ je principální v posledním kroku důkazu P. Je-li posledním
krokem důkazu P užití pravidla W, můžeme jednoduše opět užít pravidlo W s tím,
že jím přidáme formuli ϕ místo formule ϕ & ψ. Protože jsme se domluvili, že
3.3 Gentzenovský predikátový kalkulus 195
jako principální formule iniciálních sekventů připouštíme pouze atomické formule,
zbývá pouze případ, kdy v posledním kroku důkazu P je formule ϕ & ψ odvozena
pravidlem &-r. Protože ϕ & ψ /∈ ∆, množinou postranních formulí v sukcedentu je
množina ∆ nebo množina ∆ ∪ {ϕ & ψ}, a důkaz P má podle toho jeden z tvarů
Γ ⇒ ∆, ϕ
e
e
e
£
£
£
P1
Γ ⇒ ∆, ψ
g
g
g
¡
¡
¡
P2
Γ ⇒ ∆, ϕ & ψ ,
Γ ⇒ ∆, ϕ & ψ, ϕ
e
e
e
£
£
£
P1
Γ ⇒ ∆, ϕ & ψ, ψ
g
g
g
¡
¡
¡
P2
Γ ⇒ ∆, ϕ & ψ .
V prvním případě je P1 hledaný důkaz, v druhém případě užijme indukční předpoklad
na důkaz P1 a nahraďme formuli ϕ & ψ v jeho ﬁnálním sekventu formulí ϕ.
K tvrzení (b) poznamenejme, že term t je substituovatelný za x ve formuli ϕ, a dále
postupujme podobně jako v (a). Nechť P je důkaz sekventu Γ ⇒ ∆, ∀xϕ . Není-li
formule ∀xϕ principální formulí v posledním kroku důkazu P, užijme indukční
předpoklad na sekvent nebo sekventy vstupující do posledního kroku, tj. nahraďme
v množině postranních formulí formuli ∀xϕ formulí ϕx(t), a pak proveďme poslední
krok tak, jak byl. Formule ϕx(t) může oproti formuli ∀xϕ obsahovat navíc nějaké
volné proměnné, nikoliv ale takové, které jsou v důkazu P generalizovány. To
znamená, že poslední krok důkazu P zůstane legálním krokem i v případě, je-li
užitím pravidla generalizace. Je-li formule ∀xϕ principální a současně postranní
v posledním kroku důkazu P, pak důkaz P má tvar
Γ ⇒ ∆, ∀xϕ, ϕx(y)
e
e
e
¡
¡
¡
P1
Γ ⇒ ∆, ∀xϕ ,
kde důkaz P1 je regulární. Lemma 3.3.8 dovoluje dosadit term t za proměnnou y.
Výsledný důkaz (P1)y(t) sekventu Γ ⇒ ∆, ∀xϕ, ϕx(t) má hloubku menší než důkaz
P, je regulární a žádná proměnná termu t v něm není generalizována ani kvantiﬁkována.
Indukční předpoklad dává požadovaný důkaz sekventu Γ ⇒ ∆, ϕx(t) .
QED
Lemma 3.3.11 (o redukci) Nechť P1 je důkaz sekventu Γ ⇒ ∆, θ , nechť P2
je důkaz sekventu Π, θ ⇒ Λ a nechť následující důkaz P0:
Γ ⇒ ∆, θ
e
e
e
£
£
£
P1
Π, θ ⇒ Λ
g
g
g
¡
¡
¡
P2
Γ, Π ⇒ ∆, Λ
(v jehož posledním kroku je užito pravidlo Cut na formuli θ) je regulární. Nechť
dále platí r(P1) ≤ d(θ) a r(P2) ≤ d(θ). Pak sekvent Γ, Π ⇒ ∆, Λ má důkaz
hodnosti nejvýše d(θ) a hloubky nejvýše d(P1) + d(P2).
196 3 Predikátová logika
Důkaz Nejprve poznamenejme, že důkaz P0 není hledaným důkazem, neboť pro
jeho hodnost platí r(P0) = 1 + d(θ). Můžeme předpokládat θ /∈ ∆ a θ /∈ Π, jinak
bychom mohli důkaz sekventu Γ, Π ⇒ ∆, Λ získat přidáním formulí do všech
sekventů důkazu P1 nebo do všech sekventů důkazu P2, tj. užitím lemmatu 3.3.9.
Postupujme indukcí podle d(P1) + d(P2), tj. podle součtu hloubek obou daných
důkazů. Rozebereme řadu různých případů.
Nechť alespoň jeden z důkazů P1 a P2 je takový, že má nenulovou hloubku a formule
θ není principální v jeho posledním kroku. Nechť tímto důkazem je například
P2. Předpokládejme například, že poslední krok důkazu P2 je ∨-l, přičemž
principální formule je ϕ∨ψ. Množinu levých postranních formulí v posledním kroku
důkazu P2 můžeme psát ve tvaru Σ ∪ {θ}, kde θ /∈ Σ. Důkaz P2 má tedy tvar
Σ, θ, ϕ ⇒ Λ
e
e
e
£
£
£
P3
Σ, θ, ψ ⇒ Λ
g
g
g
¡
¡
¡
P4
Σ, θ, ϕ ∨ ψ ⇒ Λ ,
kde Σ∪{θ, ϕ∨ψ} = Π∪{θ}. Platí d(P3) < d(P2) a d(P4) < d(P2). To znamená, že
lze užít indukční předpoklad na dvojice [P1, P3] a [P1, P4]. Existuje tedy důkaz P3
sekventu Γ, Σ, ϕ ⇒ ∆, Λ a důkaz P4 sekventu Γ, Σ, ψ ⇒ ∆, Λ , pro které platí
d(P3) ≤ d(P1) + d(P3) < d(P1) + d(P2),
d(P4) ≤ d(P1) + d(P4) < d(P1) + d(P2).
Přitom r(P3) ≤ d(θ) a r(P4) ≤ d(θ). Pak ale
Γ, Σ, ϕ ⇒ ∆, Λ
e
e
e
£
£
£
P3
Γ, Σ, ψ ⇒ ∆, Λ
g
g
g
¡
¡
¡
P4
Γ, Σ, ϕ ∨ ψ ⇒ ∆, Λ
je hledaný důkaz hloubky nejvýše d(P1) + d(P2) a hodnosti nejvýše d(θ), neboť
z θ /∈ Π, θ /∈ Σ, z rovnosti Σ ∪ {θ, ϕ ∨ ψ} = Π ∪ {θ} a z faktu, že ϕ ∨ ψ a θ jsou
různé formule, plyne Σ ∪ {ϕ ∨ ψ} = Π.
Nechť alespoň jeden z důkazů P1 a P2 má nulovou hloubku. Nechť je to například
P1. Pak platí Γ∩∆ = ∅ nebo θ ∈ Γ. Když θ ∈ Γ, pak sekvent Γ, Π ⇒ ∆, Λ
lze získat ze sekventu Π, θ ⇒ Λ přidáním jistých formulí, a regularita důkazu
P0 a lemma 3.3.9 zaručují, že přidáním těchže formulí do všech sekventů
důkazu P2 vznikne důkaz P splňující d(P) = d(P2) = d(P1)+d(P2) a r(P) = r(P2).
Když Γ∩∆ = ∅, pak sekvent Γ, Π ⇒ ∆, Λ je iniciální. Má tedy bezřezový důkaz
hloubky nula.
Podobně jako v předchozím odstavci lze uvažovat i v případě, kdy formule θ je
alespoň v jednom z důkazů P1 a P2 principální formulí pravidla W. Nadále tedy
3.3 Gentzenovský predikátový kalkulus 197
předpokládejme, že oba důkazy P1 a P2 mají nenulovou hloubku a že formule θ
je v obou z nich principální formulí posledního kroku. V tom případě nemůže být
formule θ atomickou formulí. Uvažujme, jaký může mít tvar.
Nechť θ je tvaru ϕ → ψ. Jak v posledním kroku důkazu P1, tak v posledním kroku
důkazu P2 může nebo nemusí být formule θ zároveň postranní formulí. Předpokládejme,
že v obou důkazech je postranní formulí — úvahy v ostatních případech
jsou podobné, jen jednodušší. Důkazy P1 a P2 mají tedy tvar
Γ, ϕ ⇒ ∆, ϕ → ψ, ψ
e
e
e
¡
¡
¡
P3
Γ ⇒ ∆, ϕ → ψ ,
Π1, ϕ → ψ ⇒ Λ1, ϕ
e
e
e
£
£
£
P4
Π2, ϕ → ψ, ψ ⇒ Λ2
g
g
g
¡
¡
¡
P5
Π, ϕ → ψ ⇒ Λ ,
přičemž důkaz P3 má hloubku d(P1) − 1, důkazy P4 a P5 mají hloubku nejvýše
d(P2) − 1, všechny tři důkazy mají hodnost nejvýše d(θ) a Π1 ∪ Π2 = Π
a Λ1 ∪ Λ2 = Λ. Protože θ je ϕ → ψ, platí také d(ϕ) < d(θ) a d(ψ) < d(θ). Užijme
lemma 3.3.10 na sekvent Γ, ϕ ⇒ ∆, ϕ → ψ, ψ a na formuli ϕ → ψ. Existuje důkaz
P3 sekventu Γ, ϕ ⇒ ∆, ψ , jehož hloubka je nejvýše d(P1)−1 a jehož hodnost
je nejvýše d(θ). Ze stejného důvodu existuje důkaz P4 sekventu Π1 ⇒ Λ1, ϕ a
důkaz P5 sekventu Π2, ψ ⇒ Λ2 , přičemž oba tyto důkazy mají hloubku nejvýše
d(P2) − 1 a hodnost nejvýše d(θ). Utvořme z důkazů P3 až P5 a dvojího užití
pravidla řezu důkaz P:
Π1 ⇒ Λ1, ϕ
e
e
e
£
£
£
P4
Γ, ϕ ⇒ ∆, ψ
e
e
e
£
£
£
P3
Π2, ψ ⇒ Λ2
g
g
g
¡
¡
¡
P5
Γ, Π2, ϕ ⇒ ∆, Λ2
Γ, Π ⇒ ∆, Λ .
Pro hloubku a hodnost důkazu P platí
d(P) ≤ 1 + max{d(P2) − 1, 1 + max{d(P1) − 1, d(P2) − 1}} ≤
≤ 1 + max{d(P1), d(P2)},
r(P) ≤ max{d(θ), 1 + d(ϕ), 1 + d(ψ)} = d(θ).
Platí 1 + max{d(P1), d(P2)} ≤ d(P1) + d(P2), protože oba důkazy P1 a P2 mají
nenulovou hloubku. Důkaz P je tedy hledaným důkazem.
Nechť formule θ je tvaru ∀xϕ. Máme důkazy tvaru
Γ ⇒ ∆, ∀xϕ ,
e
e
e
¡
¡
¡
P1
Π, ∀xϕ, ϕx(t) ⇒ Λ
e
e
e
¡
¡
¡
P3
Π, ∀xϕ ⇒ Λ ,
198 3 Predikátová logika
kde d(P3) = d(P2)−1 a r(P3) ≤ d(θ). Přitom opět předpokládáme složitější případ,
kdy formule ∀xϕ, která je principální v posledním kroku důkazu P2, je v tomto
kroku zároveň postranní formulí. Protože důkaz P0 je regulární, žádná proměnná
vyskytující se v termu t není generalizována ani kvantiﬁkována v důkazu P1. Dle
lemmatu 3.3.10(b) existuje důkaz P1 sekventu Γ ⇒ ∆, ϕx(t) splňující podmínky
d(P1) ≤ d(P1) a r(P1) ≤ r(P1). Důkaz P1 na chvíli odložme a vzpomeňme si, že
dokazujeme indukcí podle d(P1)+d(P2). Protože d(P1)+d(P3) = d(P1)+d(P2)−1,
můžeme užít indukční předpoklad na důkazy P1 a P3 a na formuli ∀xϕ: existuje
důkaz P4 sekventu Γ, Π, ϕx(t) ⇒ ∆, Λ , jehož hloubka je nejvýše d(P1)+d(P2)−1
a jehož hodnost je nejvýše d(θ). Užití řezu na formuli ϕx(t):
Γ ⇒ ∆, ϕx(t)
e
e
e
£
£
£
P1
Γ, Π, ϕx(t) ⇒ ∆, Λ
g
g
g
g
g
¡
¡
¡
¡
¡
P4
Γ, Π ⇒ ∆, Λ
dává důkaz P, pro jehož hloubku a hodnost platí
d(P) ≤ 1 + max{d(P1), d(P1) + d(P2) − 1} = d(P1) + d(P2),
r(P) ≤ max{d(θ), 1 + d(ϕx(t))} = d(θ).
Důkaz P je tedy hledaným důkazem.
Zbývající případy, kdy formule θ je tvaru ϕ&ψ, ϕ∨ψ, ¬ϕ nebo ∃xϕ, jsou analogické
probraným a ponecháváme je za cvičení. QED
Lemma 3.3.12 Nechť P je regulární důkaz nenulové hodnosti. Pak existuje důkaz
P téhož sekventu, pro který platí r(P ) < r(P) a d(P ) ≤ 2d(P)
.
Důkaz Postupujme indukcí podle hloubky důkazu P. Maximální hloubka kterékoliv
formule, na niž je v důkazu P užit řez, je r(P)−1. Označme S ﬁnální sekvent
důkazu P. Sekvent S je krokem tvaru S1 / S odvozen ze sekventu S1, který je ﬁnálním
sekventem důkazu P1, nebo je krokem tvaru S1, S2 / S odvozen ze sekventů
S1 a S2, které jsou ﬁnálními sekventy důkazů P1 a P2. Bez újmy na obecnosti předpokládejme
druhý případ. Každý z důkazů P1 a P2 má hloubku nejvýše d(P) − 1.
Dle indukčního předpokladu existují důkazy P1 a P2 sekventů S1 a S2 splňující pod-E
mínky r(P1) < r(P), r(P2) < r(P), d(P1) ≤ 2d(P)−1
, d(P2) ≤ 2d(P)−1
. Označme P0
důkaz, který vznikne z důkazů P1 a P2 provedením téhož kroku, kterým končí důkaz
P, tj. kterým je v důkazu P odvozen sekvent S. Je-li tímto posledním krokem
důkazu P řez na formuli hloubky menší než r(P) − 1, nebo není-li to řez, je důkaz
P0 hledaným důkazem P , neboť pro jeho hodnost a hloubku platí r(P0) < r(P)
a d(P0) = 1 + max{d(P1), d(P2)} ≤ 1 + 2d(P)−1
≤ 2d(P)
.
Předpokládejme tedy, že posledním krokem důkazu P (a tedy i důkazu P0) je řez
na formuli θ, která má maximální možnou hloubku r(P) − 1. V tom případě platí
3.3 Gentzenovský predikátový kalkulus 199
r(P1) ≤ d(θ) a r(P2) ≤ d(θ). Protože důkaz P je regulární, S je regulární sekvent.
Díky lemmatu 3.3.7 tedy můžeme předpokládat, že důkaz P0 je regulární. Dle
lemmatu 3.3.11 existuje důkaz P sekventu S, pro jehož hloubku a hodnost platí
r(P ) ≤ d(θ) = r(P) − 1 a d(P ) ≤ d(P1) + d(P2) ≤ 2d(P)−1
+ 2d(P)−1
= 2d(P)
.
QED
Deﬁnujme superexponenciální funkci [n, k] → 2n
k rekurzí: 2n
0 = n, 2n
k+1 = 22n
k .
Nyní jsme připraveni vyslovit větu o eliminovatelnosti řezů.
Věta 3.3.13 (o eliminovatelnosti řezů) Má-li sekvent S regulární důkaz P, pak
týž sekvent má i bezřezový důkaz hloubky nejvýše 2
d(P)
r(P) .
Důkaz Indukcí dle hodnosti r(P) důkazu P a užitím lemmatu 3.3.12. QED
Důkaz věty o eliminovatelnosti řezů, který jsme uvedli, je s úpravami převzat
z Kleeneho knihy [49], z Takeutiho knihy [91] a ze Schwichtenbergovy kapitoly [76].
V knize [49] se neuvažuje o hloubkách důkazů. Odhad 2
d(P)
r(P) pro hloubku důkazu P
vzniklého z důkazu P odstraněním řezů je stanoven v kapitole [76], tam se ale
pracuje se zvlášť upraveným (zjednodušeným) kalkulem. Lze dokázat, že mez 2
d(P)
r(P)
je optimální nebo blízká optimální. Přístupný důkaz, viz [69], nalezl P. Pudlák.
Pudlákův důkaz je také vypracován v diplomové práci [53].
Věta o eliminovatelnosti řezů spolu s faktem, že odhad 2
d(P)
r(P) je blízký optimálnímu,
dává odpověď na otázku položenou v úvodu tohoto oddílu, zda v deﬁnici
důkazu je nutné připustit uvažování oklikou. Není to nutné, avšak správně zvolené
okliky (tj. formule, na které jsou užity řezy) mohou některé důkazy velmi výrazně
zkrátit.
Dále uvádíme několik často citovaných důsledků věty o eliminovatelnosti řezů.
Věta 3.3.14 (Hilbertova-Ackermannova) Nechť θ je otevřená formule taková,
že formule ∃xθ je logicky platná. Pak existují termy t1, . . , tn takové, že disjunkce
θx(t1) ∨ . . ∨ θx(tn) je logicky platná.
Důkaz Sekvent ⇒ ∃xθ je regulární, logicky platný, a tedy dokazatelný. Nechť
tedy P je jeho bezřezový důkaz. Z věty 3.3.4 víme, že každá formule v P je s-podformulí
formule ∃xθ. Z toho plyne, že v P se nevyskytuje žádná formule obsahující
univerzální kvantiﬁkátor, a že tedy v P není užito pravidlo ∀-l ani ∀-r. Dále je
zřejmé, že formule ∃xθ není nikdy vstupní formulí jakéhokoliv pravidla, jinak by
totiž vznikla formule, která obsahuje kvantiﬁkátor ∃x v rozsahu platnosti nějakého
dalšího logického symbolu, čili formule, která není s-podformulí formule ∃xθ. Jakákoliv
formule vyskytující se v P v antecedentu může z antecedentu zmizet pouze
(tak, že se stane s-podformulí nějaké formule, která z antecedentu zmizí) užitím
některého z pravidel →-r nebo ¬-r. Protože žádná s-podformule formule ∃xθ neobsahuje
existenční kvantiﬁkátor v rozsahu platnosti implikace ani negace (ani jiného
logického symbolu), můžeme usoudit, že v P není užito pravidlo ∃-l a že formule ∃xθ
200 3 Predikátová logika
není principální formulí žádného iniciálního sekventu (bez ohledu na to, zda připouštíme
neatomické formule jako principální formule iniciálních sekventů). V P se
mohou (a ovšem musí) vyskytovat užití pravidla ∃-r. Principální formulí každého
takového kroku ale musí být formule ∃xθ, a tedy každá vstupní formule takového
kroku musí mít tvar θx(t) pro jistý term t.
Nechť Ω je množina všech vstupních formulí pravidla ∃-r, nechť θx(t1), . . , θx(tn)
jsou všechny její prvky. Pro libovolný sekvent S tvaru Γ ⇒ ∆ označme S sekvent
Γ ⇒ Ω, ∆ − {∃xθ} . Když S je iniciální sekvent našeho důkazu P, pak S
je opět iniciální sekvent. Když sekvent S je užitím výrokového kroku odvozen ze
sekventu S1 nebo ze dvou sekventů S1 a S2, pak sekvent S je tímtéž krokem odvoditelný
ze sekventu S1 resp. ze sekventů S1 a S2. Když sekvent S je jedním krokem
odvozen ze sekventu S1 pomocí pravidla ∃-r nebo pravidla W, pak S a S1 jsou
tytéž sekventy nebo je sekvent S odvoditelný ze sekventu S1 pomocí pravidla W.
To znamená, že pro každý sekvent S důkazu P platí, že sekvent S je dokazatelný
(a logicky platný). Pro ﬁnální sekvent ⇒ ∃xθ to znamená, že sekvent ⇒ Ω
je logicky platný, a že tedy disjunkce θx(t1) ∨ . . ∨ θx(tn) je logicky platná. QED
K větě 3.3.14 ještě poznamenejme, že z cvičení 22 a 23 oddílu 3.1 plyne, že
nelze požadovat, aby term t byl pouze jeden, a také že předpoklad, že formule θ je
otevřená, je podstatný.
Následující lemma 3.3.15 a větu 3.3.16 by bylo možno formulovat a dokazovat
pohodlněji, kdybychom mezi logickými symboly měli symbol ⊥ pro nepravdu.
Kvůli dvěma tvrzením ale seznam logických symbolů neměňme a místo toho se
domluvme, že ⊥ označuje pevně zvolenou vyvratitelnou sentenci (toho jazyka, se
kterým pracujeme).
Lemma 3.3.15 Nechť Γ1, Γ2 ⇒ ∆1, ∆2 je regulární a logicky platný sekvent.
Pak existuje formule θ taková, že
◦ oba sekventy Γ1 ⇒ ∆1, θ a Γ2, θ ⇒ ∆2 jsou logicky platné,
◦ formule θ je jednou z formulí ⊥, ¬⊥, nebo má vlastnost, že každý predikátový
symbol, který se v ní vyskytuje, se současně vyskytuje v obou sekventech
Γ1 ⇒ ∆1 a Γ2 ⇒ ∆2 ,
◦ každá volná proměnná formule θ se současně vyskytuje volně v obou sekventech
Γ1 ⇒ ∆1 a Γ2 ⇒ ∆2 .
Důkaz Nechť je dán sekvent Γ1, Γ2 ⇒ ∆1, ∆2 . Vezměme jeho bezřezový důkaz
P a postupujme indukcí podle hloubky d(P) důkazu P. Je-li d(P) = 0, pak
(Γ1 ∪ Γ2) ∩ (∆1 ∪ ∆2) = ∅. Je-li množina Γ1 ∩ ∆1 neprázdná, volme θ := ⊥. Je-li
množina Γ2 ∩ ∆2 neprázdná, volme θ := ¬⊥. Je-li množina Γ1 ∩ ∆2 neprázdná,
volme za formuli θ kterýkoliv její prvek, a je-li množina Γ2 ∩∆1 neprázdná, volme za
formuli θ negaci kteréhokoliv jejího prvku. V obou případech je splněn požadavek
na predikátové symboly a volné proměnné.
Nechť dále důkaz P má nenulovou hloubku. Předpokládejme, že jeho poslední krok
má tvar Γ, α ⇒ ∆ , Γ, β ⇒ ∆ / Γ, α ∨ β ⇒ ∆ a že jsou dány množiny Γ1,
3.3 Gentzenovský predikátový kalkulus 201
Γ2, ∆1 a ∆2 takové, že ∆1 ∪∆2 = ∆ a Γ1 ∪Γ2 = Γ∪{α∨β}. Označme Γ1 = Γ1 ∩Γ
a Γ2 = Γ2 ∩ Γ. Platí Γ1 ∪ Γ2 = Γ. Dále platí α ∨ β ∈ Γ1 nebo α ∨ β ∈ Γ2.
Předpokládejme třeba druhý případ. Poslední krok důkazu P si tedy můžeme
představit takto:
Γ1, α, Γ2 ⇒ ∆1, ∆2 Γ1, β, Γ2 ⇒ ∆1, ∆2
Γ1, α ∨ β, Γ2 ⇒ ∆1, ∆2 .
Přitom složená závorka dole naznačuje, že ve sjednocení, které je dáno, formule α∨β
patří k druhé množině Γ2, kdežto složené závorky nahoře naznačují, že formuli α
resp. formuli β jsme se tudíž rozhodli přiřadit rovněž k množině Γ2. Dle indukčního
předpokladu užitého na horní sekventy existují formule η a λ takové, že formule η je
jednou z formulí ⊥, ¬⊥, nebo obsahuje pouze takové predikátové symboly a volné
proměnné, které se současně vyskytují (volně) v obou sekventech Γ1 ⇒ ∆1
a Γ2, α ⇒ ∆2 , formule λ je jednou z formulí ⊥, ¬⊥, nebo obsahuje pouze takové
predikátové symboly a volné proměnné, které se současně vyskytují (volně) v obou
sekventech Γ1 ⇒ ∆1 a Γ2, β ⇒ ∆2 , a sekventy
Γ1 ⇒ ∆1, η , Γ2, α, η ⇒ ∆2 , Γ1 ⇒ ∆1, λ , Γ2, β, λ ⇒ ∆2
jsou všechny logicky platné (dokazatelné). Z prvního a třetího lze odvodit sekvent
Γ1 ⇒ ∆1, η & λ , ze zbývajících lze odvodit sekvent Γ2, α ∨ β, η & λ ⇒ ∆2 , tj.
sekvent Γ2, η&λ ⇒ ∆2 . Není-li žádná z formulí η a λ totožná s žádnou z formulí
⊥ a ¬⊥, volme θ := η & λ. Je-li některá z formulí η a λ totožná s formulí ⊥, volme
za θ formuli ⊥. Jsou-li obě z formulí η a λ totožné s formulí ¬⊥, volme θ := ¬⊥.
Formule θ je ve všech případech ekvivalentní s formulí η & λ a splňuje požadavky.
V případě, kdy α ∨ β ∈ Γ1, a také v případech, kdy je v posledním kroku důkazu P
užito jiné výrokové pravidlo než ∨-l, se postupuje podobně.
Předpokládejme, že v posledním kroku důkazu P je užito pravidlo ∀-l, že máme
dány množiny Γ1, Γ2, ∆1 a ∆2 podobně jako v předchozích případech a že pro
principální formuli ∀xα posledního kroku opět platí ∀xα ∈ Γ2. Poslední krok
důkazu P si tedy můžeme představit takto:
Γ1, αx(t), Γ2 ⇒ ∆1, ∆2
Γ1, ∀xα, Γ2 ⇒ ∆1, ∆2 ,
kde množiny Γ1 a Γ2 se vztahují k daným množinám Γ1 a Γ2 analogicky jako ve
výše probraném případě týkajícím se pravidla ∨-l. Dle indukčního předpokladu
existuje formule λ, která je jednou z formulí ⊥, ¬⊥, nebo obsahuje pouze predikátové
symboly a volné proměnné, které se současně vyskytují (volně) v obou
sekventech Γ1 ⇒ ∆1 a Γ2, αx(t) ⇒ ∆2 , a přitom sekventy
Γ1 ⇒ ∆1, λ a Γ2, αx(t), λ ⇒ ∆2
202 3 Predikátová logika
jsou oba logicky platné. Nechť v1, . . , vk je seznam všech proměnných, které se
vyskytují volně ve formuli αx(t), ale nikoliv v sekventu Γ2, ∀xα ⇒ ∆2 . Z levého
sekventu lze odvodit sekvent Γ1 ⇒ ∆1, ∃v1 . . ∃vkλ , z pravého lze odvodit
sekvent Γ2, ∀xα, ∃v1 . . ∃vkλ ⇒ ∆2 , tj. sekvent Γ2, ∃v1 . . ∃vkλ ⇒ ∆2 . Když
λ je některá z formulí ⊥, ¬⊥, pak ∃v1 . . ∃vkλ a λ jsou ekvivalentní formule a lze
volit θ := λ. Jinak volme θ := ∃v1 . . ∃vkλ.
Podívejme se ještě třeba na případ
Γ1, αx(y), Γ2 ⇒ ∆1, ∆2
Γ1, ∃xα, Γ2 ⇒ ∆1, ∆2 ,
kdy v posledním kroku důkazu P je užito pravidlo ∃-l a jeho principální formule
je v rozkladu počítána k levé množině Γ1. Indukční předpoklad dává formuli λ,
která je jednou z formulí ⊥, ¬⊥, nebo obsahuje pouze predikátové symboly a volné
proměnné, které se současně vyskytují (volně) v sekventech Γ1, αx(y) ⇒ ∆1
a Γ2 ⇒ ∆2 , a přitom sekventy
Γ1, αx(y) ⇒ ∆1, λ a Γ2, λ ⇒ ∆2
jsou oba logicky platné. Protože proměnná y se nevyskytuje volně v λ (jinak by se
musela vyskytovat volně v Γ2 ∪∆2 a v kroku ∃-l by nebyla splněna podmínka EVC),
je sekvent Γ1, ∃xα ⇒ ∆1, λ logicky platný a formuli λ můžeme bez dalších úprav
prohlásit za hledanou formuli θ. QED
Věta 3.3.16 Nechť formule ϕ→ψ je regulární a logicky platná. Pak jedna z formulí
¬ϕ a ψ je logicky platná, nebo existuje formule θ taková, že obě formule ϕ → θ
a θ → ψ jsou logicky platné, a přitom formule θ obsahuje pouze takové predikátové
symboly a volné proměnné, které se současně vyskytují (volně) ve ϕ i v ψ.
Důkaz Zvolme Γ1 = {ϕ}, ∆2 = {ψ}, Γ2 = ∆1 = ∅. Vezměme formuli θ, jejíž
existenci zaručuje lemma 3.3.15. Když θ je ⊥ nebo ¬⊥, pak ¬ϕ nebo ψ je logicky
platnou formulí. QED
Platí i silnější tvrzení než věta 3.3.16, v němž stojí „mimologické symboly
místo „predikátové symboly . Tomuto silnějšímu tvrzení se říká Craigova věta o
interpolaci. Větu 3.3.16 tedy můžeme označit jako slabou větu o interpolaci. Také
lemma 3.3.15 lze považovat za variantu věty o interpolaci. Postup, kterým jsme
dokázali větu 3.3.16, přes důkaz lemmatu 3.3.15, je v [91] označen jako Maeharova
metoda.
Rozšiřme nyní kalkulus GK na kalkulus pro predikátovou logiku s rovností,
a to podobným způsobem, jako když jsme v oddílu 3.2 rozšířili kalkulus HK na
kalkulus HKe. Kromě iniciálních sekventů tvaru A (tj. takových, jejichž antecedent
a sukcedent mají neprázdný průnik) připusťme ještě následující iniciální sekventy
týkající se rovnítka:
3.3 Gentzenovský predikátový kalkulus 203
e1: ⇒ t = t ,
e2: t = s ⇒ s = t ,
e3: t = s, s = u ⇒ t = u ,
e4: t1 = s1, . . , tn = sn ⇒ F(t) = F(s) ,
e5: t1 = s1, . . , tn = sn, P(t) ⇒ P(s) ,
kde t, s, u, ti, si jsou libovolné termy, F libovolný funkční symbol a P libovolný
predikátový symbol (zvoleného jazyka). Výsledný kalkulus označme GKe. Podobně
jako v případě kalkulu HKe lze ukázat, že iniciální sekventy tvaru e2 a e3 jsou zbytečné,
pokud e5 chápeme tak, že predikát P může být i rovnítko. Dále libovolný
sekvent Γ ⇒ ∆ je dokazatelný v kalkulu GKe právě tehdy, když existuje konečná
množina F ⊆ E taková, že sekvent Γ, F ⇒ ∆ je dokazatelný v kalkulu GK, přičemž
E je množina axiomů rovnosti deﬁnovaná v oddílu 3.2. Kalkulus GKe je
vzájemně polynomiálně simulovatelný s kalkulem HKe. Ověření všech těchto faktů
ponecháváme za cvičení. Lze ověřit, že například sekvent x = y, x = z ⇒ y = z
není iniciálním sekventem ani v případě, kdy predikát P v iniciálním sekventu e5
může být i rovnítko. Tento sekvent tedy v kalkulu GKe nelze dokázat bez užití
řezů. Znění věty o eliminovatelnosti řezů musíme pro kalkulus GKe trochu upravit.
Deﬁnujme, že řez v nějakém důkazu P je nepodstatný (tj. užití pravidla řezu
v důkazu P je nepodstatné), jestliže jeho vstupní formule je rovnost, tj. formule
tvaru t = s pro jisté termy t a s. Ostatní řezy jsou podstatné.
Věta 3.3.17 Každý regulární sekvent dokazatelný v kalkulu GKe je v kalkulu GKe
dokazatelný i bez užití podstatných řezů.
Důkaz Tentokrát pro jednoduchost neuvažujeme o hloubkách důkazů. Postup,
který jsme ukázali pro kalkulus GK, lze následovně modiﬁkovat pro kalkulus GKe.
V tom místě důkazu lemmatu 3.3.11, kde jsme se starali o případ, kdy důkazy
P1 a P2 mají oba nenulovou hloubku a formule θ je v obou z nich principální,
uvažujme navíc případ, kdy formule θ není rovnost, a přitom je v obou důkazech
principální formulí iniciálního sekventu tvaru e1–e5. Formule θ musí být tvaru P(t),
kde P není rovnítko, oba iniciální sekventy musí být tvaru e5, důkazy P1 a P2 mají
hloubku nula a důkaz P0 má tvar
s1 = t1, . . , sn = tn, P(s) ⇒ P(t) t1 = u1, . . , tn = un, P(t) ⇒ P(u)
s1 = t1, t1 = u1, . . , sn = tn, tn = un, P(s) ⇒ P(u) .
Požadovaný důkaz neobsahující podstatné řezy získáme tak, že vezmeme iniciální
sekvent s1 = u1, . . , sn = un, P(s) ⇒ P(u) , dále vezmeme n iniciálních sekventů
tvaru si = ti, ti = ui ⇒ si = ui a formule s1 = u1 až sn = un odstraníme
pomocí n (nepodstatných) řezů. QED
204 3 Predikátová logika
Věta 3.3.18 Nechť ϕ je sentence dokazatelná v teorii T. Pak ϕ má gentzenovský
důkaz v T, tj. sekvent tvaru F ⇒ ϕ , kde F ⊆ T je konečná, má důkaz v kalkulu
GKe, v němž se nevyskytují jiné formule než rovnosti a s-podformule prvků
množiny T ∪ {ϕ}.
Důkaz Máme sekvent F ⇒ ϕ , který je dokazatelný v kalkulu GKe a pro který
platí F ⊆ T. Protože všechny jeho formule jsou sentence, tento sekvent je regulární.
Existuje tedy důkaz P téhož sekventu, který neobsahuje podstatné řezy. Větu 3.3.4
lze snadno zobecnit do této podoby: každá formule v jakémkoliv důkazu P je s-podformulí
některé formule ψ takové, že ψ je v P obsažena ve ﬁnálním sekventu nebo
je na ni použit řez. QED
Cvičení
1. Nalezněte příklady na to, že všechny tři požadavky v podmínce EVC, totiž že
y nemá volné výskyty v Γ, v ∆ ani v ∃xϕ, jsou podstatné. Vysvětlete, proč
třetí požadavek nezní „y nemá volné výskyty ve ϕ .
2. Sestrojte důkazy všech logických axiomů kalkulu HK, tj. všech formulí tvaru
A1–A7 a B1 a B2, v kalkulu GK.
3. V důkazu věty 3.3.1 byla dokázána korektnost pravidla ∃-l. Dokončete důkaz
věty, tj. dokažte korektnost všech ostatních pravidel kalkulu GK.
4. Zdůvodněte, že věta 3.3.2 platí i v případě, kdy délka |P| důkazu P je deﬁnována
jako souhrnný počet výskytů všech symbolů (včetně číslic vyskytujících
se v indexech proměnných) v důkazu P.
5. Vypracujte všechny vynechané případy v důkazech lemmat 3.3.10 a 3.3.11.
6. Rozhodněte, zda platí: každá s-podformule regulární formule je regulární.
7. Každý regulární sekvent má důkaz, ve kterém není užito pravidlo W. Dokažte.
8. Zdůvodněte, že platí tato varianta věty 3.3.4: každá formule v libovolném důkazu
P je s-podformulí nějaké formule, která je v důkazu P obsažena ve ﬁnálním
sekventu nebo která je v důkazu P vstupní formulí některého užití pravidla
řezu.
9. Dokažte větu o středním sekventu: každý regulární logicky platný sekvent,
jehož všechny formule jsou prenexní, má bezřezový důkaz P, v němž všechna
užití výrokových pravidel předcházejí všechna užití kvantiﬁkátorových pravidel.
Středním sekventem je míněn poslední (nejnižší) sekvent S v důkazu P, který
neobsahuje kvantiﬁkátory. Tento sekvent S je tautologický a přitom ﬁnální
sekvent důkazu P lze ze sekventu S získat pouze užitím kvantiﬁkátorových
kroků.
3.3 Gentzenovský predikátový kalkulus 205
Návod. Začněte s bezřezovým důkazem P, v němž není užito pravidlo W. Deﬁnujte
řád kvantiﬁkátorového kroku jako počet všech výrokových kroků, které
po něm (tj. na cestě k ﬁnálnímu sekventu důkazu P) následují. Dále deﬁnujte
řád důkazu jako součet řádů všech kvantiﬁkátorových kroků. Má-li důkaz P nenulový
řád, lze v něm nalézt nejnižší kvantiﬁkátorový krok s nenulovým řádem.
Bezprostředně následující krok musí být výrokový. Protože principální formule
tohoto kvantiﬁkátorového kroku není vstupní formulí onoho bezprostředně následujícího
výrokového kroku, lze pořadí obou kroků zaměnit. Toto zdůvodněte
podrobně, probráním všech možných případů. Důkaz vzniklý záměnou obou
kroků má nižší řád.
10. Navrhněte alternativní důkaz věty 3.3.14 založený na předchozím cvičení.
11. Zdůvodněte, že předpoklad ve větě 3.3.16, že formule ϕ → ψ je regulární, není
podstatný.
12. Zdůvodněte, že ve větě 3.3.16 a v lemmatu 3.3.15 lze psát „predikátové symboly
a konstanty místo „predikátové symboly .
13. Nechť L1 a L2 jsou jazyky bez funkčních symbolů, nechť T1 je bezesporná
teorie v jazyce L1, nechť T2 je bezesporná teorie v jazyce L2 a nechť neexistuje
sentence ϕ v jazyce L1 ∩L2, která je dokazatelná v T1 a vyvratitelná v T2. Pak
T1 ∪T2 je bezesporná teorie. Toto tvrzení lze označit jako variantu Robinsonovy
věty o bezespornosti. Dokažte je převedením na lemma 3.3.15.
Návod. Když T1∪T2 je sporná, pak existují konečné množiny F1 ⊆ T1 a F2 ⊆ T2
takové, že sekvent F1, F2 ⇒ je logicky platný.
14. Dokažte, že věta 3.3.14 platí i pro predikátovou logiku s rovností.
15. Dokažte, že pro predikátovou logiku s rovností platí varianta věty 3.3.16 tohoto
znění: když formule ϕ → ψ je logicky platná, pak existuje formule θ, jejíž
všechny predikátové symboly s výjimkou rovnítka se současně vyskytují v obou
formulích ϕ a ψ, jejíž všechny volné proměnné se současně vyskytují volně
v obou formulích ϕ a ψ, a přitom formule ϕ → θ a θ → ψ jsou logicky platné.
Návod. Za formuli ⊥ vezměte třeba sentenci ∃x(x = x). Formulujte a dokažte
příslušnou variantu lemmatu 3.3.15.
3.4 Vlastnosti modelů a teorií
V tomto oddílu budeme klást důraz na užití sémantických metod. Jinými slovy,
ukážeme, že některé vlastnosti axiomatických teorií lze zjistit úvahami o strukturách,
modelech a vyplývání. Naším nejdůležitějším nástrojem bude věta o kompaktnosti
(klasické) predikátové logiky s rovností.
206 3 Predikátová logika
Věta 3.4.1 (o kompaktnosti) Nechť T je teorie. Pak
(a) Když T |= ϕ, pak existuje konečná množina F ⊆ T taková, že F |= ϕ.
(b) Když každá konečná množina F ⊆ T má model, pak T má model.
Důkaz Nechť T |= ϕ. Podle věty o silné úplnosti platí T ϕ. Existuje tedy důkaz
formule ϕ z předpokladů T. Důkaz je deﬁnován jako jistá konečná posloupnost
formulí. Za množinu F tedy můžeme vzít množinu všech těch prvků množiny T,
které se vyskytují v našem důkazu. Platí F ϕ, a tedy F |= ϕ.
Nechť T nemá žádný model. V tom případě lze o jakékoliv formuli ϕ říci, že platí
v každém modelu teorie T, tj. že T |= ϕ. Zvolme za ϕ sentenci ∃x(x = x). Podle
tvrzení (a) existuje konečná F ⊆ T taková, že F |= ∃x(x = x). O sentenci ∃x(x = x)
je jasné, že neplatí v žádné struktuře. Dále o ní víme, že platí v každém modelu
teorie F. Tedy F nemá žádný model. QED
Všimněme si, že věta o kompaktnosti je čistě sémantické tvrzení, kterému rozumí
každý, kdo rozumí Tarského deﬁnici a deﬁnici vyplývání. Logický kalkulus není
nutný k pochopení znění věty o kompaktnosti. Uplatnil se ale v důkazu.
Každé axiomatické teorii T s jazykem L odpovídá třída všech jejích modelů,
tj. třída všech struktur pro jazyk L, ve kterých platí všechny axiomy teorie T.
Představme si však, že úvahy začneme nikoliv od teorie, nýbrž od nějaké třídy E
struktur pro daný jazyk, a položíme si otázku: je E třídou všech modelů nějaké
teorie T? Existuje-li k třídě E teorie T taková, že E je třídou všech modelů teorie T,
řekneme, že E je axiomatizovatelná nebo že E je elementární třídou. Ptáme se tedy:
• Je každá třída E struktur pro nějaký jazyk L elementární třídou?
Tato otázka má smysl jen v případě, kdy třída E s každým svým prvkem D obsahuje
i všechny struktury izomorfní s D. V opačném případě triviální odpověď zní ne.
S jedním netriviálním případem, tj. s případem, kdy E obsahuje s každou strukturou
všechny s ní izomorfní struktury, a přesto není axiomatizovatelná, jsme se
již setkali. Víme, viz 3.2.13, že je-li L nejvýše spočetný jazyk, pak každá bezesporná
teorie v L má nejvýše spočetný model. To znamená, že libovolná elementární
třída obsahující všechny nespočetné struktury obsahuje také nějaké nejvýše
spočetné struktury. Třída všech nespočetných struktur pro jazyk L tedy není elementární
třídou.
Fakt, že je-li jazyk L nejvýše spočetný, pak třída všech nespočetných struktur
pro L není elementární třídou, lze také formulovat takto: vlastnost „býti nespočetnou
strukturou nelze vyjádřit pomocí sentencí jazyka L. Z následující věty
plyne, že ani vlastnost „býti konečnou strukturou nelze vyjádřit pomocí sentence
ani pomocí množiny sentencí (v tomto případě bez ohledu na mohutnost jazyka).
Věta 3.4.2 Nechť T je teorie a nechť pro každé přirozené číslo n existuje model
teorie T, jehož nosná množina má více než n prvků. Pak T má i nekonečné modely.
Důkaz Označme γn sentenci ∀x1 . . ∀xn∃y(y = x1 & . . & y = xn) (stejně jako
v příkladu 3.1.19(f)). I když nemáme žádný bližší údaj o jazyce teorie T, můžeme
3.4 Vlastnosti modelů a teorií 207
tvrdit, že γn je sentence jazyka teorie T, protože γn neobsahuje žádné mimologické
symboly. Sentence γn platí v libovolné struktuře D právě tehdy, když (nosná
množina D struktury) D má více než n prvků. Označme S = { γn ; n ≥ 1 }.
Tvrdíme, že je-li F ⊆ S a F je konečná, pak teorie T ∪ F má nějaký model.
Nechť konečná F ⊆ S je dána. Označme γn1 , . . , γnr prvky množiny F a označme
m = max{n1, . . , nr}. Podle předpokladu existuje nějaký model M teorie T, který
má více než m prvků. V M platí γm, a tedy i všechny γni . Tedy M |= T ∪ F.
Je-li F ⊆ T ∪ S a F je konečná, pak F = F1 ∪ F2, kde F1 ⊆ T a F2 ⊆ S. Přitom
F1 a F2 jsou konečné. Podle podmínky dokázané v předchozím odstavci existuje
model M teorie T ∪F2. Protože F1 ⊆ T, platí také M |= F1 ∪F2, tedy M |= F. Tím
jsme ověřili, že každá konečná F ⊆ T ∪ S má model. Podle věty o kompaktnosti
teorie T ∪ S má nějaký model K. Struktura K je model teorie T, ve kterém platí
všechny sentence γn. Je jasné, že struktura, ve které platí všechny sentence γn,
musí být nekonečná. K je tedy hledaný nekonečný model teorie T. QED
Množina sentencí S, která se vyskytla v předchozí větě, platí v libovolné struktuře
D právě tehdy, když D je nekonečná. Vedlejším produktem předchozí věty
je tedy pozorování, že vlastnost „býti nekonečnou strukturou je možné vyjádřit
množinou sentencí (bez ohledu na jazyk). Tím jsme zároveň zjistili, že komplement
nějaké elementární třídy E, tj. třída všech struktur pro daný jazyk L, které nejsou
v E, nemusí být elementární třídou.
Ukažme si ještě další příklady toho, kdy o nějaké třídě struktur lze dokázat,
že není elementární, neboli kdy o nějaké vlastnosti (struktur) lze dokázat, že není
vyjádřitelná v příslušném jazyce. Uvažujme jazyk {<} s jediným binárním predikátem
a struktury tvaru D, R , kde D je (neprázdná) množina a R je binární relace
na D. Vlastnost, že D, R je lineárně uspořádanou množinou, vyjádřit lze. Teorie,
jejímiž modely jsou právě ty struktury D, R , které jsou lineárně uspořádanými
množinami, je teorie LO, tj. teorie lineárního uspořádání deﬁnovaná v závěru oddílu
3.2. Uvažujme nyní vlastnost, že D, R je dobře uspořádanou množinou, tj.
že D, R je lineárně uspořádanou množinou, jež navíc splňuje podmínku
∀X ⊆ D(X = ∅ ⇒ ∃a ∈ X¬∃b ∈ X(b R a)), (∗)
která říká, že každá neprázdná podmnožina množiny D má R-minimální prvek.
Struktura N, < přirozených čísel s uspořádáním je příkladem dobře uspořádané
množiny. Také libovolné ordinální číslo je dobře uspořádané relací ∈ (tj. relací náležení).
Každá konečná lineárně uspořádaná množina je dobře uspořádanou množinou.
Z následující věty plyne, že podmínku (∗) nelze vyjádřit v jazyce {<}. Třída
všech dobře uspořádaných množin není elementární třídou.
Věta 3.4.3 Nechť T je teorie s jazykem L obsahujícím binární predikátový symbol
< a nechť T má nekonečný model M takový, že M, <M
je dobře uspořádaná
množina. Pak T má i model K takový, že K, <K
není dobře uspořádaná množina.
Je-li jazyk L nejvýše spočetný, pak T má i spočetný model K takový, že
K, <K
není dobře uspořádaná množina.
208 3 Predikátová logika
Důkaz Zvolme pevně nekonečný model M teorie T. Označme symbolem L jazyk
L ∪ {c0, c1, c2, . . . } vzniklý z jazyka L teorie T přidáním nekonečně mnoha
nových (tj. nevyskytujících se v L) konstant c0, c1 atd. Označme S množinu všech
sentencí v L tvaru ci < cj, kde j < i. Tvrdíme, že teorie T ∪ S má nějaký model.
Podle věty o kompaktnosti stačí ověřit, že každá konečná F ⊆ T ∪ S má model.
Postupujme podobně jako v důkazu věty 3.4.2: dokážeme, že je-li F ⊆ S konečná,
pak T ∪F má model. Tím bude ověřena silnější, a tedy také dostatečná podmínka.
Nechť konečná F ⊆ S je dána. Zvolme m takové, že pro každou sentenci ci < cj
v F platí i, j ≤ m. Máme dobře uspořádaný nekonečný model M teorie T. Hledaný
model MF teorie T ∪ F sestrojíme tak, že v M zvolíme realizace konstant ci
(a realizace symbolů jazyka L ponecháme beze změny). Ať to uděláme jakkoliv,
neporušíme platnost axiomů teorie T, protože ty neobsahují konstanty ci.
Je-li i > m, pak se konstanta ci nevyskytuje v T ∪ F, a můžeme ji tedy realizovat
libovolným prvkem nosné množiny M struktury M. Zvolme prvky a0, . . , am
struktury M tak, aby platilo a0 <M
a1 <M
. . <M
am. To lze, neboť struktura M
je nekonečná. Je-li i ≤ m, realizujme konstantu ci prvkem am−i. Tím jsme získali
strukturu MF pro jazyk L . Je-li j < i ≤ m, pak konstanta cj je v MF realizována
větším prvkem než konstanta ci. V MF tedy platí všechny sentence z F.
Podle věty o kompaktnosti tedy existuje model D teorie T ∪ S. Je-li jazyk L
nejvýše spočetný, lze díky větě 3.2.13 předpokládat, že D je nejvýše spočetný.
Prvky cD
0 , cD
1 , . . . nosné množiny D modelu D tvoří klesající řetězec, tedy množinu,
která nemá nejmenší prvek. Vraťme se k původnímu jazyku L, neboli utvořme
ze struktury D novou strukturu K pro L, která má tutéž nosnou množinu D a
v níž jsou všechny symboly jazyka L realizovány stejně jako v D. Odstraněním
konstant c0, c1, . . . nezmizely z D jejich realizace. Zmizela pouze informace, že
prvek cD
i realizuje konstantu ci. V K, což je táž množina jako D, tedy stále
existuje neprázdná část, která vůči relaci <K
(která se shoduje s relací <D
) nemá
nejmenší prvek. K je tedy model teorie T takový, že K, <K
není dobře uspořádaná
množina. QED
Konstrukcím, které se vyskytly v důkazu předchozí věty, kdy k nějaké struktuře
přidáme realizace dalších symbolů nebo naopak zrušíme realizace některých symbolů,
říkáme expanze a redukce. Přesněji, je-li D1 struktura pro L1 a D2 struktura
pro L2 a platí-li L1 ⊆ L2, řekneme, že D1 je redukt struktury D2 a D2 je expanze
struktury D1, jestliže obě struktury mají tutéž nosnou množinu a jestliže libovolný
symbol z L1 má v D1 i v D2 tutéž realizaci.
Připomeňme opět, že orientovaný graf je libovolná struktura tvaru G, R , kde
R je binární relace na neprázdné množině G. Libovolný orientovaný graf G, R
považujme za strukturu pro jazyk s jedním binárním predikátem, který zapisujeme
opět jako „R . Vrchol d grafu G, R je dosažitelný z vrcholu c, jestliže existuje
sled (nebo cesta) z c do d.
Řekneme, že orientovaný graf G, R je silně souvislý, jestliže v G, R je každý
vrchol z každého dosažitelný. Předpokládejme, že dovedeme napsat formuli ϕ(x, y)
3.4 Vlastnosti modelů a teorií 209
v jazyce {R}, která vyjadřuje, že vrchol y je dosažitelný z vrcholu x. Formule ϕ(x, y)
je tedy v libovolném grafu G, R splněna dvojicí [c, d] právě tehdy, když d je
dosažitelný z c. V tom případě sentence ∀x∀yϕ(x, y) vyjadřuje silnou souvislost
grafu, neboli platí v libovolném grafu G, R právě tehdy, když G, R je silně
souvislý. Rozmyslíme si, že to není možné. Třída všech silně souvislých grafů
není axiomatizovatelná, a tedy neexistuje formule ϕ(x, y) vyjadřující, že vrchol y je
dosažitelný z vrcholu x. Než to uděláme, uvědomme si, že potíž je v tom, že deﬁnice
dosažitelnosti vrcholu d z vrcholu c připouští libovolnou délku cesty z c do d, tj.
libovolný (konečný) počet kroků, kterými lze z c dojít do d. Kdyby počet kroků byl
omezený, snadno bychom příslušnou formuli napsali. Například d je z c dosažitelný
nejvýše dvěma kroky, jestliže dvojice [c, d] splňuje v G, R formuli
x = y ∨ R(x, y) ∨ ∃v(R(x, v) & R(v, y)).
Následující příklad je převzat z knihy [62].
Příklad 3.4.4 Dokažme, že třída všech silně souvislých orientovaných grafů není
elementární třídou. Postupujme sporem. Nechť T je teorie v jazyce {R} taková, že
libovolná struktura G, R je modelem teorie T, právě když G, R je silně souvislý
orientovaný graf. Označme ψ sentenci
∀x∀y1∀y2(R(x, y1) & R(x, y2) → y1 = y2),
která vyjadřuje, že z každého vrcholu vede nejvýše jedna hrana. Je jasné, že teorie
T, ψ má pro každé přirozené číslo n ≥ 1 model mohutnosti n, totiž model tvaru
{0, . . , n − 1} , {[0, 1], [1, 2], . . , [n − 2, n − 1], [n − 1, 0]}
sestávající z jediného cyklu. Podle věty 3.4.2 teorie T, ψ má i nějaký nekonečný
model G, R . Struktura G, R je tedy nekonečný silně souvislý graf, ve kterém
z každého vrcholu vede nejvýše jedna hrana. Zbývá zdůvodnit, že to není možné,
nekonečné cykly neexistují. Zvolme pevně dva různé prvky c a d množiny G.
Protože G, R je silně souvislý, d je dosažitelný z c a c je dosažitelný z d. V G, R
tedy existují vrcholy a0, . . , an a an+1, . . , an+m takové, že ∀i < n + m(ai R ai+1),
a přitom a0 = c, an = d a an+m = c. Posloupnost a0, . . , an+m je tedy (konečnou)
cestou z c do c délky alespoň 2. Protože graf G, R je nekonečný, lze zvolit vrchol
e ∈ G různý od všech vrcholů ai. Také e je dosažitelný z c. Existuje tedy cesta
b0, . . , bk, kde b0 = c a bk = e, z vrcholu c do vrcholu e. Cesty a0, . . , an+m a b0, . . , bk
mají společný začátek, ale různý konec. Existuje tedy poslední společný vrchol ai0
,
tj. existuje index i0 < min{n + m, k} takový, že ai0 = bi0 , ai0+1 = bi0+1. Vrchol ai0
porušuje axiom ψ, neboť z něj vycházejí dvě různé hrany.
Symbolický zápis na straně 207 označený hvězdičkou, který vyjadřuje, že nějaké
uspořádání je dobrým uspořádáním, není formulí a ve větě 3.4.3 jsme dokázali, že
vyjádřit jej pomocí formule nebo množiny formulí není možné. Lze si ale představit
zobecnění deﬁnice formule a logické sémantiky, ve kterém by se zápis (∗) stal formulí.
Stačilo by deﬁnici jazyka, struktury a realizace symbolů jazyka ponechat beze
210 3 Predikátová logika
změny, ale připustit proměnné dvojího druhu, jedny pro objekty a druhé pro podmnožiny
struktury (a psát „∀X místo „∀X ⊆ D ). Podobně podmínka vyjadřující
silnou souvislost grafu není formulí, ale stala by se formulí, kdybychom připustili
delší než konečné formule: d je dosažitelný z c, jestliže je dosažitelný jedním, nebo
dvěma, nebo třemi, nebo . . . kroky.
Logika, ve které se připouští kvantiﬁkace přes podmnožiny struktur, se nazývá
logika druhého řádu. Logika, ve které se připouštějí i delší než konečné konjunkce,
disjunkce nebo řetězce kvantiﬁkátorů, se nazývá neﬁnitní logikou. Existuje více
variant neﬁnitní logiky a existují také logiky ještě vyššího než druhého řádu. Fakt,
že třída všech dobře uspořádaných struktur nebo třída všech silně souvislých grafů
není axiomatizovatelná, se někdy vyjadřuje obratem, že dobré uspořádání nebo silná
souvislost grafu není vlastností prvního řádu. Naše kniha je věnována výhradně
logice prvního řádu. Pro stručnou úvodní informaci o logikách jiných než logika
prvního řádu doporučujeme Barwisův Úvod [5] k příručce [4].
Užití různých zobecnění logiky prvního řádu může někdy zpřehlednit a zestručnit
vyjadřování. Jejich společnou vlastností ale je, že pro ně neplatí některá
z důležitých vět (o úplnosti, o kompaktnosti, nebo Löwenheimova-Skolemova už ve
verzi 3.2.13). Zdá se tedy, že tato zobecnění neohrožují výsadní postavení logiky
prvního řádu.
Věta 3.4.5 (Löwenheimova-Skolemova) Nechť T je teorie s jazykem L, nechť
κ je nekonečný kardinál takový, že |L| ≤ κ, a nechť T má nekonečné modely. Pak
T má i modely mohutnosti κ.
Důkaz Vezměme nekonečný model M teorie T. Dále postupujeme podobně jako
v důkazu věty 3.4.2. Vezměme množinu { cα ; α < κ } nových (tj. navzájem různých
a nevyskytujících se v L) konstant. Tato množina má mohutnost κ a také
jazyk L = L∪{cα ; α < κ} má mohutnost κ. Teorii T lze považovat i za teorii v jazyce
L . Označme S množinu všech sentencí tvaru cα = cβ, kde α = β. Je-li F ⊆ S
libovolná konečná, pak T ∪ F má model: stačí model M expandovat na strukturu
pro L tak, že konstanty cα vyskytující se v F (těch je jen konečně mnoho) jsou
realizovány různými prvky modelu M a ostatní konstanty cα jsou realizovány libovolnými
prvky modelu M. Podle věty o kompaktnosti má teorie T ∪S nějaký model.
Podle věty 3.2.13 má tato teorie i model M mohutnosti nejvýše max{|L |, κ}, tj.
mohutnosti nejvýše κ. Protože v M platí všechny sentence z S, všechny nové
konstanty jsou v M realizovány navzájem různými prvky. Model M nemůže mít
mohutnost menší než κ. Tedy |M | = κ. QED
Z Löwenheimovy-Skolemovy věty plyne například to, že Th(N), teorie struktury
přirozených čísel, má i nespočetné modely, a má dokonce modely libovolné
nespočetné mohutnosti κ. Tento fakt se na první pohled může zdát paradoxní, podobně
jako představa, že Zermelova-Fraenkelova teorie množin má spočetné modely.
Uvažme ale toto. Kdybychom mohli zapsat aritmetickou sentencí, že každé číslo
má ve smyslu uspořádání pouze konečně mnoho předchůdců, pak by tato sentence
musela platit ve všech modelech teorie Th(N), a Th(N) by nemohla mít nespočetné
3.4 Vlastnosti modelů a teorií 211
modely (viz cvičení 10). Fakt, že teorie Th(N) má i nespočetné modely, je tedy
jeden z faktů, které vysvětlují, proč se nepodařilo to, co se nepodařilo (totiž zapsat
v daném jazyce určitou vlastnost struktury), a domníváme se, že nic paradoxního
na něm není.
Z Löwenheimovy-Skolemovy věty dále plyne, že třída všech struktur (pro libovolný
nejvýše spočetný jazyk) mohutnosti menší než κ, kde κ je nespočetný
kardinál, není elementární. V dalším výkladu nás ale více bude zajímat užití věty
3.4.5 v důkazech úplnosti teorií.
Řekneme, že struktury A a B pro týž jazyk L jsou elementárně ekvivalentní,
jestliže pro každou sentenci ϕ v L platí A |= ϕ ⇔ B |= ϕ. Jinými slovy, A a B jsou
elementárně ekvivalentní, jestliže se neliší platností žádné sentence. Dosud jsme
zjistili, že struktury různé mohutnosti mohou být spolu elementárně ekvivalentní.
• Existují struktury A a B téže mohutnosti, které jsou neizomorfní a přitom
elementárně ekvivalentní?
Dosavadní výsledky dovolují i na tuto otázku odpovědět kladně. Každý model
teorie tvaru Th(D) je elementárně ekvivalentní s D. Z věty 3.4.3 plyne, že jak
teorie Th( N, < ), tak teorie Th(N) mají spočetné modely, které nejsou dobře
uspořádané. A dobře uspořádaná struktura samozřejmě nemůže být izomorfní se
strukturou, která není dobře uspořádaná.
V dalším výkladu se budeme věnovat také otázce, zda daná teorie má neizomorfní
modely dané nebo dokonce každé mohutnosti.
Deﬁnice 3.4.6 Řekneme, že teorie T v jazyce L je úplná, jestliže T je bezesporná
a neexistuje žádná sentence nezávislá na T, tj. jestliže T je bezesporná a pro každou
sentenci ϕ jazyka L platí T ϕ nebo T ¬ϕ.
Příklad 3.4.7 Existují lineárně uspořádané množiny, které mají nejmenší prvek, a
existují také lineárně uspořádané množiny, které nejmenší prvek nemají. To podle
věty o korektnosti znamená, že sentence ∃x∀y¬(y < x) je sentence nezávislá na
teorii LO, a teorie LO tedy není úplná.
Příklad 3.4.8 Každá teorie tvaru Th(D), kde D je struktura pro libovolný jazyk,
je úplná. Viz 3.1.17(b).
Je důležité, že v deﬁnici úplné teorie stojí slovo „sentence . Nemělo by totiž
dobrý smysl požadovat, aby pro každou formuli ϕ platilo T ϕ nebo T ¬ϕ.
Vezměme například za ϕ formuli x = y. Pokud platí T ¬ϕ, pak (vzhledem k pravidlu
generalizace) platí i T ∀x∀y(x = y). To ale pro bezespornou teorii T není
možné. Pokud platí T ϕ, pak (opět díky generalizaci) platí i T ∀x∀y(x = y), a
tedy všechny modely teorie T jsou pouze jednoprvkové. Podmínka, že pro každou
formuli ϕ platí T ϕ nebo T ¬ϕ, je tedy splněna jen pro nezajímavé teorie T.
Poznamenejme ještě, že v deﬁnici 3.4.6 je slovo „úplnost užito v jiném smyslu,
než ve větě o úplnosti. O pojmu „úplná teorie lze říci opak toho, co jsme řekli o
212 3 Predikátová logika
větě o kompaktnosti. „Úplná teorie je syntaktický pojem, kterému rozumí každý,
kdo rozumí deﬁnici důkazu. Je to pojem nezávislý na logické sémantice a Tarského
deﬁnici.
Chceme-li ukázat, že nějaká teorie T je neúplná, je nejpřirozenější postupovat
tak, jak je naznačeno v příkladu 3.4.7: najít dva různé modely teorie T, a pak najít
sentenci, která platí jen v jednom z nich. Z dosavadního textu je jasné, že úspěch
v prvním kroku nezaručuje úspěch ve druhém kroku. Nalezneme-li neizomorfní
modely M1 a M2, může se stát, že M1 a M2 jsou elementárně ekvivalentní, a
neliší se tedy platností žádné sentence. Jinak řečeno, nedaří-li se nalézt sentenci
nezávislou na teorii T, je naděje, že T je úplná, a to i v případě, kdy víme o existenci
různých (sobě nepodobných) modelů teorie T.
0
q E q E q E q E · · · )
( · · · E q E q E q E q E q E q E · · · )
Obrázek 3.4.1: Model N, 0, s + Z, s teorie SUCC
V závěru oddílu 3.2 jsme deﬁnovali teorii SUCC, teorii následníka, formulovanou
v jazyce {0, S}. Její axiomy jsme vypozorovali ze struktury N, 0, s přirozených čísel
s nulou a s následnickou funkcí. Snadno lze ověřit, že teorie SUCC má i jiné
modely než N, 0, s . Jeden z nich je na obrázku 3.4.1. Jeho nosná množina je
disjunktním sjednocením množiny všech přirozených čísel a množiny všech celých
čísel. Symbol S je realizován „normálně , přičítáním jedničky v obou částech modelu,
symbol 0 je realizován přirozenou (nikoliv celočíselnou) nulou. Mělo by být
zřejmé, že tato struktura je opravdu modelem teorie SUCC a že není izomorfní se
strukturou N, 0, s . Žádný izomorﬁsmus totiž nemůže zobrazit objekt, který je
z nuly dosažitelný konečně mnoha skoky následnické funkce, na objekt, který tuto
vlastnost nemá.
Do podobné situace lze dospět, budeme-li uvažovat o struktuře N, < a domyslíme-li
trochu dále to, co bylo řečeno v příkladu 3.4.7. Nejenže celá struktura
má nejmenší prvek, ale také ke každému prvku x existuje nejmenší mezi většími.
A dále, ke každému prvku x existuje největší mezi prvky menšími než x, pokud
ovšem existují nějaké prvky menší než x. Deﬁnujme tedy teorii DO (discrete order)
diskrétního uspořádání jako teorii s jazykem {<}, jejímiž axiomy jsou axiomy
teorie LO a dále následující tři axiomy:
DO1: ∃x∀y¬(y < x),
DO2: ∀x∃y(x < y & ¬∃v(x < v & v < y)),
DO3: ∀x∀y(y < x → ∃z(z < x & ¬∃v(z < v & v < x))).
Také teorie DO má i jiné modely, než je „preferovaný model N, < . Jeden z nich
je na obrázku 3.4.2. Také tento model je disjunktním sjednocením dvou struktur.
3.4 Vlastnosti modelů a teorií 213
q E q E q E q E · · · ) E ( · · · E q E q E q E q E · · · )
Obrázek 3.4.2: Model N, < + Z, < teorie DO
Šipky tentokrát neoznačují následnickou funkci, ale uspořádání. Neznázornili jsme
spoustu „samozřejmých šipek, totiž ty, jejichž existence plyne z faktu, že uspořádání
je tranzitivní. Delší šipkou mezi „oblastmi N, < a Z, < je znázorněno, že
všechny objekty z oblasti N, < jsou menší než všechny objekty z oblasti Z, < .
Toto je důležitý rozdíl mezi modely teorií SUCC a DO. Na obrázku 3.4.2 jsou oblasti
N, < a Z, < „za sebou , na obrázku 3.4.1 jsou „vedle sebe , neboť mezi oblastmi
N, 0, s a Z, s není žádná „vazba .
V závěru oddílu 3.2 jsme také deﬁnovali teorii DNO hustého lineárního uspořádání
bez minima a maxima. O modelech teorie DNO se brzy zmíníme. Společnou
vlastností všech tří teorií SUCC, DO a DNO je to, že pro žádnou z nich nejsme
schopni podat příklad nezávislé sentence. Všechny tři tedy pokládejme za kandidáty
na úplnou teorii.
Deﬁnice 3.4.9 Nechť κ je nekonečný kardinál. Řekneme, že teorie T je κ-kategorická,
jestliže každé dva modely teorie T mohutnosti κ jsou spolu izomorfní.
Příklad 3.4.10 Každá ze struktur R − {0}, < (všech nenulových reálných čísel
s uspořádáním) a R, < (všech reálných čísel s uspořádáním) je modelem
teorie DNO. V první z nich neplatí a v druhé naopak platí věta o supremu.
Tyto struktury tedy nejsou spolu izomorfní. Obě ale mají stejnou mohutnost 2ℵ0
.
Teorie DNO tedy není 2ℵ0
-kategorická. Fakt, že struktury R − {0}, < a R, <
nejsou izomorfní, zdůvodníme pro jistotu podrobněji. Postupujme sporem. Nechť
f : (R − {0}) → R je izomorﬁsmus obou struktur, tedy vzájemně jednoznačná
funkce, která zachovává uspořádání. Vezměme množiny A = { f(x) ; x < 0 }
a B = { f(x) ; x > 0 }. Je-li y1 ∈ A a y2 ∈ B, pak y1 = f(x1) pro jisté x1 < 0
a y2 = f(x2) pro jisté x2 > 0. Protože f zachovává uspořádání, platí y1 < y2.
Tím jsme ověřili, že libovolný prvek množiny A je menší než libovolný prvek množiny
B. Množina A nemá maximum, protože když y ∈ A, y = f(x) a x < 0,
pak x < x
2 < 0, a tedy f(x
2 ) je prvek množiny A větší než y. Z analogického důvodu
B nemá minimum. Tím jsme dospěli ke sporu: z věty o supremu plyne, že
jsou-li A a B neprázdné navzájem komplementární množiny reálných čísel takové,
že všechny prvky množiny A jsou menší než všechny prvky množiny B, pak A má
maximum nebo B má minimum.
Příklad 3.4.11 Nechť L je prázdný jazyk (tedy všechny formule jazyka L jsou sestaveny
z atomických formulí tvaru x = y). Pak struktura pro L je plně určena svou
nosnou množinou. Je-li f libovolná vzájemně jednoznačná funkce z množiny D1
na množinu D2, pak f je automaticky izomorﬁsmus, protože f zachovává realizace
všech symbolů jazyka L. Pokud D1 a D2 mají stejnou mohutnost, pak vzájemně
214 3 Predikátová logika
jednoznačná funkce z D1 na D2 existuje. Tím je ověřeno, že libovolná teorie T
s prázdným jazykem je κ-kategorická pro každý nekonečný kardinál κ.
Příklad 3.4.12 Rozmysleme si, že teorie DNO je ℵ0-kategorická. Nechť A, <1
a B, <2 jsou libovolné dva její spočetné modely. Očíslujme jejich nosné množiny:
A = {a0, a1, a2, . . . }, B = {b0, b1, b2, . . . }. Izomorﬁsmus f : A → B obou struktur
sestrojíme jako sjednocení spočetně mnoha konečných funkcí f0 ⊆ f1 ⊆ . . .
Posloupnost { fn ; n ∈ N } konstruujme rekurzí. Položme f0 = ∅. V kroku 2n
máme konečné množiny C ⊆ A a D ⊆ B a prostou funkci f2n z C na D. Přitom
platí {a0, . . , an−1} ⊆ C, {b0, . . , bn−1} ⊆ D a pro libovolná c1, c2 ∈ C platí
f2n(c1) <2 f2n(c2), právě když c1 <1 c2. Uvažujme o an. Pokud an ∈ C, neděláme
nic a položíme f2n+1 = f2n. Pokud an /∈ C, určíme polohu prvku an vůči prvkům
množiny C. Když an je větší než všechny, zvolíme za jeho obraz libovolný prvek b
množiny B větší než všechny prvky množiny D. To lze, žádný prvek množiny D není
maximální v B, protože struktura B, <2 žádné maximum nemá. Podobně postupujeme,
když an je menší než všechny prvky množiny C. Zbývá případ, kdy některé
prvky množiny C jsou menší a některé větší než an. Tehdy označme c1 největší
z oněch menších a c2 nejmenší z oněch větších. Platí tedy c1 <1 an <1 c2. Zvolme b
libovolně tak, aby platilo f2n(c1) <2 b <2 f2n(c2). To lze, interval (f2n(c1), f2n(c2))
je neprázdný, protože B, <2 je hustě uspořádaná množina. Nakonec položme
f2n+1 = f2n ∪ {[an, b]}. Zcela analogicky postupujme v kroku 2n + 1: není-li bn
v D, zvolíme a ∈ A tak, aby funkce f2n+2 = f2n+1 ∪ {[a, bn]} neporušovala uspořá-
dání.
Příklad 3.4.13 Z komentáře k obrázku 3.4.1 je jasné, že teorie SUCC není ℵ0-kategorická.
Udělejme si lepší představu, jak vypadají její modely. Nechť D = D, e, f
je libovolný model teorie SUCC. Tedy e ∈ D a f : D → D. Z platnosti axiomů
plyne, že f je prostá funkce a pro její obor hodnot platí Rng(f) = D − {e}. Deﬁnujme
na D relaci ∼ takto: a ∼ b, jestliže některý prvek dvojice {a, b} je z druhého
dosažitelný konečně mnoha skoky funkce f. Relace ∼ je ekvivalence (cvičení: jak
toto plyne z platnosti axiomů teorie SUCC v D?) a každá třída rozkladu je nekonečná
(cvičení: jak toto plyne . . . ). Třída rozkladu obsahující e je izomorfní se
strukturou N, 0, s , každá jiná třída rozkladu je izomorfní se strukturou Z, s . Jiné
třídy ovšem nemusí existovat. Pokud ale celá množina D má nespočetnou mohutnost
κ, třídy izomorfní se Z, s existovat musí a musí jich být κ. Sjednocení méně
než κ spočetných množin má totiž mohutnost menší než κ a sjednocení více než κ
disjunktních neprázdných množin má naopak mohutnost větší než κ. Model D
mohutnosti κ má tedy jedinou možnou podobu: κ kopií struktury Z, s plus jedna
kopie struktury N, 0, s . Tím jsme dokázali, že teorie SUCC je κ-kategorická pro
každý nespočetný kardinál κ.
Příklad 3.4.14 Rozmysleme si, že podobně lze charakterizovat také modely teorie
DO. Nechť D = D, < je libovolný model teorie DO. Deﬁnujme na množině D
relaci podobnou jako v příkladu 3.4.13: a ∼ b, jestliže mezi a a b je v D jen
konečně mnoho prvků. Opět platí, že relace ∼ je ekvivalence a že každá třída
3.4 Vlastnosti modelů a teorií 215
rozkladu je nekonečná. Podobně jako v příkladu 3.4.13 je jedna z tříd rozkladu izomorfní
se strukturou N, < a všechny ostatní jsou izomorfní se strukturou Z, < .
Na rozdíl od příkladu 3.4.13 nyní ale nemůžeme tvrdit, že různé modely se liší
pouze počtem tříd izomorfních se Z, < . Záleží totiž také na tom, jaké podmínky
tvaru a < b platí pro a a b z různých tříd rozkladu. Označme [a] třídu
rozkladu obsahující prvek a a deﬁnujme relaci R na faktorové množině D/∼ předpisem
[a] R [b] ⇔ a < b & ¬(a ∼ b). Struktura D/∼, R je lineárně uspořádaná
množina, která má nejmenší prvek. Model D tedy vypadá takto: na začátku je
oblast izomorfní se strukturou N, < , pak následuje blíže neurčený počet oblastí
izomorfních se strukturou Z, < , které jsou nějak lineárně uspořádány. Jinými
slovy, každý model teorie DO vznikl z nějaké lineárně uspořádané struktury M, R
s nejmenším prvkem tak, že nejmenší prvek byl nahrazen oblastí izomorfní s N, < ,
každý z ostatních prvků byl nahrazen oblastí izomorfní se Z, < , přičemž uspořádání
uvnitř oblastí zůstalo zachováno, a uspořádání mezi prvky různých oblastí
určila relace R. Domluvme se, že bude-li se to hodit, uspořádané struktury budeme
značit malými řeckými písmeny. Jsou-li γ a λ uspořádané množiny, pak γ +λ
je jejich disjunktní sjednocení (tj. struktura sestávající ze dvou oblastí, z nichž jedna
je izomorfní s γ a všechny její prvky jsou menší než všechny prvky druhé oblasti,
která je izomorfní s λ). Součinem γ · λ značíme strukturu vzniklou nahrazením
každého prvku struktury λ kopií struktury γ. Označme ještě λ∗
strukturu vzniklou
z λ obrácením všech šipek a označme ω strukturu N, < . Na obrázku 3.4.2 je
tedy struktura ω + ω∗
+ ω. V tomto příkladu jsme si rozmysleli, že každý model
teorie DO je ω, nebo je tvaru ω + (ω∗
+ ω) · λ, kde λ je nějaká lineárně uspořádaná
množina. Na druhé straně každá struktura tvaru ω + (ω∗
+ ω) · λ je modelem teorie
DO. Uvážíme-li ještě, že modely tvaru ω + (ω∗
+ ω) · λ1 a ω + (ω∗
+ ω) · λ2 jsou
izomorfní pouze v případě, kdy λ1 a λ2 jsou izomorfní (cvičení), a že pro každý nekonečný
kardinál κ existují neizomorfní lineárně uspořádané množiny mohutnosti κ
(cvičení), dokázali jsme, že teorie DO není κ-kategorická pro žádný nekonečný kardinál
κ.
To, že v žádném z našich příkladů není uvedena teorie, která by byla κ-kategorická
jen pro některý nespočetný kardinál κ, není náhoda. M. Morley dokázal, že
je-li T teorie s nejvýše spočetným jazykem, která je κ-kategorická pro některý nespočetný
kardinál κ, pak T je κ-kategorická pro každý nespočetný kardinál κ. Morleyova
věta tedy pro teorii T se spočetným jazykem připouští pouze čtyři možnosti:
(i) T není κ-kategorická pro žádný nekonečný kardinál κ, (ii) T je ℵ0-kategorická,
ale není κ-kategorická pro žádný nespočetný kardinál κ, (iii) T není ℵ0-kategorická,
je ale κ-kategorická pro každý nespočetný kardinál κ, (iv) T je κ-kategorická pro
každý nekonečný kardinál κ. Důkaz Morleyovy věty je (prý) dost obtížný. V dalším
výkladu ji ale nebudeme potřebovat.
Věta 3.4.15 (Vaughtova) Nechť T je bezesporná teorie v jazyce L, která nemá
žádné konečné modely, nechť κ je nekonečný kardinál takový, že |L| ≤ κ a T je
κ-kategorická. Pak T je úplná.
216 3 Predikátová logika
Důkaz Nechť T není úplná. Existuje tedy sentence ϕ taková, že T ϕ a T ¬ϕ.
Podle lemmatu 3.2.7(d) jsou obě teorie T, ϕ a T, ¬ϕ bezesporné. Každá z nich
má tedy nějaký model, a to nekonečný model, protože T nemá konečné modely.
Díky Löwenheimově-Skolemově větě 3.4.5 má každá z nich i model mohutnosti κ.
Nechť tedy M1 a M2 jsou struktury pro L mohutnosti κ takové, že M1 |= T, ϕ
a M2 |= T, ¬ϕ. Je jasné, a také to plyne z lemmatu 3.2.11(b), že struktury M1 a M2
nejsou izomorfní, neboť se liší platností sentence ϕ. Struktury M1 a M2 jsou tedy
dvěma neizomorfními modely teorie T mohutnosti κ. To je spor s předpokladem,
že T je κ-kategorická. QED
Dříve jsme zjistili, že teorie DNO je ℵ0-kategorická a že teorie SUCC je κ-kategorická
pro každý nespočetný kardinál κ. Podle Vaughtovy věty jsou tedy obě teorie
úplné. To má zajímavé důsledky i pro toho, kdo uvažuje raději o strukturách než
o teoriích. Například struktury R, < , R − {0}, < a R − Q, < jsou modely téže
úplné teorie, totiž DNO, a neliší se tedy platností žádné sentence. Jinak řečeno,
jsou elementárně ekvivalentní. Také struktura z obrázku 3.4.1 je elementárně ekvivalentní
se strukturou N, 0, s . Model N, 0, s + Z, s tedy nelze zakázat přidáním
dalších axiomů k teorii SUCC. Každá teorie tvaru SUCC ∪ {ϕ}, kde ϕ je sentence
v jazyce {0, S}, má totiž buď tytéž modely jako teorie SUCC, nebo nemá žádné
modely (podle toho, platí-li SUCC ϕ nebo SUCC ¬ϕ).
Tím se nám podařilo odpovědět na zbývající otázky 3 a 4 ze závěru oddílu 3.1.
Ne, neizomorfní a sobě nepodobné struktury D1 a D2 se nemusí lišit platností
žádné sentence, a ano, může se stát, že všechny sentence platné v nějaké struktuře
vyplývají z nějaké přehledné množiny předpokladů.
Nyní je také lépe vidět, proč jsme věty o úplnosti a kompaktnosti (v této kapitole
a již dříve v kapitole 1) formulovali pro libovolné jazyky. Nebylo to ani tak ve snaze
o co nejobecnější výsledky, ale proto, že úvahy o nespočetných modelech a nekonečných
nebo (v důkazu věty 3.4.5) dokonce nespočetných jazycích mají důsledky i
pro teorie „ze života , které většinou mají konečný jazyk a konečně mnoho axiomů
nebo axiomatických schémat. Teorie s nespočetnými jazyky tedy nepokládáme za
důležitý předmět zkoumání, ale spíš za důležitý nástroj, který může pomoci zjistit
něco i o těch teoriích, které nás zajímají především. Za obzvláště zajímavé pokládáme
ty situace, kdy ověření nějaké abstraktní podmínky (například že formule ϕ
platí ve všech modelech teorie T, nebo že každé dva modely téže mohutnosti κ jsou
spolu izomorfní) má za následek existenci nějakého konkrétního objektu, který lze
zapsat pomocí konečně mnoha symbolů (například určitého důkazu).
Ve zbytku tohoto oddílu ukážeme ještě další sémantické metody a konstrukce.
Na začátku oddílu jsme uvažovali otázku, zda daná třída struktur je axiomatizovatelná.
V dalším budeme řešit podrobnější otázku: je daná třída axiomatizovatelná
pomocí nějaké množiny sentencí, které jsou syntakticky jednoduché v tom smyslu,
že se v nich nestřídá příliš mnoho kvantiﬁkátorů? Také otázka, zda teorie DO je
úplná, zůstává zatím nezodpovězená. Nejprve ale ukážeme, že Hilbertova-Ackermannova
věta, kterou jsme již dokázali důkazově teoreticky v oddílu 3.3, má i
celkem snadný sémantický důkaz.
3.4 Vlastnosti modelů a teorií 217
V oddílu 3.2 jsme deﬁnovali homomorﬁsmus struktur A a B jako funkci f z A
do B, která zachovává všechny funkční i predikátové symboly. Podmínku, že f
zachovává rovnítko, lze zapsat ekvivalencí
∀a∀b(A |= (x = y)[a, b] ⇔ B |= (x = y)[f(a), f(b)]).
Protože v predikátové logice s rovností je rovnítko realizováno rovností (v A i v B),
lze tuto podmínku přepsat na
∀a∀b(a = b ⇔ f(a) = f(b)).
Funkce f tedy zachovává symbol „= , právě když je prostá. V predikátové logice
s rovností (ve které se rovnítko považuje za logický symbol) tedy deﬁnujeme homomorﬁsmus
struktur A a B pro jazyk L jako prostou funkci z A do B, která
zachovává všechny (mimologické) symboly jazyka L. Lemma 3.2.11(a) se vztahuje
i na predikátovou logiku s rovností: každý homomorﬁsmus automaticky zachovává
všechny otevřené formule. Místo homomorﬁsmus struktur A a B budeme nadále
říkat vnoření struktury A do struktury B.
Jsou-li A a B struktury pro týž jazyk L a je-li f vnoření struktury A do struktury
B, pak f je zároveň izomorﬁsmus struktury A a jisté podstruktury struktury
B, neboli struktura B je rozšířením jisté struktury izomorfní se strukturou A.
Naopak, je-li A podstruktura struktury B, pak identická funkce (z A do B) je
vnoření struktury A do struktury B. Z toho je vidět, že pojem vnoření je vzájemně
zaměnitelný s dvojicí pojmů podstruktura (případně rozšíření struktury) a
izomorﬁsmus. Pokud A je podstruktura struktury B a identická funkce z A do B
zachovává formuli ϕ, řekneme, že ϕ je absolutní (pro podstrukturu A struktury B).
Otevřené formule jsou vždy absolutní. Tím jsme znovu vyřešili cvičení 20(a) oddílu
3.1.
Věta 3.4.16 (Hilbertova-Ackermannova) Nechť ϕ(v, x1, . . , xk) je otevřená
formule v jazyce L taková, že formule ∃vϕ(v, x) je logicky platná. Pak existují
termy t1(x), . . , tn(x) v jazyce L takové, že disjunkce ϕ(t1(x), x) ∨ . . ∨ ϕ(tn(x), x)
je logicky platná.
Důkaz Předpokládejme, že formule
n
i=1 ϕ(ti(x), x) není pro žádnou n-tici termů
t1(x), . . , tn(x) logicky platná, tj. že pro každou n-tici t1(x), . . , tn(x) existuje struktura
D a ohodnocení e, které formuli ¬ϕ(t1(x), x) & . . & ¬ϕ(tn(x), x) splňuje ve
struktuře D. Přidejme k jazyku L nové konstanty c1, . . , ck a deﬁnujme teorii T
jako množinu všech sentencí v L ∪ {c1, . . , ck} tvaru ¬ϕ(t(c1, . . , ck), c1, . . , ck), kde
t je term v L neobsahující jiné volné proměnné než x1, . . , xk. Je jasné, že každá
konečná množina F ⊆ T má model. Podle věty o kompaktnosti existuje tedy struktura
B pro jazyk L ∪ {c1, . . , ck}, která je modelem teorie T. Vezměme za A podstrukturu
struktury B generovanou prvky cB
1 , . . , cB
k , tj. podstrukturu sestávající ze
všech prvků množiny B tvaru (t(c1, . . , ck))B
. Protože formule ∃vϕ(v, x) je logicky
platná, ke každé k-tici prvků libovolné struktury D existuje prvek b ∈ D takový,
218 3 Predikátová logika
že D |= ϕ[b, a]. Zvolme za D strukturu A a za a1, . . , ak její prvky cB
1 , . . , cB
k . Pro
některý z prvků (t(c))B
struktury A tedy platí A |= ϕ[(t(c))B
, cB
1 , . . , cB
k ]. Protože
otevřené formule jsou absolutní, platí i B |= ϕ[(t(c))B
, cB
1 , . . , cB
k ]. Užít hodnotu
uzavřeného termu jako ohodnocení nějaké proměnné je podle lemmatu 3.1.14(b)
totéž, jako substituovat onen term za onu proměnnou. Tedy B |= ϕ(t(c), c). To
je spor, protože B |= T, a přitom sentence ¬ϕ(t(c), c) je jeden z axiomů teorie T.
QED
Zvolme pevně jazyk L a deﬁnujme množiny formulí Un a En jazyka L. Množina
Un je množina všech formulí tvaru
∀v1,1 . . ∀v1,r1 ∃v2,1 . . ∃v2,r2 ∀v3,1 . . . . vn,rn ϕ,
kde ϕ je otevřená formule. Kvantiﬁkátory u proměnných vn,1 až vn,rn jsou všechny
existenční nebo všechny univerzální podle toho, zda n je sudé nebo liché. Každá
formule v Un je tedy formule v prenexním tvaru, jejíž kvantiﬁkátory lze rozdělit
do nejvýše n souvislých bloků obsahujících kvantiﬁkátory stejného druhu. Velikost
bloků určují čísla r1, . . , rn. Každé z nich může být rovno nule. U0 je množina všech
otevřených formulí. Množina Un+1 sestává ze všech otevřených formulí a dále ze
všech prenexních formulí, v jejichž kvantiﬁkátorovém preﬁxu je nejvýše n „střídání
kvantiﬁkátorů, a je-li jich přesně n, pak první kvantiﬁkátor musí být univerzální
(je-li jich méně, můžeme si myslet, že na začátku je několik bloků nulové délky).
Množinu formulí En deﬁnujme duálně jako množinu všech formulí tvaru
∃v1,1 . . ∃v1,r1 ∀v2,1 . . ∀v2,r2 ∃v3,1 . . . . vn,rn ϕ,
kde ϕ je otevřená formule. Formule v U1 a E1 jsou tedy tytéž, kterým se v oddílu 3.2
říkalo univerzální resp. existenční formule. Platí Un ∪ En ⊆ Un+1 ∩ En+1 pro
každé n. Formulím v U2 se někdy říká induktivní formule.
Řekneme, že vnoření f struktury A do struktury B je n-elementární, jestliže
f zachovává všechny Un-formule. Vnoření f je elementární, jestliže f zachovává
všechny formule. Podstruktura A struktury B je n-elementární nebo elementární,
jestliže identická funkce z A do B je n-elementární resp. elementární vnoření, tj.
jestliže všechny formule v Un resp. vůbec všechny formule jsou absolutní pro A a B.
Pišme f : A →n B nebo f : A →e B, jestliže f je n-elementární resp. elementární
vnoření A do B, a pišme A n B nebo A B, jestliže A je n-elementární resp.
elementární podstruktura struktury B.
Lemma 3.4.17 (a) Každé vnoření je 0-elementární.
(b) Vnoření f struktury A do struktury B je n-elementární, právě když f zachovává
všechny En-formule.
(c) Platí-li f : A →n B, pak pro každou formuli ϕ(x1, . . , xk) v Un+1, každou
formuli ψ(x1, . . , xk) v En+1 a každou k-tici a1, . . , ak prvků z A platí implikace
A |= ψ[a] ⇒ B |= ψ[f(a1), . . , f(ak)] a B |= ϕ[f(a1), . . , f(ak)] ⇒ A |= ϕ[a].
(d) Když vnoření f struktury A do struktury B je n-elementární pro každé n, pak
f : A →e B.
3.4 Vlastnosti modelů a teorií 219
(e) Když existuje f takové, že f : A →e B, pak A a B jsou elementárně ekviva-
lentní.
(f) Když f : A →n B a g : B →n C, pak g ◦ f : A →n C.
Důkaz Když vnoření f zachovává formuli ϕ(x1, . . , xk), pak f zachovává i její
negaci ¬ϕ(x1, . . , xk). Když ϕ je v Un nebo v En, pak ¬ϕ je ekvivalentní s formulí
v En resp. v Un. Tím je zdůvodněno (b). Tvrzení (d) plyne z toho, že každá
formule je ekvivalentní s prenexní formulí a každá prenexní formule je v některé
z množin Un. V deﬁnici toho, že f zachovává formuli ϕ(x1, . . , xk), má smysl i
případ k = 0. Když f zachovává všechny formule, pak f zachovává i všechny
sentence. Odtud plyne (e). QED
Příklad 3.4.18 Struktura Q racionálních čísel není 1-elementární podstrukturou
struktury R reálných čísel, protože číslo 2 ve struktuře Q splňuje a ve struktuře R
nesplňuje formuli ∀v(v2
= x).














| | | | | )
b2 a2 b1 b3
| | | )
b2 a2
| |(
b1 b3
|
| | | )
a1 b4
| | | )
a1 b4
Obrázek 3.4.3: 1-elementární podstruktura
Příklad 3.4.19 Vezměme jazyk {<} a za B vezměme strukturu ω+ω∗
+ω. Struktura
B je disjunktním sjednocením tří struktur. Říkejme jim levá, prostřední a
pravá část struktury B. Vezměme za A strukturu ω + ω vzniklou z B vynecháním
prostřední části. Pak A není 2-elementární podstrukturou struktury B, protože
nejmenší prvek pravé části splňuje v A formuli ∀u(u < x → ∃v(u < v & v < x))
(která je ekvivalentní s U2-formulí), ale v B ji nesplňuje. Rozmyslíme si, že A
je 1-elementární podstruktura struktury B. Podle lemmatu 3.4.17(b) stačí ověřit,
že každá E1-formule je absolutní. Nechť je tedy dána E1-formule ϕ(x) tvaru
∃v1 . . ∃vrψ(v1, . . , vr, x1, . . , xk), kde ψ je otevřená. Máme ověřit, že pro libovolnou
k-tici a1, . . , ak prvků z A platí ekvivalence A |= ϕ[a] ⇔ B |= ϕ[a]. Implikace ⇒
je jasná z 3.4.17(c). Nechť B |= (∃vψ)[a] a nechť b1, . . , br jsou prvky z B, pro
které platí B |= ψ[b, a]. Další postup je pro k = 2 a r = 4 znázorněn na obrázku
3.4.3. Ke každému bi lze zvolit bi ∈ A tak, aby nedošlo ke křížení přerušovaných
čar. Je-li bi ∈ A, stačí volit bi = bi, ostatní bi zvolíme jako dost velké prvky
levé části struktury B. Nekřížení čar znamená, že (r + k)-tice [b1, . . , br, a1, . . , ak]
a [b1, . . , br, a1, . . , ak] splňují stejné atomické formule, a tedy také stejné otevřené
formule. Tedy A |= ψ[b , a] a A |= ϕ[a].
220 3 Predikátová logika
Příklad 3.4.20 Nechť M je libovolná struktura pro aritmetický jazyk, která je
modelem teorie Th(N). Tedy M a N jsou elementárně ekvivalentní. Deﬁnujme
funkci f předpisem n → nM
. Je zřejmé, že f je prostá funkce z množiny N všech
přirozených čísel do nosné množiny M struktury M. Nechť ϕ(x1, . . , xk) je libovolná
aritmetická formule. Pak N |= ϕ[n1, . . , nk] je ekvivalentní s N |= ϕ(n1, . . , nk)
(protože hodnotou numerálu ni ve struktuře N je číslo ni), a M |= ϕ[n1
M
, . . , nk
M
]
je ekvivalentní s M |= ϕ(n1, . . , nk). Sentence ϕ(n1, . . , nk) nemůže platit jen v jedné
ze struktur N a M. Tím je zdůvodněno, že strukturu N lze elementárně vnořit do
každého modelu M teorie Th(N).
Úvahu v předchozím příkladu lze zobecnit. Je-li ve struktuře A každý prvek
hodnotou nějakého uzavřeného termu, pak strukturu A lze elementárně vnořit do
jakékoliv struktury B pro týž jazyk, pokud platí B |= Th(A). A spokojíme-li se
s vnořením, které není elementární, pak stačí, aby v B platily všechny otevřené
(nebo, což je totéž, všechny atomické) sentence platné v A. Není-li splněna podmínka,
že každý prvek struktury A je hodnotou uzavřeného termu, můžeme ji splnit
postupem, který jsme v tomto oddílu užili již několikrát: dočasně rozšíříme jazyk
přidáním nových konstant.
Nechť A je struktura pro jazyk L. Přiřaďme každému prvku a ∈ A konstantu
a tak, aby všechny takto přiřazené konstanty byly navzájem různé a různé od
všech konstant jazyka L. Označme LA rozšíření jazyka L o všechny konstanty a,
kde a ∈ A. Označme A „přirozenou expanzi struktury A pro jazyk LA, která
vznikne z A tak, že každý prvek a prohlásíme za realizaci konstanty a. Deﬁnujme
Diagn(A) a Diage(A) jako množinu všech Un-sentencí resp. množinu všech sentencí
jazyka LA, které platí ve struktuře A . Množinám Diagn(A) a Diage(A) říkáme
n-elementární diagram resp. elementární diagram struktury A. 0-elementárnímu
diagramu se říká prostě diagram a místo Diag0(A) se píše jen Diag(A). Označme
ještě Thmn(T) množinu všech Un-sentencí dokazatelných v T.
Věta 3.4.21 Nechť L je jazyk, A je struktura pro L a T je teorie v jazyce L.
Pak A |= Thmn+1(T), právě když existuje model B teorie T a funkce g taková,
že g : A →n B.
Důkaz Nechť g : A →n B a B |= T. Platí B |= Thmn+1(T). Pokud g zachovává
všechny Un- a En-formule, pak platnost Un+1-formulí se dle lemmatu 3.4.17(c)
přenáší směrem „dolů . Tedy A |= Thmn+1(T). Tím je zdůvodněna implikace ⇐.
Nechť B je libovolný model teorie T ∪ Diagn(A) (v jazyce LA). Označme g funkci
a → aB
a označme B redukt struktury B pro jazyk L. Podobně jako v příkladu
3.4.20, je-li ϕ(x1, . . , xk) libovolná formule v Un a jsou-li a1, . . , ak prvky
množiny A, pak podmínky A |= ϕ[a], A |= ϕ(a1, . . , ak), B |= ϕ(a1, . . , ak)
a B |= ϕ[g(a1), . . , g(ak)] jsou ekvivalentní. B je tedy model teorie T a g je n-elementární
vnoření.
Zbývá tedy zdůvodnit, že platí-li A |= Thmn+1(T), pak teorie T ∪ Diagn(A)
má nějaký model. Nechť jej nemá. Pak podle věty o silné úplnosti existují sentence
ϕ1, . . , ϕm v LA takové, že {ϕ1, . . , ϕm} ⊆ Diagn(A) a T ¬(ϕ1 & . . & ϕm).
3.4 Vlastnosti modelů a teorií 221
Vezměme důkaz P sentence ¬ ϕi, utvořme seznam a1, . . , ak konstant z LA − L,
které se v něm vyskytují, a nahraďme v důkazu P konstanty a1, . . , ak navzájem
různými proměnnými x1, . . , xk nevyskytujícími se v P. Výsledek P této
záměny je opět důkazem, a to důkazem z množiny předpokladů T, protože v axiomech
teorie T se konstanty ai nevyskytují. Každou sentenci ϕi můžeme psát ve
tvaru αi(a1, . . , ak), kde αi je Un-formule v jazyce L. Důkaz P je tedy důkazem formule
¬ αi(x). Platí také (díky generalizaci) T ∀x¬ αi(x) a T ¬∃x αi(x).
Sentence ¬∃x αi(x) je ekvivalentní s Un+1-sentencí dokazatelnou v T. Protože
A |= Thmn+1(T), máme A |= ¬∃x αi(x). Avšak protože prvky a1, . . , ak realizují
konstanty a1, . . , ak a každá sentence αi(a1, . . , ak) (tj. sentence ϕi) je v Diagn(A),
k-tice [a1, . . , ak] splňuje v A formuli αi(x). Tedy A |= ∃x αi(x), spor. QED
Věta 3.4.22 (Lo´sova-Tarského) Teorie T je ekvivalentní s teorií, jejíž všechny
axiomy jsou univerzální sentence, právě když každá podstruktura libovolného modelu
teorie T je opět modelem teorie T.
Důkaz Nechť T je ekvivalentní s T , všechny axiomy teorie T jsou v množině U1
a přitom A 0 B |= T. Pak A |= T vzhledem k tvrzení 3.4.17(c). Nechť naopak
T je teorie taková, že kdykoliv A 0 B |= T, pak A |= T. Vezměme za T
množinu Thm1(T). K ověření, že T a T jsou ekvivalentní, stačí zdůvodnit, že
každý model teorie T je zároveň modelem teorie T. Nechť tedy A |= T , tj.
A |= Thm1(T). Dle věty 3.4.21 lze strukturu A vnořit do jistého modelu teorie T.
Lze také říci, že strukturu A lze ztotožnit s podstrukturou jistého modelu B |= T.
Takže A 0 B |= T. Dle předpokladu platí A |= T. QED
Lemma 3.4.23 Nechť A a B jsou struktury pro jazyk L a nechť f : A →1 B. Pak
existuje struktura C pro L a vnoření g : B →0 C takové, že g ◦ f je elementární
vnoření struktury A do struktury C.
Důkaz Vezměme opět rozšíření jazyka L o konstanty a příslušné prvkům a ∈ A.
Ve struktuře A realizujme každou konstantu a „přirozeně , tj. prvkem a, a ve
struktuře B realizujme každou a prvkem f(a). Tím jsme získali expanze A a B
struktur A a B pro jazyk LA. Funkce f je 1-elementární vnoření struktury A
do struktury B . Tedy B |= Diag1(A). Platí Thm1(Diage(A)) = Diag1(A).
Podle věty 3.4.21 existuje struktura C pro jazyk LA taková, že C |= Diage(A),
a vnoření g : B →0 C . Označme C redukt struktury C pro jazyk L. Je-li
ψ(x1, . . , xk) libovolná formule v L a a1, . . , ak libovolná k-tice prvků z A, pak podmínky
A |= ψ[a], A |= ψ(a1, . . , ak) a (protože C |= Diage(A)) C |= ψ(a1, . . , ak)
jsou ekvivalentní. Protože funkce g je vnořením, musí realizaci libovolné konstanty
v B zobrazit na realizaci téže konstanty v C . Tedy g(f(ai)) je realizace konstanty
ai v C , takže C |= ψ(a1, . . , ak) a C |= ψ[g(f(a1)), . . , g(f(ak))] jsou ekvivalentní
podmínky. Tedy g ◦ f je elementární vnoření. QED
Posloupnost A0, A1, A2, . . . struktur pro jazyk L je řetěz, jestliže pro každé i
platí Ai 0 Ai+1, tj. jestliže každá struktura Ai je podstrukturou struktury Ai+1.
222 3 Predikátová logika
Řetěz { Ai ; i ∈ N } je elementární, jestliže pro každé i platí Ai Ai+1. Limitu
řetězu { Ai ; i ∈ N } deﬁnujeme jako strukturu D, jejíž nosná množina je i∈N Ai
a ve které realizace ID
každého symbolu I ∈ L je sjednocení jeho realizací IAi
ve strukturách Ai.
Lemma 3.4.24 Když { Ai ; i ∈ N } je elementární řetěz a D je jeho limita, pak
pro každé i platí Ai D.
Důkaz Nechť i je dáno. Indukcí podle složitosti formule ϕ(x1, . . , xk) lze dokázat,
že každá formule ϕ je absolutní pro podstrukturu Ai struktury D. Ukažme
si krok pro existenční kvantiﬁkátor. Nechť ϕ je tvaru ∃vψ(v, x), nechť a1, . . , ak
jsou prvky množiny Ai a nechť D |= (∃vψ)[a]. Existuje tedy prvek b ∈ D takový,
že D |= ψ[b, a]. Protože D = i∈N Ai, platí b ∈ Aj pro jisté j. Lze předpokládat
i ≤ j. Indukční předpoklad říká, že ψ je absolutní pro podstrukturu Aj.
Tedy Aj |= ψ[b, a] a Aj |= (∃vψ)[a]. Z Ai Ai+1 . . Aj plyne Ai Aj,
viz 3.4.17(f). Tedy Ai |= (∃vψ)[a]. Ostatní úvahy ponecháváme za cvičení. QED
Pojem řetězu a limity řetězu bychom mohli (nepodstatně) zobecnit pro případ,
kdy { Ai ; i ∈ N } je posloupnost struktur a { gi ; i ∈ N } je posloupnost
funkcí taková, že gi : Ai →e Ai+1. Pro úspornost jsme ale dali přednost jazyku
podmodelů a izomorﬁsmů před jazykem vnoření. Takto postupujeme i nadále,
ve formulaci a důkazu věty 3.4.25. Lemma 3.4.23 v jazyce podmodelů říká, že
když A 1 B, pak B je podmodelem jisté struktury C, která je elementárním
rozšířením struktury A. A z věty 3.4.21 plyne tento důsledek formulovaný v řeči
podmodelů: platí-li A |= Thm2(T), pak A je 1-elementárním podmodelem jistého
modelu teorie T.
Věta 3.4.25 Teorie T je ekvivalentní s teorií, jejíž všechny axiomy jsou sentence
v U2, právě když limita libovolného řetězu modelů teorie T je opět modelem teorie
T.
Důkaz Nechť T ⊆ U2 a T je ekvivalentní s T, nechť A0 0 A1 0 A2 0 . . .
je řetěz modelů teorie T a nechť D je jeho limita. Pro každé i platí Ai 0 D.
Nechť ϕ = ∀x1 . . ∀xk∃y1 . . ∃yrψ(x, y) je libovolný prvek množiny T . Zdůvodníme,
že D |= ϕ. Nechť a1, . . , ak jsou libovolné prvky množiny D. Protože D = Ai,
existuje index j takový, že všechny a1, . . , ak jsou v Aj. Protože Aj |= ϕ, v Aj
existují b1, . . , br takové, že Aj |= ψ[a, b]. Protože Aj 0 D, máme D |= ψ[a, b]
a D |= (∃y1 . . ∃yrψ(x, y))[a]. Tím je ověřena implikace ⇒.
Nechť naopak T splňuje podmínku, že limita libovolného řetězu modelů teorie T
je opět modelem teorie T. Vezměme za T množinu Thm2(T). Máme dokázat, že
je-li A libovolný model teorie T , pak A |= T. Deﬁnujme rekurzí posloupnosti Ai
a Bi struktur jako na obrázku 3.4.4. A0 je struktura A. Nechť již jsou sestrojeny
struktury A0 ⊆ B0 ⊆ A1 ⊆ . . ⊆ Bi−1 ⊆ Ai, všechny B0, . . , Bi−1 jsou modely
teorie T, všechny A0, . . , Ai jsou modely teorie T , a přitom pro každé j < i platí
3.4 Vlastnosti modelů a teorií 223
Aj 1 Bj, Bj 0 Aj+1 a Aj Aj+1. Podle věty 3.4.21 můžeme zvolit 1-elementární
rozšíření Bi struktury Ai takové, že Bi |= T. A podle lemmatu 3.4.23 lze
zvolit strukturu Ai+1 takovou, že Bi 0 Ai+1 a Ai Ai+1. Dle lemmatu 3.4.17(e)
jsou struktury Ai a Ai+1 elementárně ekvivalentní. Tedy Ai+1 |= T . Označme
nyní D limitu řetězu A0, B0, A1, B1 atd. Struktura D je současně také limitou
obou řetězů { Ai ; i ∈ N } a { Bi ; i ∈ N }. Podle předpokladu platí D |= T. Podle
lemmatu 3.4.24 je struktura D elementárním rozšířením všech struktur Ai. Tedy,
opět dle 3.4.17(e), platí A0 |= T. QED
A0 A1 A2 A3
B0 B1 B2
E E E E
 
 
 
 
 
 
 
 
 
 
 
 d
d
d
d
d
d
d
d
d
0 0 01 1 1 1
e e e e
· · ·
· · ·
Obrázek 3.4.4: Metoda alternujících řetězů
Konstrukce uvedená v důkazu předchozí věty, založená na faktu, že limita řetězu
je zároveň také limitou kteréhokoliv nekonečného podřetězu, je ukázkou užití
metody, které se říká metoda alternujících řetězů.
Příklad 3.4.26 Uvažujme strukturu celých čísel Z, < a její podstruktury Ai, kde
Ai je vpravo neomezený interval [[−i, +∞). Struktura Z, < celých čísel s uspořádáním
je limitou řetězu struktur Ai. To znamená, že vlastnost uspořádané množiny,
že v ní existuje nejmenší prvek, nelze vyjádřit pomocí U2-sentencí.
V tomto oddílu jsme naznačili některé z úvah běžných v teorii modelů. O většině
důležitých metod a konstrukcí jsme se ale nezmínili. Jedna z metod, které jsme pominuli,
je například ultraprodukt, pomocí něhož lze jednoduše formulovat nutnou
a postačující podmínku pro to, aby nějaká třída struktur byla axiomatizovatelná.
Zájemce o další informace odkazujeme na zdroje, ze kterých jsme čerpali: úvodní
kapitoly knihy [40] a příručky [4], případně kapitolu [70] příručky [4] a knihu [51].
Cvičení 29–32 jsou založena na Ehrenfeuchtově metodě, která je podrobněji vyložena
a rozpracována v knize [21].
Cvičení
1. Řekneme, že třída E struktur pro jazyk L je konečně axiomatizovatelná, jestliže
existuje konečná množina T sentencí v L taková, že E je třída všech modelů
teorie T. Dokažte, že komplement libovolné konečně axiomatizovatelné třídy
je opět konečně axiomatizovatelná třída.
2. Dokažte, že třída všech nekonečných struktur (pro libovolný jazyk L) je axiomatizovatelná,
není ale konečně axiomatizovatelná.
224 3 Predikátová logika
3. Teorie AG, teorie abelovských grup, má jazyk {+, 0} s binární operací a s konstantou
a axiomy R1–R4 teorie komutativních těles. Modely teorie AG jsou
abelovské grupy neboli komutativní grupy. Domluvme se, že místo výrazu
a + a + . . + a s n sčítanci píšeme na. Řekneme, že abelovská grupa G, +, 0
je cyklická, jestliže existuje prvek a ∈ G a přirozené číslo n ≥ 1 takové, že
G = {0a, 1a, 2a, . . , (n − 1)a}. Platí ovšem 0a = 0 a 1a = a. Řekneme, že
abelovská grupa G, +, 0 je torzní, jestliže pro každé a ∈ G existuje přirozené
číslo n ≥ 1 takové, že na = 0. Dokažte, že každá cyklická grupa je torzní.
Nalezněte příklad torzní grupy, která není cyklická.
4. Dokažte, že třída všech cyklických grup ani třída všech torzních grup není
axiomatizovatelná.
Návod. Přidejte k jazyku {+, 0} teorie grup dočasně novou konstantu c. Zvolte
za S množinu všech sentencí tvaru nc = 0 pro n ≥ 1, zvolte za T množinu všech
sentencí v jazyce {+, 0}, které platí ve všech cyklických grupách. Zdůvodněte,
že teorie T ∪ S má model.
5. Když E je třída struktur pro jazyk L, která je axiomatizovatelná, a když navíc
komplement třídy E (tj. třída všech struktur pro L, které nejsou v E) je axiomatizovatelná
třída, pak E i její komplement jsou konečně axiomatizovatelné.
Návod. Nechť teorie T axiomatizuje E a nechť S axiomatizuje komplement
třídy E. Pak T ∪ S nemá žádný model. Dle věty o kompaktnosti existují
množiny F1 ⊆ T a F2 ⊆ S konečné takové, že F1 ∪ F2 nemá žádný model.
Zdůvodněte, že F1 a F2 jsou hledané teorie.
6. Teorie T je konečně axiomatizovatelná, jestliže třída všech jejích modelů je
konečně axiomatizovatelná, neboli jestliže T je ekvivalentní s nějakou konečnou
množinou sentencí (svého jazyka). Dokažte sémantickými prostředky (tj.
užitím věty o kompaktnosti), že je-li T konečně axiomatizovatelná, pak T je
ekvivalentní s jistou konečnou množinou F sentencí takovou, že F ⊆ T.
7. Abelovská grupa G, +, 0 je grupa s dělením, jestliže pro každé a ∈ G a pro
každé přirozené číslo n ≥ 1 existuje prvek b ∈ G takový, že nb = a. Dokažte, že
třída všech abelovských grup s dělením je axiomatizovatelná, ale není konečně
axiomatizovatelná.
8. Dokažte, že teorie SUCC deﬁnovaná v závěru oddílu 3.2 není konečně axioma-
tizovatelná.
9. Neorientovaný graf je souvislý, jestliže každý jeho vrchol je z každého dosažitelný,
tj. jestliže z každého jeho vrcholu c vede (neorientovaná) cesta do každého
jeho vrcholu d. Dokažte, že souvislost neorientovaného grafu není vlastností
prvního řádu.
Návod. Místo podmínky, že z a vede nejvýše jedna hrana, uvažujte tuto podmínku:
každý vrchol má nejvýše dva sousedy a přitom existují nejméně dva
vrcholy, z nichž každý má nejvýše jednoho souseda.
3.4 Vlastnosti modelů a teorií 225
10. Dokažte, že je-li D, < lineárně uspořádaná množina, v níž každý prvek má
jen konečně mnoho předchůdců, pak D je nejvýše spočetná.
11. Nechť D, < je (ne nutně lineárně) uspořádaná množina. Pišme a ≤ b místo
a < b ∨ a = b. Nechť A ⊆ D. Řekneme, že d ∈ D je supremum množiny A,
jestliže d splňuje podmínky ∀a ∈ A(a ≤ d) a ∀d (∀a ∈ A(a ≤ d ) ⇒ d ≤ d ).
Dokažte, že každá A ⊆ D má nejvýše jedno supremum. Nemá-li D, < největší
prvek, pak existují množiny A ⊆ D, například sama D, které nemají supremum.
Ukažte na příkladech, že supremum množiny A může, ale nemusí být v A a že
A nemusí mít supremum, přestože D, < má největší prvek, a to vše i v případě,
kdy D, < je lineárně uspořádaná.
12. Nechť D, < je uspořádaná množina a nechť A ⊆ D. Řekneme, že d ∈ D
je horní závora množiny A, jestliže ∀a ∈ A(a ≤ d). Řekneme, že v D, <
platí věta o supremu, jestliže každá neprázdná A ⊆ D, která má nějakou horní
závoru, má i supremum. Supremum bylo tedy v předchozím cvičení deﬁnováno
jako nejmenší horní závora. Deﬁnujte analogicky inﬁmum množiny jako největší
dolní závoru a formulujte větu o inﬁmu. Dokažte, že v D, < platí věta o
supremu, právě když tam platí věta o inﬁmu.
13. Nechť D, < je lineárně uspořádaná množina. Řekneme, že množina A ⊆ D je
hustá v D, < , jestliže každý otevřený interval (včetně „nevlastních intervalů,
tj. včetně množin tvaru {x; x < a} a {x; x > a}) má neprázdný průnik s množinou
A. Když A je hustá v D, < , pak D, < i A, < jsou modely teorie DNO.
Dokažte, že když D1, <1 a D2, <2 jsou lineárně uspořádané množiny, ve
kterých platí věta o supremu, a existuje množina A1 hustá v D1, <1 a A2
hustá v D2, <2 takové, že A1, <1 a A2, <2 jsou spolu izomorfní, pak i celé
struktury D1, <1 a D2, <2 jsou spolu izomorfní.
14. Nechť A, <A je model teorie DNO. Pak existuje lineárně uspořádaná množina
D, <D , ve které platí věta o supremu, a taková, že A, <A je izomorfní
s jistou podmnožinou množiny D, která je hustá v D, <D . Dokažte.
Návod. Deﬁnujte řez v A, <A jako množinu X ⊆ A různou od ∅ a A, která
nemá maximum a která splňuje podmínku ∀a∀b(a < b & b ∈ X ⇒ a ∈ X).
Deﬁnujte D jako množinu všech řezů v A, <A . Deﬁnujte <D jako inkluzi.
15. Teorie DNO má jediný (až na izomorﬁsmus) model, ve kterém platí věta o
supremu a který obsahuje spočetnou hustou podmnožinu. Dokažte. Jaká je
jeho mohutnost?
Návod. Použijte cvičení 13, příklad 3.4.12 a vědomost, že ve struktuře R, <
reálných čísel s uspořádáním platí věta o supremu.
16. Uvažujte teorii T, která má spočetný jazyk L = {c0, c1, c2, . . . } obsahující pouze
konstanty a jejíž axiomy jsou všechny sentence tvaru ci = cj pro i = j. Rozhodněte,
pro která κ platí, že T je κ-kategorická.
226 3 Predikátová logika
17. Uvažujte třídu všech struktur D, P pro jazyk s jedním unárním predikátem
takových, že P i D − P jsou nekonečné množiny. Dokažte, že tato třída je
axiomatizovatelná. Je konečně axiomatizovatelná? Rozhodněte, pro která κ je
příslušná teorie κ-kategorická.
18. Každá spočetná lineárně uspořádaná množina je izomorfní s jistou podmnožinou
množiny Q všech racionálních čísel (s obvyklým uspořádáním). Dokažte.
19. Když pro vnoření f : A →0 B a g : B →e C platí, že g ◦ f je elementární, pak
f : A →e B. Dokažte.
20. Dokažte, že tvrzení lemmatu 3.4.23 lze obrátit: když f : A →0 B, g : B →0 C
a g ◦ f je elementární vnoření struktury A do struktury C, pak f : A →1 B.
21. Rozhodněte, zda platí: když A 0 B a A a B jsou izomorfní, pak A B.
Návod. Uvažujte třeba struktury N, < a N − {0}, < .
22. Jsou-li A a B elementárně ekvivalentní struktury pro týž jazyk L, pak existuje
struktura C pro jazyk L a elementární vnoření g1 : A →e C a g2 : B →e C.
Dokažte.
Návod. Nemá-li Diage(A) ∪ Diage(B) model, existuje logicky platná formule
tvaru αi(a)→¬ βj(b), kde αi(a) ∈ Diage(A) a βj(b) ∈ Diage(B). Pak také
sentence ∃x αi(x) → ¬∃y βj(y) je logicky platná atd.
23. Dokažte tuto modiﬁkaci věty 3.4.21: nechť T je teorie v jazyce L , nechť L ⊆ L
a nechť A je struktura pro jazyk L, ve které platí všechny L-sentence dokazatelné
v T. Pak existuje model B teorie T a funkce g z A do B taková,
že g : A →e,L B, tj. taková, která je vnořením struktury A do reduktu struktury
B pro jazyk L.
24. Dokažte následující modiﬁkaci lemmatu 3.4.23: je-li L ⊆ L , je-li A struktura
pro L , je-li B struktura pro L a platí-li f : A →e,L B, pak existuje struktura C
pro jazyk L a vnoření g : B →e,L C takové, že g ◦ f : A →e,L C.
25. Dokažte Robinsonovu větu o bezespornosti: nechť L1 a L2 jsou jazyky, nechť T
je úplná teorie v L = L1 ∩L2, nechť T1 a T2 jsou bezesporné teorie v L1 resp. L2
takové, že Thm(T) ⊆ Thm(T1) a Thm(T) ⊆ Thm(T2). Pak T1 ∪ T2 je bezesporná
teorie.
Návod. Vezměte model A0 teorie T1 a model B0 teorie T2 a zdůvodněte existenci
takovýchto struktur a vnoření:
B0 B1 B2
A0 A1
E E E
E E
 
 
 
 
 
 d
d
d
d
d
d
e,L2 e,L2 e,L2
e,L1 e,L1
e,L e,Le,L e,L
· · ·
· · ·
3.4 Vlastnosti modelů a teorií 227
Strukturu Ai pro i ≥ 1, vnoření struktury Bi do Ai zachovávající všechny
L-formule a vnoření struktury Ai−1 do Ai zachovávající všechny L1-formule
lze získat volbou L := L1 v tvrzení z předchozího cvičení. Strukturu Bi pro
i ≥ 2 a příslušná vnoření lze naopak získat volbou L := L2. Existenci struktury
B1 zdůvodněte zvlášť. Limitu C elementárního řetězu A0, B1, A1, . . .
struktur pro jazyk L lze expandovat do struktury pro jazyk L1, která je limitou
řetězu { Ai ; i ∈ N }, a také do struktury pro jazyk L2, která je limitou
řetězu { Bi ; i ∈ N }. Provedeme-li obě expanze najednou, získáme model
teorie T1 ∪ T2.
26. Nechť T1 je teorie v jazyce L1 a T2 je teorie v jazyce L2. Je-li teorie T1 ∪ T2
sporná, pak existuje sentence θ v jazyce L1 ∩ L2 taková, že T1 θ a T2 ¬θ.
Dokažte toto tvrzení převedením na Robinsonovu větu.
Návod. Nechť taková sentence neexistuje. Označte T0 množinu všech L-sentencí
dokazatelných v teorii T1 a zdůvodněte, že T0∪T2 má model. Vezměte libovolný
model M teorie T0 ∪ T2, vezměte jeho redukt M0 pro jazyk L a aplikujte
Robinsonovu větu na úplnou teorii T := Th(M0) a na teorie Th(M0) ∪ T1
a Th(M0) ∪ T2.
27. Vyvoďte z předchozího cvičení Craigovu větu o interpolaci: je-li ϕ sentence v L1
a ψ sentence v L2 a je-li implikace ϕ→ψ logicky platná, pak existuje sentence θ
v jazyce L1 ∩ L2 taková, že obě implikace ϕ → θ a θ → ψ jsou logicky platné.
28. Vyvoďte Robinsonovu větu o bezespornosti z Craigovy věty o interpolaci. Nalezněte
příklady na to, že předpoklady v Robinsonově větě, že teorie T je úplná
a že její jazyk je průnikem jazyků teorií T1 a T2, jsou podstatné.
29. Nechť relace Rn jsou na množině N ∪ {∞} (přirozených čísel s jedním dodatečným
prvkem) deﬁnovány předpisem a Rn b ⇔ a = b ∨ (2n
≤ a & 2n
≤ b),
přičemž ∞ se považuje za větší než všechna čísla m ∈ N. Zdůvodněte, že
všechny relace Rn jsou ekvivalence. Nechť ∞ − m je pro m ∈ N deﬁnováno
jako ∞. Dokažte, že když a Rn+1 b, pak pro každé c ≤ a existuje d ≤ b takové,
že c Rn d a (a − c) Rn (b − d).
30. Nechť D = D, < je libovolný model teorie DO. Deﬁnujme vzdálenost |a − b|
libovolných prvků a, b jako počet prvků d ∈ D splňujících v D podmínku
a ≤ d < b. Vzdálenost |a − b| je prvek množiny N ∪ {∞} z předchozího
cvičení. Vzdálenost dvou sousedních prvků je 1 a vzdálenost libovolného prvku
od sebe samého je 0. Deﬁnujme systém relací En,k na množině Dk
. Mějme dvě
k-tice a1, . . , ak a b1, . . , bk prvků z D. Zvolme permutaci π indexů {1, . . , k},
která uspořádá k-tici a1, . . , ak, tj. pro kterou (v D) platí aπ(1) ≤ . . ≤ aπ(k).
Pak [a] En,k [b], jsou-li splněny podmínky
◦ ∀i(1 ≤ i < k ⇒ bπ(i) ≤ bπ(i+1) & (bπ(i) = bπ(i+1) ⇔ aπ(i) = aπ(i+1))),
◦ |0 − aπ(1)| Rn |0 − bπ(1)|,
228 3 Predikátová logika
◦ ∀i(1 ≤ i < k ⇒ |aπ(i) − aπ(i+1)| Rn |bπ(i) − bπ(i+1)|).
Dokažte, že když [a] En+1,k [b], pak pro každé c ∈ D existuje d ∈ D takové, že
[a, c] En,k [b, d].
31. Nechť ϕ(x1, . . , xk) je prenexní formule v jazyce {<} obsahující nejvýše n kvantiﬁkátorů,
nechť a1, . . , ak a b1, . . , bk jsou dvě k-tice prvků z D takové, že
[a] En,k [b]. Pak D |= ϕ[a] ⇔ D |= ϕ[b]. Dokažte.
32. Dokažte na základě předchozího cvičení, že počáteční úsek modelu D izomorfní
se strukturou ω, tj. podstruktura sestávající ze všech prvků, jejichž vzdálenost
od nuly je konečná, je elementární podstrukturou struktury D. Vyvoďte z toho
(a z 3.4.17(e)), že DO je úplná teorie.
3.5 Eliminace kvantiﬁkátorů
Je-li zvolena teorie T s jazykem L, můžeme se ptát, zda každá formule jazyka L
je v T ekvivalentní s nějakou formulí neobsahující kvantiﬁkátory. Snadno lze zdůvodnit
(například na základě cvičení 1), že alespoň pro některé teorie odpověď zní
ne, kvantiﬁkátory obecně nelze pominout. V tomto oddílu uvidíme, že pro některé
teorie naopak platí ano. Platí-li o teorii T, že každá formule ϕ je v T ekvivalentní
s otevřenou formulí ψ, jejíž všechny volné proměnné jsou zároveň volné ve ϕ,
říkáme, že T připouští eliminaci kvantiﬁkátorů.
Je-li každá formule ϕ v T ekvivalentní s formulí ψ, která oproti ϕ nemá žádné
volné proměnné navíc, znamená to, že každá sentence ϕ je v T ekvivalentní s otevřenou
sentencí ψ. Máme-li pak dokázat, že teorie T je úplná, stačí ověřit, že podmínka
T ϕ nebo T ¬ϕ platí pro každou otevřenou sentenci. Eliminace kvantiﬁkátorů
nám tedy kromě metod, které jsme poznali dosud (jedna byla založena na větě 3.4.15
a druhá byla naznačena ve cvičeních 29–32 oddílu 3.4), poskytuje další, poměrně
široce aplikovatelnou metodu pro důkaz úplnosti axiomatické teorie.
Pomocí eliminace kvantiﬁkátorů dokážeme úplnost teorie DO z oddílu 3.4 a dále
úplnost teorie celočíselného sčítání a teorie reálně uzavřených těles.
Neplatí-li, že každá formule teorie T je v T ekvivalentní s otevřenou formulí,
může to platit pro jisté rozšíření T teorie T formulované v jazyce L ⊇ L. Pokud
navíc T rozšiřuje T „nepodstatně , z úplnosti teorie T lze usoudit na úplnost
teorie T. Nalezení vhodného nepodstatného (budeme říkat konzervativního) rozšíření
T teorie T tedy bude důležitou a někdy jedinou netriviální částí důkazu, že T
je úplná.
Deﬁnice 3.5.1 Nechť T1 a T2 jsou teorie s jazyky L1 resp. L2. Řekneme, že
teorie T1 je podteorie teorie T2 a že teorie T2 je rozšíření teorie T1, jestliže L1 ⊆ L2
a Thm(T1) ⊆ Thm(T2). Řekneme, že teorie T2 je konzervativní rozšíření teorie T1,
jestliže T2 je rozšíření teorie T1 a navíc každá sentence jazyka L1 dokazatelná v T2
je dokazatelná i v T1.
3.5 Eliminace kvantiﬁkátorů 229
Připomeňme, že jsou-li D1 a D2 struktury pro jazyky L1 a L2, kde L1 ⊆ L2,
pak D2 je expanze struktury D1, jestliže D1 a D2 mají tutéž nosnou množinu D a
jestliže navíc každý symbol z L1 má v D1 i v D2 tutéž realizaci.
Věta 3.5.2 Když T2 je rozšíření teorie T1 a každý model teorie T1 má expanzi,
která je modelem teorie T2, pak T2 je konzervativním rozšířením teorie T1.
Důkaz Nechť ϕ je sentence jazyka L1 taková, že T2 ϕ. Chceme ověřit, že T1 ϕ.
Stačí zdůvodnit, že ϕ platí ve všech modelech teorie T1. Nechť tedy D1 |= T1.
Dle podmínky věty existuje expanze D2 modelu D1 taková, že D2 |= T2. Protože
T2 ϕ, máme D2 |= ϕ. Platnost formule ϕ závisí jen na realizaci symbolů
z L1 (viz cvičení 18 z oddílu 3.1), které ale jsou v D1 i v D2 realizovány shodně.
Tedy D1 |= ϕ. QED
Důležitý zvláštní případ konzervativního rozšíření teorie popisuje následující
věta. V jejím znění je užit deﬁnovaný kvantiﬁkátor ∃!, který budeme používat i ve
zbývajícím textu. Zápis ∃!yϕ(x, y) znamená ∃y(ϕ(x, y) & ∀v(ϕ(x, v) → v = y))
a čteme jej „existuje právě jedno y takové, že ϕ(x, y) .
Věta 3.5.3 (a) Nechť T je teorie s jazykem L, nechť P /∈ L je n-ární predikátový
symbol, nechť ε(x1, . . , xn) je formule v jazyce L, jejíž všechny volné proměnné jsou
mezi x1, . . , xn. Nechť dále T je teorie, která má jazyk L ∪ {P} a která má tytéž
axiomy jako teorie T a navíc axiom
∀x1 . . ∀xn(P(x1, . . , xn) ≡ ε(x1, . . , xn)). (d1)
Pak T je konzervativním rozšířením teorie T.
(b) Nechť T je teorie s jazykem L, nechť F /∈ L je n-ární funkční symbol, nechť
η(x1, . . , xn, y) je formule v L, jejíž všechny volné proměnné jsou mezi x1, . . , xn, y,
a nechť T ∀x∃!yη(x, y). Nechť dále T je teorie, která má jazyk L ∪ {F} a která
má tytéž axiomy jako teorie T a navíc axiom
∀x1 . . ∀xn∀y(F(x1, . . , xn) = y ≡ η(x1, . . , xn, y)). (d2)
Pak T je konzervativním rozšířením teorie T.
Důkaz Ověříme podmínku z věty 3.5.2. Nechť M je libovolný model teorie T.
Realizujeme-li symbol P množinou { [a1, . . , an] ∈ Mn
; M |= ε[a] }, dostaneme
(jedinou) expanzi M struktury M pro jazyk L∪{P}, která splňuje axiom (d1). Tím
je ověřena podmínka z věty 3.5.2, a tedy dokázáno tvrzení (a). Důkaz tvrzení (b)
je obdobný, symbol F realizujeme množinou { [a, b] ∈ Mn+1
; M |= η[a, b] }. Navíc
je třeba dodat, že tato množina je vzhledem k podmínce T ∀x∃!yη(x, y) funkcí
z Mn
do M, a tedy může být zvolena za realizaci n-árního funkčního symbolu.
QED
230 3 Predikátová logika
Řekneme, že teorie S je rozšířením teorie T o deﬁnice, jestliže existuje (konečná
nebo nekonečná spočetná) posloupnost teorií T0, T1, . . . taková, že T0 je T,
každá Ti+1 je rozšířením teorie Ti o deﬁnici jednoho symbolu tak, jak je popsáno
ve větě 3.5.3 (a) nebo (b), a dále jazyk teorie S je sjednocením jazyků všech Ti a
množina axiomů teorie S je sjednocením množin axiomů všech Ti. Je-li posloupnost
{Ti} konečná, pak S je totožná s jejím posledním členem. Každá teorie je
považována za své vlastní rozšíření o deﬁnice.
Je-li teorie T konzervativním rozšířením teorie T, znamená to, že v ní nelze
navíc oproti teorii T dokázat žádné z těch tvrzení, která lze formulovat v jazyce
teorie T. Je-li T rozšířením teorie T o deﬁnice, znamená to, že v ní dokonce nelze
formulovat žádná nová tvrzení, tj. tvrzení, která by nešlo formulovat už v jazyce
teorie T.
Nyní jsme připraveni dokázat úplnost teorie DO pomocí eliminace kvantiﬁkátorů.
Postup, který ukážeme, je až na drobnosti převzat z Rabinovy kapitoly [70]
příručky [4].
Protože teorie DO eliminaci kvantiﬁkátorů nepřipouští (viz cvičení 1), abychom
mohli dokázat její úplnost pomocí eliminace kvantiﬁkátorů, musíme nejprve nalézt
její vhodné konzervativní rozšíření. Připomeňme, že axiomy teorie DO jsou sentence
LO1–LO3 uvedené na str. 172 a dále sentence DO1–DO3 uvedené na str. 212.
Označme DOS teorii, jejíž jazyk je {0, S, <} a jejíž axiomy jsou axiomy teorie DO
a navíc axiomy
∀x(x = 0 ≡ ¬∃y(y < x)),
∀x∀y(y = S(x) ≡ x < y & ¬∃v(x < v & v < y)).
Těmto dvěma axiomům říkejme deﬁnice nuly a deﬁnice následnické funkce. Axiom
DO1 teorie DO postuluje, že existuje objekt, před kterým není žádný menší, a užitím
axiomu LO3 lze snadno usoudit, že takový objekt je jen jeden. Deﬁnice nuly tedy
splňuje podmínku jednoznačnosti z věty 3.5.3(b). Podobně lze zdůvodnit, že také
deﬁnice následnické funkce ji splňuje. Podle věty 3.5.3 je tedy teorie DOS konzervativním
rozšířením teorie DO. Je zřejmé, že struktura N, 0, S, < je jedním z modelů
teorie DOS.
V teorii DOS můžeme užívat všechna tvrzení, která jsme dokázali v teorii DO
nebo v teorii LO. Bude se nám například hodit schéma, které pro každé n ≥ 1 tvrdí,
že každá n-tice objektů má maximální prvek. Dále budeme kromě symbolů <, 0 a S
užívat také symbol ≤ pro neostré uspořádání. Přitom je jedno, zda jej považujeme
za zkratku a za každou formulí t ≤ s si představujeme formuli t < s ∨ t = s (tak
jsme se na symbol ≤ dívali v oddílu 3.2), nebo zda jej považujeme za čtvrtý symbol
jazyka teorie DOS deﬁnovaný formulí ∀x∀y(x ≤ y ≡ x < y ∨ x = y) (na základě
věty 3.5.3).
Úvahy směřující k eliminaci kvantiﬁkátorů pro teorii DOS budou zjednodušeny
faktem, že lze snadno charakterizovat všechny termy teorie DOS. Každý term
sestavený z proměnných a symbolů 0 a S má totiž tvar S(m)
(z), kde z je nějaká
proměnná, nebo tvar S(m)
(0). Žádný term tedy nemůže obsahovat více než jednu
3.5 Eliminace kvantiﬁkátorů 231
proměnnou. Připomeňme ještě, že místo S(m)
(0) píšeme m a že termům tvaru m
říkáme numerály.
Lemma 3.5.4 V teorii DOS lze dokázat následující sentence:
(a) ∀x(x < S(x)),
(b) ∀x∀y(x < S(y) ≡ x < y ∨ x = y),
(c) ∀x∀y(S(x) < S(y) ≡ x < y),
(d) ∀x∀y(S(x) = S(y) ≡ x = y),
(e) ∀x(S(m)
(x) < S(n)
(x)), je-li m < n,
(f) ∀x(S(m)
(x) = S(n)
(x)), je-li m = n,
(g) ∀x(m ≤ x ≡ ∃v(x = S(m)
(v))).
Důkaz Implikace → v (b) se dokáže takto:
Neplatí-li x < y ani x = y, dle axiomu LO3 platí y < x. V tom případě x
je některý z objektů větších než y. Protože S(y) je deﬁnován jako nejmenší
z objektů větších než y, platí S(y) ≤ x. To je spor s předpokladem x < S(y).
Implikace → v (c) se snadno dokáže dosazením termu S(x) za x v (b). Zbývající
kroky v důkazech sentencí (a)–(c) ponecháváme na čtenáři. Sentenci (d) lze dokázat
z (c) užitím axiomu LO3. V (e) si stačí uvědomit, že S(m)
(x) a S(n−m)
(S(m)
(x))
jsou tytéž termy, a (n − m)-krát užít (a). Sentence (f) plyne z (e) a v důkazu se
uplatní axiom LO2. Existence důkazu implikace → sentence (g) se dokáže indukcí
podle m. Ukažme si indukční krok. Je-li důkaz pro m již sestrojen, důkaz pro m+1
může vypadat takto:
Nechť x je dáno a nechť m + 1 ≤ x. Tedy S(m) ≤ x. Podle již dokázané
sentence (a) to znamená m < x. Podle axiomu DO3 existuje z takové, že
z < x a mezi z a x není nic. Podle deﬁnice následnické funkce to znamená,
že x = S(z). Dále určitě platí m ≤ z, jinak by objekt m byl mezi z a x. Dle již
dokázaného tvrzení pro m k objektu z existuje v takové, že z = S(m)
(v). Platí
tedy x = S(m+1)
(v).
Důkaz pro m = 0 a důkaz implikace ← opět ponecháváme na čtenáři. QED
Nyní můžeme postupně dokázat, že teorie DOS připouští eliminaci kvantiﬁkátorů,
tj. že každá formule jejího jazyka je ekvivalentní s otevřenou formulí. K pojmu
„ekvivalentní formule pro jistotu zdůrazněme, že jsou-li formule ϕ(x) a ψ(x) ekvivalentní
v teorii DOS, znamená to, že podmínky M |= ϕ[e] a M |= ψ[e] jsou
ekvivalentní pro každý model teorie DOS (a ne například jen pro „preferovaný model
N, 0, S, < ) a pro každé ohodnocení proměnných e. K prokazování ekvivalence
samozřejmě užíváme neformální důkazy. Nejprve se budeme zabývat formulemi,
jako je například ∃x(y1 < S(7)
(x) & S(7)
(x) = y2), které neobsahují jiné logické
spojky než konjunkci, obsahují právě jeden kvantiﬁkátor, který je existenční a je
umístěn hned na začátku, a které navíc splňují podmínku, že ta proměnná, kterou
určuje onen jediný kvantiﬁkátor, se v každé atomické podformuli vyskytuje pouze
v určitém kontextu a vždy nejvýše na jedné straně (rovnosti nebo nerovnosti).
232 3 Predikátová logika
Lemma 3.5.5 Nechť m je přirozené číslo a nechť A(x, y1, . . , yq) je konjunkce (libovolného
počtu) atomických formulí v jazyce teorie DOS taková, že každá atomická
podformule formule A obsahující proměnnou x má jeden z tvarů S(m)
(x) < t,
nebo S(m)
(x) = t, nebo t < S(m)
(x), kde t je term neobsahující x. Pak formule ∃xA
je v teorii DOS ekvivalentní s otevřenou formulí, jejíž všechny volné proměnné jsou
mezi y1, . . , yq.
Důkaz Je-li mezi atomickými podformulemi formule A alespoň jedna rovnost, můžeme
si jednu vybrat a psát formuli A ve tvaru S(m)
(x) = t(y) & B(S(m)
(x), y).
Víme ovšem, že term t(y) může z proměnných y1, . . , yq obsahovat nejvýše jednu.
Pro následující úvahu to ale nemá žádný význam. Tvrdíme, že formule ∃xA je
v teorii DOS ekvivalentní s otevřenou formulí m ≤ t(y) & B(t(y), y). Zde je důkaz
jejich ekvivalence:
Nechť x je takové, že S(m)
(x) = t(y) a B(S(m)
(x), y). Podle implikace ←
v 3.5.4(g) platí m ≤ t(y). Z S(m)
(x) = t(y) a z B(S(m)
(x), y) ovšem plyne
také B(t(y), y).
Když naopak m ≤ t(y), pak dle implikace → v 3.5.4(g) k t(y) existuje x takové,
že S(m)
(x) = t(y). Když navíc B(t(y), y), pak ovšem i B(S(m)
(x), y). Tedy
existuje x takové, že A(x, y).
Zbývá případ, kdy žádná atomická podformule formule A(x, y) není rovnost, tj. kdy
A má tvar
t1(y) < S(m)
(x) & . . & tn(y) < S(m)
(x) &
& S(m)
(x) < u1(y) & . . & S(m)
(x) < uk(y) & D(y),
kde termy ti(y) a uj(y) a formule D(y) neobsahují x. Tvrdíme, že formule ∃xA je
v teorii DOS ekvivalentní s formulí
i,j
(S(ti(y)) < uj(y)) &
j
(m < uj(y)) & D(y), (∗)
neboť jejich ekvivalenci lze v teorii DOS dokázat takto:
Nechť x je takové, že A(x, y). Z ti(y) < S(m)
(x) a S(m)
(x) < uj(y) jistě
plyne S(ti(y)) < uj(y). Dále z S(m)
(x) < uj(y) jistě plyne m < uj(y) dle ←
v 3.5.4(g). Tedy (∗).
Nechť naopak (∗). Vezměme za z maximální z n + 1 objektů m a S(t1(y))
až S(tn(y)). Tento objekt z splňuje všechny podmínky ti(y) < z i z < uj(y).
Dle implikace → v 3.5.4(g) k z existuje x splňující podmínku S(m)
(x) = z.
Pro x platí A(x, y). Tedy ∃xA(x, y).
Platí-li k = 0, formule ∃xA(x, y) je ekvivalentní s formulí D, neboť v teorii DOS lze
dokázat sentenci ∀y∃x i(ti(y) < S(m)
(x)). Pokud navíc formule D chybí, ∃xA má
tvar ∃x i(ti(y) < S(m)
(x)) a je ekvivalentní s (otevřenou) formulí 0 = 0. Můžeme
ale tvrdit, že konjunkce nulového počtu formulí je formule 0 = 0 a že všechny krajní
případy (kdy některé z čísel n nebo k je nula nebo kdy D chybí) jsou zahrnuty ve
výše zmíněném zdůvodnění, že ∃xA a (∗) jsou ekvivalentní formule. QED
3.5 Eliminace kvantiﬁkátorů 233
Čtenáři, který pochybuje o dokazatelnosti sentence ∀y∃x i(ti(y) < S(m)
(x)),
připomeňme, že podobnou sentencí jsme se dost podrobně zabývali v oddílu 3.2
v souvislosti s teorií SUCC.
Lemma 3.5.6 Nechť A(x, y1, . . , yq) je konjunkce atomických formulí v jazyce teorie
DOS. Pak formule ∃xA(x, y) je v teorii DOS ekvivalentní s jistou otevřenou
formulí, jejíž všechny volné proměnné jsou mezi y1, . . , yq.
Důkaz Je-li mezi atomickými podformulemi dané formule A nějaká formule tvaru
S(m)
(x) < S(n)
(x), kde n ≤ m, nebo formule tvaru S(m)
(x) = S(n)
(x), kde m = n,
jsme hotovi. Každou ze sentencí ¬∃x(S(m)
(x) < S(n)
(x)) a ¬∃x(S(m)
(x) = S(n)
(x))
lze totiž pro n ≤ m resp. pro m = n v teorii DOS dokázat užitím tvrzení 3.5.4
(e) a (f).
Jinak, tj. pokud A nemá žádnou podformuli uvedeného tvaru, vyhledejme všechny
atomické podformule formule A, ve kterých se x vyskytuje na obou stranách rovnosti
nebo nerovnosti. Všechny musí mít tvar buď S(m)
(x) = S(m)
(x), nebo
tvar S(m)
(x) < S(n)
(x), kde m < n. Tyto formule můžeme prostě škrtnout, neboť
uvnitř teorie DOS je jasné, že jsou splněny každým x. Pokud po tomto škrtání
nezbude nic, tj. pokud A byla například S(2)
(x) < S(5)
(x) & S(4)
(x) < S(11)
(x),
formule ∃xA(x, y) je ekvivalentní s formulí 0 = 0 a jsme hotovi.
Zbývá případ, kdy A je konjunkce atomických formulí neobsahujících x a formulí
tvaru S(m)
(x) < t, nebo S(m)
(x) = t, nebo t < S(m)
(x), kde t je term neobsahující x
a m je nějaké (v každé atomické formuli případně jiné) přirozené číslo. Opakovaným
užitím tvrzení 3.5.4 (c) a (d) ve směru zprava doleva lze dosáhnout toho, že m bude
vždy totéž. Například formule
∃x(S(4)
(x) = S(3)
(y1) & y2 < S(11)
(x) & S(y1) = y3)
je ekvivalentní s formulí
∃x(S(11)
(x) = S(10)
(y1) & y2 < S(11)
(x) & S(y1) = y3).
Tímto postupem je tvrzení lemmatu převedeno na tvrzení lemmatu 3.5.5. QED
Lemma 3.5.7 Nechť ϕ je otevřená formule. Pak formule ∃xϕ je v teorii DOS
ekvivalentní s jistou otevřenou formulí, která nemá jiné volné proměnné než ty,
které jsou volné také ve formuli ∃xϕ.
Důkaz Ponechme nejprve kvantiﬁkátor ∃x stranou a pracujme pouze s formulí ϕ.
Pomocí výrokově logicky ekvivalentních záměn převeďme formuli ϕ na formuli ϕ ,
která neobsahuje implikaci a v níž se negace nevyskytuje nikde jinde než případně
u atomických podformulí. To se udělá stejně jako v důkazu věty 1.1.10 a nejsou
k tomu potřeba axiomy teorie DOS ani znalosti o predikátové logice, vystačí se
s výrokovou logikou.
Dále nahraďme každou podformuli formule ϕ tvaru ¬(t = u) nebo ¬(t < u) formulí
t < u ∨ u < t resp. formulí t = u ∨ u < t. Tyto záměny jsou v teorii DOS (přesněji
234 3 Predikátová logika
řečeno už v teorii LO) ekvivalentní a jejich výsledkem je formule ϕ neobsahující
jiné logické spojky než & a ∨ .
Nakonec postupujme opět stejně jako v důkazu věty 1.1.10 a převeďme formuli ϕ
na ekvivalentní formuli, která je disjunkcí konjunkcí, tj. která je tvaru A1 ∨ . . ∨Ak,
kde každá Ai je konjunkce atomických formulí. Formule ∃xϕ je ekvivalentní s formulí
∃x(A1 ∨ . . ∨ Ak) a také s disjunkcí ∃xA1 ∨ . . ∨ ∃xAk. Každá z formulí ∃xAi
je dle lemmatu 3.5.6 ekvivalentní s otevřenou formulí. Tedy ∃xϕ je ekvivalentní
s otevřenou formulí. Navíc je zřejmé, že v žádném z kroků, které jsme provedli,
nepřibyly volné proměnné. QED
Lemma 3.5.8 Každá otevřená sentence v jazyce {0, S, <} je v teorii DOS dokazatelná
nebo vyvratitelná.
Důkaz Dosazením nuly do sentence 3.5.4(e) dostaneme DOS m < n pro m < n.
Uvažme zbývající případy, tj. případy, kdy m = n nebo n < m. Když m = n,
pak DOS m = n. Když n < m, pak dle předchozího DOS n < m. V obou
případech axiom LO2 dává DOS ¬(m < n). Každá sentence tvaru m < n je
tedy v teorii DOS dokazatelná nebo vyvratitelná. Podobnými úvahami lze zjistit,
že totéž platí i pro každou sentenci tvaru m = n. To dohromady znamená, že každá
atomická sentence je v teorii DOS dokazatelná nebo vyvratitelná. Zbytek je indukce
podle počtu logických spojek ve formuli ϕ. Je-li například ϕ tvaru ϕ1 → ϕ2 a ϕ2 je
dokazatelná nebo ϕ1 vyvratitelná, pak DOS ϕ. Je-li naopak ϕ1 dokazatelná a ϕ2
vyvratitelná, pak DOS ¬ϕ. Podobně lze uvažovat i v případě ostatních logických
spojek. QED
Věta 3.5.9 Teorie DOS připouští eliminaci kvantiﬁkátorů. Obě teorie DOS a DO
jsou úplné.
Důkaz Nechť je dána libovolná formule ψ v jazyce teorie DOS. Nahraďme nejprve
každou její podformuli tvaru ∀xϕ ekvivalentní formulí ¬∃x¬ϕ. Výslednou formuli
označme ψ0. Formule ψ0 neobsahuje univerzální kvantiﬁkátor. Neobsahuje-li ψ0
ani existenční kvantiﬁkátor, jsme hotovi. Jinak ψ0 má podformuli ∃xϕ takovou,
že ϕ je otevřená. Označme ψ1 formuli, která vznikne z ψ0 aplikací lemmatu 3.5.7
na formuli ∃xϕ. Je-li třeba, opakujme tento postup, kterým jsme získali ψ1 z ψ0,
ještě vícekrát. Výsledkem je otevřená formule, která je ekvivalentní s původní
formulí ψ a která vůči ψ nemá žádné volné proměnné navíc. Tím je zdůvodněno,
že teorie DOS připouští eliminaci kvantiﬁkátorů.
Je-li ψ sentence, pak existuje otevřená sentence χ ekvivalentní s ψ. Dle lemmatu
3.5.8 je sentence χ dokazatelná nebo vyvratitelná. Platí-li DOS χ, pak
z DOS ψ ≡ χ plyne DOS ψ. Platí-li DOS ¬χ, pak z DOS ψ ≡ χ plyne
DOS ¬ψ. Teorie DOS je tedy úplná. Z toho a z faktu, že teorie DOS je konzervativním
rozšířením teorie DO, plyne i úplnost teorie DO. QED
K důkazu věty 3.5.9 poznamenejme, že přestože deﬁnice úplné teorie mluví
pouze o sentencích, opravdu jsme se museli zabývat všemi formulemi. Lemma 3.5.7
3.5 Eliminace kvantiﬁkátorů 235
umožňuje odstranit kvantiﬁkátor z otevřené formule, a máme-li je použít k nalezení
otevřené formule ekvivalentní s danou formulí ψ, musíme postupovat od vnitřních
kvantiﬁkátorů směrem k vnějším. To znamená, že i když ψ je sentence, musíme se
zabývat jejími podformulemi, které sentencemi být nemusí.
Druhý příklad na eliminaci kvantiﬁkátorů, kterým se chceme zabývat, je teorie
celočíselného sčítání. Tato teorie má jazyk {+, 0, 1}, čtyři jednotlivé axiomy a tři
axiomatická schémata. Čtyři jednotlivé axiomy jsou:
Ad1: ∀x∀y∀z(x + (y + z) = (x + y) + z),
Ad2: ∀x(x + 0 = x),
Ad3: ∀x∃y(x + y = 0),
Ad4: ∀x∀y(x + y = y + x).
Tyto axiomy postulují, že operace sčítání je asociativní a komutativní, nula je
neutrální a že ke každému objektu existuje objekt k němu opačný. Objektům teorie
celočíselného sčítání říkejme čísla. Snadno se dokáže, že nula je jediné neutrální číslo
a že ke každému číslu existuje právě jedno číslo k němu opačné. Poznamenejme,
že teorii s jazykem {+, 0} a s axiomy Ad1–Ad4 jsme ve cvičeních oddílu 3.2 říkali
teorie abelovských grup.
Numerály užíváme v teorii celočíselného sčítání ve stejném smyslu jako v teorii
komutativních těles z oddílu 3.2: 0 je term 0, m + 1 je term (m+1). Odhlédneme-li
od závorek, m je součtem m jedniček.
Je-li t(y1, . . , yq) libovolný term v jazyce {+, 0, 1}, můžeme opět odhlédnout od
závorek (tj. několikrát užít axiom Ad1), „sestěhovat k sobě všechny výskyty téže
proměnné a všechny výskyty konstanty 1 (tj. užít případně opakovaně axiom Ad4)
a upravit počet výskytů konstanty 0 na jeden (užitím Ad2). Domluvíme-li se, že
my znamená y + . . + y (m sčítanců), a přesuneme-li ještě konstanty na vhodné
místo, dostaneme term tvaru m1y1 + . . + mqyq + r. Tím jsme zdůvodnili, že ke
každému termu t(y) v jazyce {+, 0, 1} existuje term u(y) tvaru m1y1 + . . +mqyq +r
takový, že sentence ∀y(t(y) = u(y)) je dokazatelná v teorii celočíselného sčítání.
Pomocí numerálů a termů tvaru my můžeme formulovat zbývající axiomy (schémata)
teorie celočíselného sčítání:
Ad5: ∀x(mx = my → x = y), je-li m ≥ 1,
Ad6: ∀x(mx = k), je-li 0 < k < m,
Ad7: ∀x∃y(x = my ∨ x = my + 1 ∨ . . ∨ x = my + m − 1), je-li m ≥ 1.
Výslednou teorii s axiomy Ad1–Ad7 označme IAdd (integer addition). Schéma Ad7
lze chápat jako axiom o dělení se zbytkem: každé číslo x lze dělit číslem m ≥ 1,
výsledkem je podíl y a zbytek, který je menší než dělitel m. Protože mezi symboly
jazyka není symbol pro uspořádání, nelze napsat přímo, že zbytek je menší než m.
Místo toho jsou všechny zbytky menší než m vyjmenovány. Zdůrazněme pro jistotu,
236 3 Predikátová logika
že my i m jsou zkratky, které neznamenají rozšíření jazyka. V jazyce teorie IAdd
nemáme násobení a nemůžeme v něm vyjádřit fakt, že každé číslo x lze dělit každým
nenulovým číslem z. Pro každé (metamatematické) číslo m ≥ 1 ale můžeme (vždy
jinou sentencí) vyjádřit, že každé číslo x lze dělit se zbytkem číslem m. Je zřejmé,
že všechny axiomy Ad1–Ad7 platí ve struktuře Z, +, 0, 1 celých čísel se sčítáním,
nulou a jedničkou.
Konzervativní rozšíření teorie IAdd, o kterém postupně dokážeme, že připouští
eliminaci kvantiﬁkátorů, získáme přidáním nekonečně mnoha binárních predikátových
symbolů =n, kde n ≥ 1 je přirozené číslo. Predikát =n je deﬁnován axiomem
∀x∀y(x =n y ≡ ∃v(x + nv = y)).
Zápis x =n y čteme číslo x je n-kongruentní s číslem y. Nechť dále L+
IAdd označuje
jazyk {+, 0, 1, =1, =2, . . . } vzniklý přidáním právě deﬁnovaných binárních symbolů
k jazyku LIAdd = {+, 0, 1} teorie IAdd.
Lemma 3.5.10 Následující sentence jsou v teorii IAdd dokazatelné pro libovolná
čísla n ≥ 1 a k ≥ 1.
(a) ∀x∀y∀z(y + x = z + x ≡ y = z), (e) ∀x∀y∀z(y+x =n z+x ≡ y =n z),
(b) ∀x(x =n x), (f) ∀x∀y(kx = ky ≡ x = y),
(c) ∀x∀y(x =n y → y =n x), (g) ∀x∀y(kx =kn ky ≡ x =n y),
(d) ∀x∀y∀z(x =n y & y =n z → x =n z), (h) ∀x∀y(x =kn y → x =n y).
Důkaz Sentenci (c) lze dokázat takto:
Nechť x =n y. Dle deﬁnice symbolu =n existuje v takové, že x + nv = y.
Vezměme z opačné k v a přičtěme je n-krát na obě strany rovnosti. Dostaneme
x + nv + nz = y + nz a x = y + nz. Tedy y =n x.
Zbývající úvahy jsou podobné a ponecháváme je na čtenáři. QED
Lemma 3.5.11 Následující sentence jsou v teorii IAdd dokazatelné pro libovolné
číslo n ≥ 1 a pro libovolná m a r.
(a) ∀x∀y(m(x + y) = mx + my), (e) m = r, když m = r,
(b) m + r = m + r, (f) m =n r, když n dělí m − r,
(c) mr = mr, (g) ¬(m =n r), když n nedělí m − r.
(d) ∀x(m(rx) = (mr)x),
Důkaz Důkazy sentencí (a)–(d) jsou jasné, termy na obou stranách rovnosti se liší
nanejvýš pořadím členů a umístěním závorek. Malý trik je v důkazu sentence (e).
Předpokládejme například r < m a uvažujme v teorii IAdd:
Nechť m = r, tj. m − r +r = r. Dle (a) lemmatu 3.5.10 platí m − r = 0. Dále
platí m − r + 1 = 1 a (m − r + 1)1 = 1. To je spor s axiomem Ad6.
3.5 Eliminace kvantiﬁkátorů 237
Důkaz sentence (f) ponecháváme na čtenáři, použije se již dokázaná sentence (c).
Dokažme ještě (g). Předpokládejme r ≤ m a dělme rozdíl m−r se zbytkem číslem n:
m−r = nq+k, k < n. Protože n nedělí m−r, máme k = 0. Uvažujme v teorii IAdd:
Nechť m =n r. Pak m − r + r =n r, dále m − r =n 0, a také nq + k =n 0.
Dle (f) platí nq =n 0. Z (c) a (d) lemmatu 3.5.10 plyne nq =n nq + k.
Z toho dále plyne 0 =n k. Tedy existuje v takové, že nv = k. To je spor
s axiomem Ad6.
QED
Eliminace kvantiﬁkátorů pro teorii IAdd (přesněji řečeno pro její rozšíření o
deﬁnice symbolů =n) se nyní dokáže podobně jako pro teorii DOS. Domluvme se,
že formulím tvaru t = u, t = u, t =n u a ¬(t =n u) říkáme literály. To je ve shodě
s terminologií, kterou jsme v kapitole 2 užívali v souvislosti s výrokovou logikou.
Lemma 3.5.12 Nechť A(x, y1, . . , yq) je konjunkce literálů v jazyce teorie IAdd
taková, že každý literál v A obsahující proměnnou x má jeden z tvarů x = t(y),
nebo x = t(y), nebo x =n t(y), kde t je term neobsahující x. Pak formule ∃xA je
v teorii IAdd ekvivalentní s otevřenou formulí, jejíž všechny volné proměnné jsou
mezi y1, . . , yq.
Důkaz Je-li mezi literály formule A obsahujícími x alespoň jedna rovnost, pak A
má tvar x = t(y) & B(x, y) a formule ∃xA je ekvivalentní s formulí B(t(y), y).
V opačném případě má formule A tvar
x =n1 t1(y) & . . & x =nk
tk(y) & x = u1(y) & . . & x = ur(y) & D(y),
kde termy ti(y) a uj(y) a formule D(y) neobsahují x. Zvolme číslo m, které je
společným násobkem čísel n1 . . , nk. Tvrdíme, že ∃xA je ekvivalentní s formulí
D(y) &
j<m
(j =n1 t1(y) & . . & j =nk
tk(y)). (∗)
Toto je důkaz jejich ekvivalence:
Nechť pro x a y1, . . , yq platí A(x, y). Dle axiomu Ad7 k x existuje y takové, že x
je rovno některému z čísel my, my+1 až my+m − 1. Tedy x je m-kongruentní
s některým z čísel 0, . . , m − 1.
Z x =m 0 a
k
i=1(x =ni
ti(y)) plyne
k
i=1(0 =ni ti(y)).
Z x =m 1 a
k
i=1(x =ni ti(y)) plyne
k
i=1(1 =ni
ti(y)).
...
Z x =m m − 1 a
k
i=1(x =ni ti(y)) plyne
k
i=1(m − 1 =ni ti(y)).
Přitom se uplatnila tvrzení (h), (c) a (d) lemmatu 3.5.10. Zjistili jsme, že platí
některá z podmínek
k
i=1(j =ni ti(y)), kde j < m, tedy platí (∗).
Nechť naopak pro y1, . . , yq platí podmínka (∗). Nechť j je ono z čísel 0 až
m − 1, pro které platí
k
i=1(j =ni ti(y)). Platí také
k
i=1(j + m =ni ti(y)),
238 3 Predikátová logika
k
i=1(j + 2m =ni ti(y)) až
k
i=1(j + rm =ni ti(y)). Alespoň jedno z r + 1
různých čísel j, j + m, . . , j + rm se liší od všech u1(y), . . , ur(y), a to lze zvolit
za x splňující podmínku A(x, y).
Druhou část důkazu, zdůvodnění implikace (∗)→∃xA, se nám podařilo zpřehlednit
díky malé nekorektnosti, která se skrývá v obratu nechť j je ono z čísel atd. Za tímto
obratem je třeba si představit m kroků tvaru když
k
i=1(0 =ni
ti(y)), pak ∃xA(x, y);
když
k
i=1(1 =ni ti(y)), pak ∃xA(x, y) atd. Bez takovéhoto mírně nekorektního
zkracování, zato méně přehledně, jsme napsali zdůvodnění implikace ∃xA → (∗).
QED
Příklad 3.5.13 Aplikujeme-li postup popsaný v důkazu předchozího lemmatu na
formuli
∃x(x =30 y1 & x =14 y2 & x =35 y3),
dostaneme s ní ekvivalentní otevřenou formuli
j<210
(j =30 y1 & j =14 y2 & j =35 y3).
Nezabýváme se faktem, že tato formule je zbytečně dlouhá. Použijí-li se podrobnější
úvahy o dělitelnosti celých čísel, lze nalézt formuli, která je dokonce kratší než
kterýkoliv z dvou set deseti členů naší disjunkce, viz cvičení 14.
Lemma 3.5.14 Nechť A(x, y1, . . , yq) je formule v jazyce L+
IAdd, která je konjunkcí
literálů tvaru t = s, nebo t = s, nebo t =n s. Pak formule ∃xA je v teorii
IAdd ekvivalentní s jistou otevřenou formulí, jejíž všechny volné proměnné jsou
mezi y1, . . , yq.
Důkaz Nechť formule A(x, y) je dána. Nejprve užitím tvrzení 3.5.10 (a) a (c)
převeďme formuli A na ekvivalentní formuli A1(x, y), ve které se proměnná x nikdy
nevyskytuje na pravé straně rovnosti, nerovnosti nebo kongruence. Když například
A je formule
x + y1 = 3x + 5 & 4x = y2 & 15x =7 9x + y2 + 2y3,
pak A1 je
2x + 5 = y1 & 4x = y2 & 6x =7 y2 + 2y3.
Dále užijme tvrzení 3.5.10 (f) a (g) a nalezněme formuli A2 ekvivalentní s A1, ve
které se x vyskytuje vždy pouze v kontextu „mx , kde m ≥ 1 je stejné pro všechny
výskyty x. V našem příkladu to znamená první, druhý a třetí literál formule A1
„násobit šesti, třemi a dvěma. Výslednou formulí A2 je formule
12x + 30 = 6y1 & 12x = 3y2 & 12x =14 2y2 + 4y3.
Nyní užijme vhodným způsobem tvrzení 3.5.10 (a) a (e) a nalezněme formuli A3
ekvivalentní s A2 takovou, že x se v A3 vyskytuje pouze v kontextu „mx+s(y) , kde
číslo m a term s(y) neobsahující x jsou společné pro všechny výskyty proměnné x.
3.5 Eliminace kvantiﬁkátorů 239
V našem příkladu lze vystačit s termem s(y) neobsahujícím proměnné y1, . . , yq a
za A3 vzít například formuli
12x + 30 = 6y1 & 12x + 30 = 3y2 + 30 & 12x + 30 =14 2y2 + 4y3 + 30.
Formule A3 je formule tvaru B(mx + s(y), y). Zvolme proměnnou z různou od x i
od všech y1, . . , yq. Formule ∃xA(x, y) je ekvivalentní s ∃z(z =m s(y) & B(z, y))
(cvičení), což je formule, která díky lemmatu 3.5.12 je ekvivalentní s otevřenou
formulí. QED
Lemma 3.5.15 Nechť ϕ je otevřená formule v jazyce L+
IAdd. Pak formule ∃xϕ je
v teorii IAdd ekvivalentní s jistou otevřenou formulí, která nemá jiné volné proměnné
než ty, které jsou volné také ve formuli ∃xϕ.
Důkaz Důkaz lemmatu 3.5.7 spočíval v tom, že mezi kroky převádějící formuli ϕ na
formuli v disjunktivním normálním tvaru jsme vložili krok, který odstranil všechny
literály s negací. Nyní postupujme obdobně až na to, že literály tvaru t = s
zůstanou beze změny, odstraníme pouze literály tvaru ¬(t =n s), a to využitím
ekvivalence
¬(t =n s ≡ t =n s + 1 ∨ . . ∨ t =n s + n − 1).
Domníváme se, že důkaz této ekvivalence lze ponechat za cvičení. Výsledkem je
formule tvaru A1 ∨ . . ∨ Ak, která je ekvivalentní s ϕ a v níž každá Ai je konjunkcí
literálů tvaru t = s, t = s a t =n s. Pak, stejně jako v důkazu lemmatu 3.5.7,
∃xϕ je ekvivalentní s ∃x(A1 ∨ . . ∨ Ak) a také s ∃xA1 ∨ . . ∨ ∃xAk. Každá ∃xAi
je dle lemmatu 3.5.14 ekvivalentní s otevřenou formulí. Tedy ∃xϕ je ekvivalentní
s otevřenou formulí a opět nepřibyly volné proměnné. QED
Lemma 3.5.16 Každá otevřená sentence v jazyce L+
IAdd je v teorii IAdd dokazatelná
nebo vyvratitelná.
Důkaz Ke každému uzavřenému termu t existuje (jediné) přirozené číslo m takové,
že rovnost t = m je dokazatelná v teorii IAdd. Každá atomická sentence je tedy
ekvivalentní se sentencí tvaru m = r nebo m =n r. Každá taková sentence je
dokazatelná nebo vyvratitelná díky tvrzením (e)–(g) lemmatu 3.5.11. Zbytek je
indukce dle počtu logických spojek, stejně jako v důkazu lemmatu 3.5.8. QED
Věta 3.5.17 Rozšíření teorie IAdd o deﬁnice symbolů =n připouští eliminaci kvantiﬁkátorů.
Teorie IAdd je úplná.
Důkaz je úplně stejný jako důkaz věty 3.5.9.
Náš poslední a nejsložitější příklad na eliminaci kvantiﬁkátorů se týká struktury
R = R, +, ·, 0, 1, < reálných čísel. Stejně jako pro strukturu N, 0, s, < a pro
strukturu Z, +, 0, 1 lze i pro strukturu R stanovit přehlednou množinu axiomů,
které v R platí a které dohromady tvoří teorii, jejíž úplnost lze dokázat eliminací
kvantiﬁkátorů. Tento fakt dokázal A. Tarski a je to jeden z nejvýznamnějších
240 3 Predikátová logika
výsledků moderní logiky. Postup, který si ukážeme, je založen na návodu v Rabinově
kapitole [70] příručky [4] a na Cohenově článku [12]. Použijeme také některé
myšlenky z [51].
Nejprve deﬁnujme teorii uspořádaných těles. Tato teorie má jazyk {+, ·, 0, 1, <},
axiomy R1–R10 teorie komutativních těles uvedené v oddílu 3.2 a dále následujících
pět axiomů týkajících se uspořádání:
R11: ∀x∀y∀z(x < y & y < z → x < z),
R12: ∀x∀y(x < y → ¬(y < x)),
R13: ∀x∀y(x < y ∨ x = y ∨ y < x),
R14: ∀x∀y∀z(y < z → y + x < z + x),
R15: ∀x∀y∀z(y < z & 0 < x → y · x < z · x).
Axiomy R11–R13 jsou totožné s axiomy LO1–LO3 teorie lineárního uspořádání.
Axiomy R14 a R15 postulují, že sčítání a násobení v rozumném smyslu zachovávají
uspořádání.
Objektům teorie uspořádaných těles říkáme stejně jako v oddílu 3.2 čísla, někdy
také body. Nejzákladnější fakty o počítání s čísly (tj. o vlastnostech operací + a ·),
které lze dokázat v teorii uspořádaných těles, jsme uvedli už v lemmatu 3.2.14.
Protože ke každému x existuje právě jedno y opačné k x, můžeme ono y opačné
k x označit −x. Jinými slovy, sentence ∀x∀y(y = −x ≡ y + x = 0) deﬁnuje
unární funkční symbol „− v souladu s větou 3.5.3. V následujícím lemmatu jsou
vyjmenovány nejzákladnější fakty, které lze v teorii uspořádaných těles dokázat o
uspořádání a o operaci „− . Zápis x − y je ovšem zkratka pro x + (−y). Číslům
větším než nula říkejme kladná, číslům menším než nula záporná. Bude-li se to
hodit, místo x < y budeme psát y > x. Stejně jako v teorii LO je zápis x ≤ y
zkratkou pro formuli x < y ∨ x = y.
Lemma 3.5.18 Následující sentence jsou dokazatelné v teorii uspořádaných těles.
(a) ∀x∀y(0 < x → (0 < x · y ≡ 0 < y)), (f) ∀x∀y(−(x − y) = y − x),
(b) ∀x∀y(x < 0 → (0 < x · y ≡ y < 0)), (g) ∀x(0 = x ≡ 0 < x2
),
(c) ∀x(x < 0 ≡ 0 < −x), (h) m < r, je-li m < r,
(d) ∀x(−(−x) = x), (i) ∀x∃y1∃y2(y1 < x & x < y2),
(e) ∀x∀y(x · (−y) = −(x · y)), (j) ∀x∀y(x < y → ∃z(x < z < y)).
Důkaz Předpokládáme, že všechny důkazy čtenář zná nebo si je dovede vymyslet.
Uvádíme jen několik nejdůležitějších myšlenek.
Platí-li v (c) x < 0, můžeme dle axiomu R14 přičíst −x na obě strany a dostaneme
0 < −x.
Protože −(x · y) je ono číslo, které přičteno k x · y dá nulu, v (e) stačí ověřit,
že x · (−y) + x · y = 0.
3.5 Eliminace kvantiﬁkátorů 241
V (g), platí-li x = 0, pak 0 < x nebo x < 0. Když 0 < x, axiom R15 dává
0 < x2
. Když x < 0, pak 0 < −x dle (c). Obě strany této nerovnosti můžeme
vynásobit kladným číslem −x, tedy 0 < (−x)2
. Platí tedy 0 < x2
, protože
(−x)2
= x2
dle (e).
Volbou x = 1 v (g) dostaneme 0 < 1. Z této nerovnosti plynou i ostatní instance
v (h).
Nechť z je inverzní k 2, tj. nechť z · 2 = 1. Snadno lze ověřit, že 0 < z a že je-li
x < y, pak také x < z · (x + y) < y. Tím je dokázáno (j).
QED
Z dokazatelnosti sentencí (i) a (j) je jasné, že je-li D, +, ·, 0, 1, < libovolný
model teorie uspořádaných těles, pak D, < je model teorie DNO. Každý model
teorie uspořádaných těles je tedy nekonečný. Dále je zřejmé, že struktury R i Q
jsou modely teorie uspořádaných těles. To je vše, co jsme schopni říci o modelech
této teorie. Protože o modelech už tady (téměř) mluvit nebudeme, domluvme se,
že písmena a, b, c, d, která obvykle značí prvky struktur, značí ve zbytku tohoto
oddílu proměnné, případně termy.
Teorie reálně uzavřených těles má jazyk stejný jako teorie uspořádaných těles,
axiomy R1–R15, a dále všechny sentence tvaru
R16: ∀y∀a∀b(a < b & t(a, y) · t(b, y) < 0 → ∃x(a < x < b & t(x, y) = 0)),
kde t je libovolný term v jazyce {+, ·, 0, 1, <}. Je zřejmé, že by se nic nestalo, kdybychom
mezi symboly termu t připustili i symbol „− . Z (a) a (b) lemmatu 3.5.18
plyne, že součin t(a, y) · t(b, y) je záporný, právě když čísla t(a, y) a t(b, y) jsou
obě nenulová a mají opačná znaménka. Z lemmatu 3.2.15 víme, že term t(x, y) je
vlastně polynom v x s koeﬁcienty, které jsou termy v y. Schéma R16 tedy tvrdí, že
je-li a < b a je-li f polynom takový, že čísla f(a) a f(b) mají opačná znaménka, pak f
má kořen v intervalu (a, b). Teorii s axiomy R1–R16 značíme RCF (real closed ﬁelds).
Snadno lze zdůvodnit, že struktura Q není modelem teorie RCF. Vezmeme-li například
term x2
− 2 za t(x), platí (tj. v RCF lze dokázat, že) t(1) · t(2) < 0, ale mezi
jedničkou a dvojkou neexistuje racionální číslo x takové, že t(x) = 0. Kdybychom
se museli obejít bez odčítání, zvolili bychom term x2
+ y. Ten v Q také porušuje
schéma R16. O zdůvodnění, proč schéma R16 platí v R, se ještě zmíníme.
Sentenci
∀z0∀z1∀z2∀x0∀x1∀x2(¬(z0 = 0 & z1 = 0 & z2 = 0) &
& z0 · x2
0 + z1 · x0 + z2 = 0
& z0 · x2
1 + z1 · x1 + z2 = 0
& z0 · x2
2 + z1 · x2 + z2 = 0
→ x0 = x1 ∨ x0 = x2 ∨ x1 = x2)
lze číst každý netriviální polynom stupně 2 má nejvýše dva různé kořeny. Označme
tuto sentenci ρ2. Naprosto analogicky lze pro každé n ≥ 0 napsat sentenci ρn,
242 3 Predikátová logika
která tvrdí, že každý netriviální polynom stupně n má nejvýše n různých kořenů.
Sentence ρn má v závorce v prvním řádku negaci (n + 1)-členné konjunkce, pak
n+1 řádků vyjadřujících, že x0 až xn jsou kořeny polynomu s koeﬁcienty z0, . . , zn,
a v posledním řádku disjunkci s n+1
2 členy vyjadřující, že některá dvě čísla mezi
x0 až xn jsou si rovna. Netriviální polynom je ovšem takový, jehož koeﬁcienty nejsou
samé nuly. Protože o hodnotách nebo kořenech polynomu s koeﬁcienty z0, . . , zn
mluvíme uvnitř teorie RCF, ale o stupni polynomu mluvíme na metamatematické
úrovni, neklademe si podmínku (na rozdíl od toho, co je běžné v algebře), že nejvyšší
koeﬁcient polynomu je nenulový. Polynom stupně n je tedy pro nás libovolná
(n + 1)-tice z0, . . , zn a za touto (n + 1)-ticí vidíme term z0 · xn
+ . . + zn.
K důkazu sentencí ρn použijeme následující lemma, které lze označit jako lemma
o dělení polynomu lineárním faktorem.
Lemma 3.5.19 Nechť n ≥ 1 a nechť t0(y), . . , tn(y) a u(y) jsou termy neobsahující
proměnnou x. Pak existují termy s0(y), . . , sn−1(y) neobsahující x takové, že
označíme-li f(x) polynom s koeﬁcienty t0(y), . . , tn(y) a označíme-li g(x) polynom
s koeﬁcienty s0(y), . . , sn−1(y), je sentence
∀y∀x(f(x) = (x − u) · g(x) + f(u))
dokazatelná v teorii RCF.
Důkaz Nechť n a termy ti(y) a u(y) jsou dány. Zvolme za s0(y), s1(y) až sn−1(y)
termy t0(y), t0(y)·u(y)+t1(y) až t0(y)·un−1
(y)+t1(y)·un−2
(y)+ . . +tn−1(y). Pišme
ti a u místo ti(y) a u(y), vynechme všechny symboly „· a dokažme požadovanou
sentenci počítáním v teorii RCF:
(x − u)[t0xn−1
+ (t0u + t1)xn−2
+ . . + (t0un−1
+ . . + tn−1)] + f(u) =
= t0xn
+ (t0u + t1)xn−1
+ . . + (t0un−1
+ . . + tn−1)x
− t0uxn−1
− (t0u2
+ t1u)xn−2
− . . − (t0un
+ . . + tn−1u) + f(u) =
= t0xn
+ t1xn−1
+ . . + tn−1x −
n−1
i=0 tiun−i
+
n
i=0 tiun−i
=
= t0xn
+ t1xn−1
+ . . + tn−1x + tn =
= f(x).
QED
Lemma 3.5.20 Sentenci ρn lze pro každé n ≥ 0 dokázat v teorii RCF.
Důkaz Když n = 0, pak n+1
2 = 0, disjunkce nula členů je spor, a ρn je sentence
∀z0(z0 = 0 & z0 = 0 → ⊥), kde ⊥ je onen spor. Tato sentence je v RCF
dokazatelná, netriviální polynom stupně nula opravdu nemá žádné kořeny.
Nechť n > 0 a nechť ρ0, . . , ρn−1 jsou již dokázány. Dokažme ρn:
Nechť jsou dány koeﬁcienty z0, . . , zn netriviálního polynomu f stupně n a nechť
f má n + 1 navzájem různých kořenů a0, . . , an. Když z0 = 0, pak a0, . . , an
3.5 Eliminace kvantiﬁkátorů 243
jsou zároveň různé kořeny polynomu stupně n − 1 s koeﬁcienty z1, . . , zn, což je
ale spor s ρn−1. Nechť tedy z0 = 0. Vezměme čísla z0, z0a0 + z1 atd., tj. čísla
tvaru
k
i=0 ziak−i
0 , kde 0 ≤ k < n. Z 3.5.19 víme, že tato čísla tvoří koeﬁcienty
polynomu g stupně n − 1, pro který platí ∀x(f(x) = (x − a0)g(x) + f(a0)).
Protože a0 je kořen polynomu f, máme ∀x(f(x) = (x − a0)g(x)). Když i = 0,
v součinu (ai − a0)g(ai) je první činitel nenulový. Celý součin je ale nulový,
protože ai je kořen polynomu f. Lemma 3.2.14(d) dává g(ai) = 0. Tedy
a1, . . , an je n navzájem různých kořenů polynomu g. Polynom g je netriviální,
protože má nenulový koeﬁcient z0. To je spor s ρn−1.
QED
Z lemmatu 3.5.20 okamžitě plyne, že polynom f stupně n je identicky nulový,
právě když je triviální, tj. právě když jeho koeﬁcienty jsou samé nuly.
Všimněme si, že v důkazech lemmat 3.5.19 a 3.5.20 jsme se obešli bez axiomů
R11–R16. Obě lemmata tedy platí i pro teorii komutativních těles. Lze tvrdit
ještě trochu víc: z axiomů teorie komutativních těles jsme nepotřebovali axiom R8
o existenci inverzních čísel, použili jsme jen jeho slabší důsledek vyjádřený tvrzením
(d) lemmatu 3.2.14.
Je-li f polynom stupně n ≥ 1 s koeﬁcienty z0, . . , zn, deﬁnujme jeho derivaci f
jako polynom stupně n − 1 s koeﬁcienty n · z0, n − 1 · z1 až zn−1. Je-li f polynom
stupně 0 s (jediným) koeﬁcientem z0, deﬁnujme jeho derivaci f jako polynom
stupně 0 s koeﬁcientem 0. V deﬁnici derivace jsme se tedy obešli bez pojmu limita,
což je možné díky tomu, že neuvažujeme jiné funkce než polynomy. Uvnitř
teorie RCF se na derivaci díváme nikoliv jako na jedinou operaci, ale jako na nekonečně
mnoho operací: derivace polynomů stupně n je operace z (n + 1)-tic do
max{1, n}-tic čísel. Derivace vyšších řádů deﬁnujeme jako obvykle: f(0)
= f,
f(k+1)
= (f(k)
) . Polynom f(k)
je k-tou derivací polynomu f. Má-li f stupeň n,
pak f(k)
je polynom stupně n − k pro k ≤ n, a f(k)
je identicky nulový polynom
pro k > n.
V následujících pěti lemmatech a jejich důkazech se dopouštíme nedůslednosti a
formalizovatelné podmínky a důkazy nevyznačujeme bezpatkovým písmem. Předpokládáme,
že čtenář dovede odlišit, co se děje na metamatematické úrovni a co
uvnitř teorie RCF. Ostatně na metamatematické úrovni se mluví vždy pouze o
stupních polynomů. K pečlivějšímu odlišení metamatematické a formální úrovně se
vrátíme za důkazem lemmatu 3.5.25, až budeme mluvit o eliminaci kvantiﬁkátorů
pro teorii RCF.
Lemma 3.5.21 Známá pravidla pro počítání derivací součtu a součinu
(f + g) = f + g a (f · g) = f · g + f · g
lze pro polynomy dokázat v teorii RCF.
Důkaz Obě rovnosti lze ověřit počítáním se sumami podobně jako v důkazu lemmatu
3.5.19 a předtím lemmatu 3.2.15. QED
244 3 Predikátová logika
Lemma 3.5.22 Mezi každými dvěma kořeny libovolného polynomu f stupně n leží
nějaký kořen polynomu f .
Důkaz Nechť stupeň n je dán, uvažujme v teorii RCF. Nechť pro čísla a a b platí
a < b a f(a) = f(b) = 0. Můžeme předpokládat, že f není identicky nulový. Dále
předpokládejme, že v intervalu (a, b) není žádný další kořen polynomu f. Jinak
bychom užili fakt, že všech kořenů je nejvýše n, a od dvojice a, b bychom přešli
k dvojici a0, b0 sousedních kořenů takových, že a ≤ a0 < b0 ≤ b.
Lemma 3.5.19 tvrdí, že z polynomu f můžeme vytknout činitele (x − a) a (x − b).
Vytýkání lze opakovat, dokud a nebo b je kořenem zbývajícího polynomu. Existuje
tedy polynom g takový, že pro každé x platí f(x) = (x − a)m
(x − b)r
g(x). Přitom
m, r ≥ 1 a g nemá žádné kořeny v intervalu [[a, b]]. Užijme lemma 3.5.21 a spočítejme
derivaci f polynomu f:
f (x) = m(x − a)m−1
(x − b)r
g(x) + r(x − a)m
(x − b)r−1
g(x) +
+ (x − a)m
(x − b)r
g (x) =
= (x − a)m−1
(x − b)r−1
[m(x − b)g(x) + r(x − a)g(x) + (x − a)(x − b)g (x)].
Označme h(x) polynom v hranaté závorce. Dosazení a a b dává h(a) = m(a−b)g(a)
a h(b) = r(b−a)g(b). Čísla g(a) a g(b) jsou nenulová. Kdyby čísla g(a) a g(b) měla
různá znaménka, dle axiomu R16 by g měl nějaký kořen v (a, b) a tento kořen by byl
zároveň kořenem polynomu f. Čísla g(a) a g(b) mají tedy stejná znaménka. Čísla
a − b a b − a mají ovšem různá znaménka. Tedy h(a) · h(b) < 0. Dle axiomu R16
polynom h má nějaký kořen v (a, b). Tento kořen je zároveň kořenem polynomu f .
QED
Lemma 3.5.23 Když a < b a f je polynom, pak existuje číslo ξ ∈ (a, b) takové,
že f(b) − f(a) = f (ξ)(b − a).
Důkaz Nechť a, b a f jsou dány. Vezměme číslo ε takové, že ε(b−a) = 1. Uvažujme
polynom g deﬁnovaný předpisem
g(x) = f(x) − f(a) − ε(f(b) − f(a))(x − a).
Platí g (x) = f (x) − ε(f(b) − f(a)) a dále g(a) = 0 a g(b) = 0. Dle lemmatu 3.5.22
existuje číslo ξ ∈ (a, b) takové, že g (ξ) = 0. Tedy 0 = f (ξ) − ε(f(b) − f(a)), dále
ε(f(b) − f(a)) = f (ξ), a tedy opravdu f(b) − f(a) = f (ξ)(b − a). QED
Lemma 3.5.22 je známo jako Rolleova věta. Důkaz, který jsme uvedli, vznikl
přizpůsobením důkazu Sturmovy věty, který je uveden v knize [97]. Sturmova
věta umožňuje určit počet kořenů polynomu f stupně n v intervalu (a, b), známe-li
znaménka čísel f(i)
(a) a f(i)
(b), kde 0 ≤ i ≤ n. Lemma 3.5.23 je věta o střední
hodnotě. Její důkaz lze označit jako „obvyklý .
Deﬁnujme v teorii RCF pravé a levé okolí čísla (bodu). Pravé okolí bodu a je
libovolný interval (a, b), kde a < b. Pravé okolí „nevlastního bodu −∞ je libovolný
3.5 Eliminace kvantiﬁkátorů 245
interval tvaru (−∞, b), tj. množina { x ; x < b }. Analogicky se deﬁnuje levé okolí
bodu a levé okolí nevlastního bodu +∞. Dále deﬁnujme funkci signum: sgn(x) = 1
pro x > 0, sgn(x) = −1 pro x < 0, sgn(0) = 0. Místo hodnot 1, −1 a 0 funkce
signum budeme někdy psát +, − a 0.
Axiom R16 tvrdí, že je-li f polynom, pak mezi každými dvěma body, ve kterých
má funkce sgn(f(x)) hodnoty + a −, existuje nějaký další bod, ve kterém má
funkce sgn(f(x)) hodnotu 0. Je-li tedy číslo a libovolné a b > a je nejmenší kořen
polynomu f větší než a, buď všechny hodnoty funkce sgn(f(x)) v intervalu (a, b)
jsou +, nebo jsou všechny −. Z toho dále plyne, že je-li f libovolný polynom a
a libovolný bod, funkce sgn(f(x)) je konstantní v (jistém) pravém okolí bodu a:
buď je f identicky nulový, a v tom případě všechny hodnoty funkce sgn(f(x)) jsou
nuly, nebo sgn(f(x)) má tutéž hodnotu + až do nejbližšího většího kořenu (nebo
do +∞, neexistují-li kořeny větší než a), nebo sgn(f(x)) má tutéž hodnotu − až
do nejbližšího většího kořenu (nebo do +∞). Je-li f(a) = 0, pak ovšem sgn(f(x))
má v pravém okolí bodu a hodnotu sgn(f(a)). Následující lemma umožňuje určit
hodnotu funkce sgn(f(x)) v pravém okolí bodu a bez ohledu na to, zda f(a) = 0.
Lemma 3.5.25 má podobný účel, umožňuje určit hodnotu funkce sgn(f(x)) v okolí
nevlastních bodů −∞ a +∞.
Lemma 3.5.24 Nechť a je číslo a nechť f je polynom stupně n. Když všechna
čísla f(a), f (a), . . , f(n)
(a) jsou nuly, pak f je identicky nulový. Když první nenulové
číslo v posloupnosti f(a), f (a), . . , f(n)
(a) je kladné (záporné), pak f je kladný
(resp. záporný) v pravém okolí bodu a.
Důkaz Označme z0, . . , zn koeﬁcienty polynomu f a spočítejme f a f :
f (x) = nz0xn−1
+ n − 1z1xn−2
+ . . + zn−1,
f (x) = n(n − 1)z0xn−2
+ (n − 1)(n − 2)z1xn−3
+ . . + 2zn−2.
Obecně pro k-tou derivaci platí
f(k)
(x) =
n−k
i=0
(n − i)!/(n − k)! zixn−k−i
.
Dosadíme-li x := a, snadno zjistíme, že všechna čísla f(k)
(a) mohou být najednou
nulová jen v případě, kdy všechny koeﬁcienty z0, . . , zn jsou nuly: f(n)
(a) = n! z0, a
platí-li f(n)
(a) = 0, pak i z0 = 0, dále f(n−1)
(a) = n!/1! z0a + (n − 1)! z1, a platí-li
f(n)
(a) = 0 i f(n−1)
(a) = 0, pak i z0 = 0 a z1 = 0 atd.
Nechť 0 ≤ k ≤ n, nechť f(a) = f (a) = . . = f(k−1)
(a) = 0, nechť f(k)
(a) > 0.
Zvolme b takové, že pro každé x ∈ (a, b) je f(k)
(x) > 0. Platí-li k = 0, jsme hotovi,
f je kladný v (a, b). Jinak vezměme v úvahu toto pomocné tvrzení: je-li g polynom
takový, že g(a) = 0 a jeho derivace g je kladná v (a, b), pak g je kladný v (a, b).
Skutečně, pokud pro nějaké x ∈ (a, b) platí g(x) < 0, pak dle 3.5.23 pro nějaké
ξ ∈ (a, x) platí g(x) − g(a) = g (ξ)(x − a), a z g(a) = 0, g(x) < 0 a x − a > 0
246 3 Predikátová logika
plyne g (ξ) < 0. Užijeme-li toto pomocné tvrzení na f(k−1)
, f(k−2)
až f v roli g,
dostaneme, že f je kladný v (a, b).
Důkaz tvrzení, že je-li první nenulové číslo v posloupnosti f(a), f (a), . . , f(n)
(a)
záporné, pak f je záporný v pravém okolí bodu a, je naprosto analogický. QED
Lemma 3.5.25 Nechť f je netriviální polynom stupně n s koeﬁcienty z0, . . , zn,
nechť zi je první koeﬁcient v posloupnosti z0, . . , zn, který je nenulový. Pak existuje
w > 0 takové, že pro všechna x > w platí sgn(f(x)) = sgn(zi) a pro všechna
x < −w platí sgn(f(x)) = sgn((−1)n
zi).
Důkaz Deﬁnujme pro účely tohoto důkazu a případně některých cvičení absolutní
hodnotu: |x| je ono z čísel x a −x, které je nezáporné. Snadno lze ověřit, že (dokazatelně
v teorii uspořádaných těles) platí obvyklá pravidla pro počítání s absolutními
hodnotami: |x · y| = |x| · |y| a |x + y| ≤ |x| + |y|.
Nechť jsou dány koeﬁcienty z0, . . , zn netriviálního polynomu f. Můžeme předpokládat,
že první nenulový koeﬁcient je z0. Dále předpokládejme například, že n je
liché a že z0 > 0. Tedy z0 je kladné a (−1)n
z0 je záporné. Máme najít w > 0 takové,
že pro všechna x > w platí z0xn
> −(z1xn−1
+ . . +zn) a pro všechna x < −w platí
z0xn
< −(z1xn−1
+ . . + zn). Protože pro x < −w je |z0xn
| = −z0xn
, stačí zdůvodnit
najednou, že |z1xn−1
+ . . + zn| < z0|x|n
. Pro x ≥ 1 platí |zixi
| ≤ |zixn−1
|
pro každé i ≤ n − 1, tedy
|z1xn−1
+ . . + zn| ≤ (|z1| + . . + |zn|) · |x|n−1
. (∗)
Označme ε číslo inverzní k z0. Platí ε > 0 a ε·z0 = 1. Je-li |x| > ε·(|z1|+ . . +|zn|),
pak
ε · z0 · (|z1| + . . + |zn|) · |x|n−1
< z0 · |x|n
. (∗∗)
Z (∗) a (∗∗) plyne, že za w můžeme vzít číslo max{1, ε · (|z1| + . . + |zn|)}, neboť
je-li |x| > w, opravdu platí |z1xn−1
+ . . + zn| < z0 · |x|n
. QED
Tím máme pohromadě všechna tvrzení o dokazatelnosti v teorii RCF, která
budeme potřebovat, a můžeme se vrátit k logice, tj. deﬁnovat konzervativní rozšíření
teorie RCF a uvažovat o eliminaci kvantiﬁkátorů.
Nechť 1 ≤ i ≤ n. V teorii RCF deﬁnujme, že NRn,i(z0, . . , zn), jestliže polynom
z0xn
+ . . + zn není identicky nulový a má alespoň i navzájem různých kořenů.
Symbol NRn,i je (n + 1)-ární predikátový symbol. Dále v teorii RCF deﬁnujme, že
číslo ξn,i(z0, . . , zn) je i-tý nejmenší kořen polynomu f(x) = z0xn
+ . . + zn, pokud
NRn,i(z0, . . , zn), a ξn,i(z0, . . , zn) je nula v ostatních případech (tj. kdy f je identicky
nulový, nebo má méně než i kořenů). Symbol ξn,i je (n + 1)-ární funkční symbol.
Označme LRCF jazyk {+, ·, 0, 1, <, −} (tj. počítejme i unární symbol „− k základním
symbolům teorie RCF) a označme L+
RCF jazyk vzniklý přidáním všech symbolů
NRn,i a ξn,i, kde 1 ≤ i ≤ n, k jazyku LRCF. Označme RCF+
konzervativní rozšíření
teorie RCF o právě uvedené deﬁnice symbolů NRn,i a ξn,i.
3.5 Eliminace kvantiﬁkátorů 247
Příklad 3.5.26 Je-li z > 0, pak ξ2,2(1, 0, −z) je to, co se obvykle zapisuje jako
√
z.
Je-li z ≤ 0, pak v teorii RCF víme, že ¬NR2,2(1, 0, −z) a ξ2,2(1, 0, −z) = 0.
Termům obsahujícím symboly ξn,i říkejme algebraické termy. Atomická algebraická
formule je každá atomická formule jazyka LRCF a dále každá formule jazyka
L+
RCF, která má některý z následujících tří tvarů:
• c0(y) · ξm
n,i(a0(y), . . , an(y)) + c1(y) · ξm−1
n,i (a0(y), . . , an(y)) + . . + cm(y) 0,
• ξn,i(a0(y), . . , an(y)) < ξm,k(b0(y), . . , bm(y)),
• NRn,i(a0(y), . . , an(y)),
kde je jeden ze symbolů <, = nebo > a ai(y), bi(y) a ci(y) jsou termy, které
jsou sestaveny z proměnných y1, . . , yq pomocí symbolů +, ·, 0, 1, −. Algebraická
formule je formule sestavená z atomických algebraických formulí pomocí logických
spojek. Dále budeme pro stručnost většinou vypouštět y. Protože (n + 1)-tici
argumentů symbolu NRn,i a ξn,i vždy interpretujeme jako koeﬁcienty polynomu,
budeme psát například f místo a0, . . , an. Atomické algebraické formule jsou tedy
formule tvaru g(ξn,i(f)) 0, nebo ξn,i(f) < ξm,k(g), nebo NRn,i(f), kde f a g
jsou polynomy, jejichž koeﬁcienty jsou termy jazyka LRCF, a dále všechny atomické
formule jazyka LRCF.
Deﬁnujme řád algebraických formulí: řád atomické formule neobsahující symboly
NRn,i a ξn,i je 0, řád formulí g(ξn,i(f)) 0 a NRn,i(f) je n, řád formule
ξn,i(f) < ξm,k(g) je max{n, m}, řád algebraické formule je maximum řádů
všech jejích atomických podformulí.
Příklad 3.5.27 Formule ξn,i(f) · ξm,k(g) > 0 ani formule tvaru NRm,k(ξn,i(f), . .)
není algebraickou formulí. Jsou-li f a g polynomy, jejichž koeﬁcienty neobsahují
algebraické termy, a má-li f stupeň n, pak formule polynom g je pozitivní v pravém
okolí bodu ξn,i(f) je podle lemmatu 3.5.24 algebraickou formulí řádu n.
Term tvaru ξn,i(. .) se v algebraické formuli nikdy nemůže vyskytnout uvnitř
termu tvaru ξm,k(. .) ani uvnitř atomické formule tvaru NRm,k(. .). Algebraické
formule neobsahují kvantiﬁkátory. Každá atomická podformule algebraické formule
obsahuje nejvýše jeden term tvaru ξn,i(f) (který se v ní může vyskytovat vícekrát)
s výjimkou formule tvaru ξn,i(f) < ξm,k(g), která může obsahovat dva různé
algebraické termy.
Lemma 3.5.28 Každá algebraická formule A řádu n ≥ 1 je ekvivalentní s algebraickou
formulí B řádu nejvýše n takovou, že v každé atomické podformuli formule
B tvaru g(ξn,i(f)) 0 má polynom g nižší stupeň než polynom f.
Důkaz Nechť g(ξn,i(f)) > 0 je některá podformule formule A taková, že pro
stupeň m polynomu g platí m ≥ n. Nechť axm
je nejvyšší člen polynomu g a
nechť bxn
je nejvyšší člen polynomu f. Polynom b2
g(x) − abxm−n
f(x) je polynom
stupně m, jehož nejvyšší koeﬁcient (tj. koeﬁcient u xm
) je 0. Označme g1(x)
248 3 Predikátová logika
polynom stupně m − 1 vzniklý odstraněním onoho nejvyššího (nulového) členu
z polynomu b2
g(x) − abxm−n
f(x). Označme dále f1(x) polynom stupně n − 1
vzniklý odstraněním nejvyššího (nulového) členu z polynomu f(x) − bxn
, tj. odstraněním
nejvyššího členu z polynomu f(x). Z předpokladu b = 0 v teorii RCF
vyplývá ekvivalence g(ξ) > 0 ≡ b2
g(ξ) > 0. Dále z předpokladu číslo ξ je kořenem
polynomu f v teorii RCF vyplývá ekvivalence b2
g(ξ) > 0 ≡ g1(ξ) > 0. Podformuli
g(ξn,i(f)) > 0 formule A můžeme tedy nahradit s ní ekvivalentní formulí
(¬NRn,i(f) & g(0) > 0) ∨
∨ (NRn,i(f) & b = 0 & g(ξn−1,i(f1)) > 0)
∨ (NRn,i(f) & b = 0 & g1(ξn,i(f)) > 0).
Touto záměnou se nezvýšil řád formule, neboť formule NRn,i(f) má řád n a formule
g(ξn−1,i(f1)) má řád n−1. Bylo-li m = n, snížil se počet nežádoucích formulí,
tj. formulí tvaru g(ξn,i(. .)) 0, které mají maximální možný řád n a v nichž polynom
g má stupeň m ≥ n. Bylo-li m > n, počet nežádoucích formulí zůstal
zachován, ale v jedné se snížil stupeň polynomu. Opakováním tohoto postupu dospějeme
k požadované formuli. Stejně se uvažuje, když je jeden ze symbolů
> a =. QED
Nechť α < β jsou dva sousední kořeny derivace f polynomu f. Užitím axiomu
R16 a lemmat 3.5.22 a 3.5.23 lze snadno ověřit, že (i) je-li f(α) = 0, pak
α je jediný kořen polynomu f v [[α, β]], (ii) je-li f(β) = 0, pak β je jediný kořen
polynomu f v [[α, β]], (iii) mají-li čísla f(α) a f(β) opačná nenulová znaménka,
pak f má v (α, β) kořen, který je jediným kořenem v [[α, β]], a (iv) mají-li čísla
f(α) a f(β) totéž nenulové znaménko, pak f nemá žádný kořen v [[α, β]]. Například
tvrzení (iv) se zdůvodní následovně. Nechť f(α) a f(β) mají totéž nenulové
znaménko a nechť x ∈ (α, β) je kořen polynomu f. Pak dle 3.5.23 existují čísla
η1 ∈ (α, x) a η2 ∈ (x, β), ve kterých má f různá a nenulová znaménka, a v (η1, η2)
je nějaký kořen polynomu f , což je spor s předpokladem, že α a β jsou sousední
kořeny polynomu f .
Když β je největší kořen polynomu f , pak f má v intervalu [[β, +∞) nejvýše
jeden kořen, a má-li f(β) totéž znaménko, jako mají všechna čísla f(x) pro dost
velká x (ve smyslu lemmatu 3.5.25), pak f nemá v [[β, +∞) žádný kořen. Analogická
tvrzení lze odvodit o kořenech polynomu f vlevo od nejmenšího kořenu polynomu f .
Můžeme tedy shrnout, že mezi každými dvěma kořeny polynomu f a také před
prvním a za posledním je vždy nejvýše jeden kořen polynomu f. Odpověď na
otázku, zda je právě jeden, je určena znaménky polynomu f v kořenech jeho derivace
f a v okolí nevlastních bodů −∞ a +∞.
Lemma 3.5.29 Každá formule NRn,i(a0, . . , an), kde 1 ≤ i ≤ n, je ekvivalentní
s algebraickou formulí řádu menšího než n.
Důkaz Je-li n = 1, pak formule NR1,1(a0, a1), tj. formule polynom a0x + a1 je
netriviální a má alespoň jeden kořen, je ekvivalentní s formulí a0 = 0, což je alge-
3.5 Eliminace kvantiﬁkátorů 249
−∞ + − ∗ ∗ + − + − + −
ξ2,1(f ) − + 0 0 − + − + ∗ ∗
ξ2,2(f ) + − 0 0 + − − +
+∞ + − − + ∗ ∗ ∗ ∗ + −
Obrázek 3.5.1: Určení počtu kořenů polynomu
braická formule řádu 0. Předpokládejme tedy nadále, že n > 1. Označme f polynom
s koeﬁcienty a0, . . , an. Jeho derivace f má koeﬁcienty na0, n − 1a1, . . , an−1.
Máme za úkol vyjádřit podmínku NRn,i(f) bez užití symbolů NRm,k(. .) a ξm,k(. .),
kde m ≥ n.
Utvořme tabulku s n + 1 řádky označenými −∞, ξn−1,1(f ),. .,ξn−1,n−1(f ), +∞,
ve které sloupce odpovídají všem příznivým kombinacím znamének polynomu f
v bodech −∞, ξn−1,1(f ),. .,ξn−1,n−1(f ), +∞. Příznivá kombinace je taková, při
které f nutně má alespoň i kořenů. Například pro n = 3 a i = 2 je tato tabulka
uvedena na obrázku 3.5.1. Hvězdičky označují hodnoty, na kterých nezáleží. První
dva sloupce odpovídají případům, kdy f má jeden kořen (pole příslušná ke ξ2,2(f )
jsou prázdná), třetí až šestý sloupec odpovídají případům, kdy f má dva kořeny,
z nichž jeden je zároveň kořenem polynomu f, a sedmý až desátý sloupec odpovídají
případům, kdy žádný ze dvou kořenů polynom f není současně kořenem
polynomu f. V našem případě, a obecně kdykoliv i ≥ 2, žádné příznivé kombinace
neodpovídají případu, kdy f nemá kořeny, ani případu, kdy f má jen jeden kořen,
který je zároveň kořenem polynomu f. Tehdy má totiž f nejvýše jeden kořen.
Při konstrukci tabulky využíváme fakt, že v posloupnosti znamének sgn(f(−∞)),
sgn f(ξn−1,1(f )) až sgn f(ξn−1,n−1(f )) a sgn(f(+∞)) nemůže být nula na začátku
ani na konci a nemohou se v ní vyskytnout dvě nuly těsně za sebou.
Máme-li tabulku, snadno sestavíme z atomických formulí jazyka LRCF a z formulí
tvaru NRn−1,k(f ) a f(ξn−1,k(f )) 0, kde 1 ≤ k ≤ n − 1, algebraickou formuli
řádu n − 1 ekvivalentní s původní formulí NRn,i(f). V našem příkladu s n = 3
a i = 2 je to formule
(NR2,1(f ) & ¬NR2,2(f ) & f(ξ2,1(f )) = 0 &
& sgn f(−∞) = sgn f(ξ2,1(f )) & sgn f(ξ2,1(f )) = sgn f(+∞)) ∨
∨ (NR2,2(f ) & f(ξ2,1(f )) = 0 & sgn f(ξ2,2(f )) = sgn f(+∞))
∨ (NR2,2(f ) & f(ξ2,2(f )) = 0 & sgn f(−∞) = sgn f(ξ2,1(f )))
∨ ( . . . podobně pro sedmý až desátý sloupec tabulky . . . ).
Zápis jsme trochu zkrátili použitím funkce sgn. Například v prvním disjunktu, kde
se probírá případ, kdy f má právě jeden kořen, zápis sgn f(ξ2,1(f )) = sgn f(+∞)
značí disjunkci buď f(ξ2,1(f )) > 0 a polynom f je záporný v levém okolí bodu +∞,
nebo f(ξ2,1(f )) < 0 a polynom f je kladný v levém okolí bodu +∞. Formule poly-
250 3 Predikátová logika
α1 α2 α3 α4
α5 α6
Obrázek 3.5.2: Kořeny derivace a průběh polynomu
nom f je takový a takový v levém okolí bodu +∞ je algebraickou formulí řádu 0 díky
lemmatu 3.5.25. QED
Porovnejme statický popis všech příznivých případů, který vyjadřuje formule
sestrojená v důkazu lemmatu 3.5.29, s následujícím „algoritmem pro určení počtu
kořenů polynomu f:
Urči počet r kořenů polynomu f . Označ tyto kořeny α1, . . , αr. Dále polož
a0 = −∞, ar+1 = +∞. Urči počet nul plus počet změn v posloupnosti
sgn f(α0) až sgn f(αr+1), přičemž za změnu se považuje pouze změna z „+
na „− nebo naopak. Výsledek je počet kořenů polynomu f.
Například derivace polynomu f z obrázku 3.5.2 má šest kořenů α1, . . , α6 a posloupnost
znamének polynomu f v bodech α0, . . , α7 je posloupnost +, +, +, 0, +, −, −, +,
ve které je jedna nula a dvě změny. Náš „algoritmus tedy pro polynom z obrázku
3.5.2 určil správně, že má tři kořeny. Uvozovky píšeme proto, že o skutečný
algoritmus tu ovšem nejde: nepracuje se s konečnými posloupnostmi symbolů, ale
s abstraktními objekty formální teorie. Tvrdíme ale, že takovýto pseudoalgoritmus
je stejně dobrý jako formule, kterou jsme sestrojili v důkazu lemmatu 3.5.29:
z návodu, jak převést platnost podmínky NRn,i(f) na platnost podmínek tvaru
NRn−1,k(. .) a g(ξn−1,k(. .)) 0, lze sestrojit formuli, která podmínku NRn,i(f) vyjádří
jako booleovskou kombinaci podmínek tvaru NRn−1,k(. .) a g(ξn−1,k(. .)) 0.
V důkazu následujícího lemmatu se tedy spokojíme s uvedením stručného a názorného
pseudoalgoritmu a spolehneme se na to, že čtenář si za ním umí představit
algebraickou formuli řádu n − 1.
Lemma 3.5.30 Každá algebraická formule je ekvivalentní s jistou otevřenou formulí
v jazyce LRCF.
Důkaz Dokažme indukcí podle n, že každá algebraická formule řádu n je ekvivalentní
s jistou otevřenou formulí v jazyce LRCF. Pro n = 0 je to pravda, algebraické
formule řádu 0 jsou otevřenými formulemi v jazyce LRCF. Zbývá tedy dokázat, že
každá algebraická formule A řádu n je ekvivalentní s jistou algebraickou formulí B
3.5 Eliminace kvantiﬁkátorů 251
řádu menšího než n. Toto tvrzení dokažme opět indukcí, a to podle počtu atomických
algebraických podformulí formule A, jejichž řád je n. Stačí tedy dokázat,
že každá algebraická formule A řádu n ≥ 1 je ekvivalentní s jistou algebraickou
formulí B, jejíž řád je nejvýše n a která má méně atomických algebraických podformulí
řádu n, než má formule A. Přitom nevadí, má-li B více atomických podformulí
řádů menších než n.
Nechť tedy A je dána a nechť D je některá její atomická podformule řádu n. Tvrdíme,
že formuli D lze nahradit s ní ekvivalentní formulí řádu menšího než n. Formule
D má jeden z tvarů NRn,i(f), nebo g(ξn,i(f)) 0, nebo ξn,i(f) ξm,k(g),
kde 0 < m ≤ n. Je-li D tvaru NRn,i(f), jsme hotovi, D je ekvivalentní s algebraickou
formulí řádu menšího než n díky lemmatu 3.5.29.
Uvažujme tedy případ, kdy D má tvar g(ξn,i(f)) 0. Vzhledem k lemmatu 3.5.28
můžeme předpokládat, že g má stupeň n nižší než stupeň n polynomu f. Má-li g
stupeň 0, formule g(ξn,i(f)) 0 je formule a0 0, kde a0 je jediný koeﬁcient polynomu
g. Předpokládejme tedy, že g má nenulový stupeň. Jak jsme se dohodli, stačí
napsat pseudoalgoritmus, který určí pravdivostní hodnotu formule g(ξn,i(f)) 0,
tj. který „vypočítá hodnotu sgn g(ξn,i(f)) pomocí „podprogramů , které počítají
pravdivostní hodnoty algebraických formulí řádů menších než n. Pišme ξ
místo ξn,i(f).
Urči kořeny α1, . . , αr polynomu f . Polož a0 = −∞, αr+1 = +∞. Zjisti
znaménka čísel f(α0), . . , f(αr). Nalezni j ∈ {0, . . , r} takové, že počet nul
plus počet změn v posloupnosti sgn f(α0) až sgn f(αj+1) je i a navíc platí
sgn f(αj+1) = 0. Neexistuje-li takové j, pak ¬NRn,i(f) a sgn g(ξ) = sgn g(0).
Jinak NRn,i(f).
Tím je znovu určena platnost podmínky NRn,i(f), postup byl téměř stejný jako
v lemmatu 3.5.29. Dále je určena hodnota sgn g(ξ) v případě, kdy ¬NRn,i(f).
Zbývající část pseudoalgoritmu pracuje za předpokladu, že NRn,i(f).
Protože NRn,i(f), číslo ξ je i-tým kořenem polynomu f a zároveň je jediným
kořenem polynomu f v intervalu [[αj, αj+1). Pokud f(αj) = 0 (což nemůže
nastat, je-li j = 0), platí ξ = αj a sgn g(ξ) = sgn g(αj).
Jinak platí αj < ξ. Číslo ξ je ovšem stále jediným kořenem polynomu f v intervalu
[[αj, αj+1).
Urči kořeny β1, . . , βl polynomu g. Polož β0 = −∞. Uvažuj všechna čísla
β ∈ {b0, . . , βl}, pro která platí některá z podmínek
- β ≤ αj,
- β ∈ (αj, αj+1) a sgn f(β) = sgn f(αj),
- β ∈ (αj, αj+1) a f(β) = 0.
Nechť βk je maximální takové β. Splňuje-li βk poslední podmínku, tj. platí-li
βk ∈ (αj, αj+1) a f(βk) = 0, musí být βk = ξ. V tom případě sgn(g(ξ)) = 0.
Jinak platí βk < ξ a βk je buď maximálním kořenem polynomu g v intervalu
(−∞, ξ]], nebo k = 0, βk = −∞ a g nemá kořeny v (−∞, ξ]]. V obou případech
252 3 Predikátová logika
se sgn g(ξ) pozná podle toho, jaké má g znaménko v pravém okolí bodu βk,
tedy na základě lemmatu 3.5.24 nebo lemmatu 3.5.25.
Stejně jako v lemmatu 3.5.29 lze tento pseudoalgoritmus přepsat na algebraickou
formuli sestavenou z atomických algebraických formulí tvaru f(ξn−1,j(f )) 0,
g(ξn−1,j(f )) 0, ξn ,k(g) ξn−1,j(f ) a f(ξn ,k(g)) 0, tedy na algebraickou
formuli řádu n − 1. Tato formule vyjmenovává všechny příznivé případy, které
mohou nastat pro kořeny polynomů f a g v případě, kdy g(ξn,i) 0, přičemž je
jasné, že jeden z oněch případů nastat musí.
Nakonec uvažujme případ, kdy formule D má tvar ξn,i(f) ξm,k(g), kde m ≤ n
a m je nenulové. Pišme ξ1 a ξ2 místo ξn,i(f) a ξm,k(g). Máme určit vzájemnou
polohu kořenů ξ1 a ξ2.
Urči čísla α0, . . , αr+1 taková, že a0 = −∞, αr+1 = +∞ a α1, . . , αr je rostoucí
posloupnost všech kořenů derivací f a g . Prohlédnutím hodnot sgn f(αi)
a sgn g(αi) stanov pro každý z kořenů ξ1 a ξ2 interval [[αj, αj+1), v němž leží.
Jsou-li tyto intervaly různé, je jasné, jaká (ostrá) nerovnost platí mezi ξ1 a ξ2.
Jinak máme j takové, že αj ≤ ξ1 < αj+1 a αj ≤ ξ2 < αj+1. Platí-li f(αj) = 0
a g(αj) = 0, pak ξ1 = ξ2. Platí-li f(αj) = 0 a g(αj) = 0, pak ξ1 < ξ2. Platí-li
f(αj) = 0 a g(αj) = 0, pak naopak ξ2 < ξ1.
Zbývá uvážit poslední případ, kdy znaménka sgn f(αj) a sgn g(αj) jsou obě
nenulová, tedy oba kořeny ξ1 a ξ2 jsou větší než αj. Znaménka sgn f(αj+1)
a sgn g(αj+1) jsou ovšem také nenulová, a navíc platí sgn f(αj) = sgn f(αj+1)
a sgn g(αj) = sgn g(αj+1). Platí-li g(ξ1) = 0, pak ξ1 = ξ2. Platí-li g(ξ1) > 0,
pak ξ1 < ξ2 nebo ξ2 < ξ1 podle toho, je-li g klesající nebo rostoucí v intervalu
(αj, αj+1). Platí-li g(ξ1) < 0, pak ξ1 < ξ2 nebo ξ2 < ξ1 podle toho, je-li g
rostoucí nebo klesající v intervalu (αj, αj+1). To, zda g je rostoucí nebo klesající
v intervalu (αj, αj+1) se ovšem pozná podle hodnot sgn g(αj) a sgn g(αj+1).
Tím je formule D přepracována na ekvivalentní booleovskou kombinaci formulí
NRn,j(f), NRn,j(g) a g(ξn,i(f)) 0 a atomických algebraických formulí řádu nižšího
než n, tedy na algebraickou formuli řádu n neobsahující atomické algebraické
formule tvaru ξn1,i1 (. .) ξn2,i2 (. .) maximálního možného řádu n. Vzhledem k úvahám
uvedeným výše lze tuto formuli dále přepracovat na ekvivalentní algebraickou
formuli řádu menšího než n. QED
Zbývající úvahy o eliminaci kvantiﬁkátorů pro teorii RCF jsou téměř stejné jako
v případě teorií DOS a IAdd.
Lemma 3.5.31 Nechť A(x, y1, . . , yq) je formule v jazyce LRCF, která je konjunkcí
atomických formulí. Pak formule ∃xA je v teorii RCF ekvivalentní s jistou otevřenou
formulí, jejíž všechny volné proměnné jsou mezi y1, . . , yq.
Důkaz Užitím lemmatu 3.2.15 můžeme každou atomickou podformuli formule A
upravit na tvar
n
i=1 aixn−i
=
m
i=1 bixm−i
nebo
n
i=1 aixn−i
<
m
i=1 bixm−i
,
3.5 Eliminace kvantiﬁkátorů 253
kde ai a bi jsou termy v jazyce LRCF neobsahující proměnnou x. Protože za chybějící
koeﬁcienty lze doplnit nuly, můžeme předpokládat, že n = m. Formule
n
i=1 aixn−i m
i=1 bixm−i
je ekvivalentní s formulí
n
i=1(ai − bi)xn−i
0. Můžeme
tedy předpokládat, že každá atomická podformule formule A má tvar f(x) = 0
nebo f(x) < 0, kde f je polynom, jehož koeﬁcienty jsou termy v jazyce LRCF neobsahující
proměnnou x.
Uvažme nejprve případ, kdy alespoň jedna z atomických podformulí formule A je
rovnost. Pak A má tvar f(x) = 0 & D(x, y), kde polynom f má nějaký stupeň n.
Formule ∃xA je v teorii RCF+
ekvivalentní s formulí
n
i=1
(NRn,i(f) & D(ξn,i(f), y)). (∗)
Formule (∗) je dle lemmatu 3.5.30 ekvivalentní s jistou otevřenou formulí B(y)
v jazyce LRCF. Protože RCF+
je konzervativním rozšířením teorie RCF, formule
∃xA a B jsou spolu ekvivalentní v teorii RCF.
Zbývá případ, kdy žádná z atomických podformulí formule A není rovnost. Pak
formule A má tvar f1(x) < 0 & . . & fk(x) < 0, kde polynomy f1, . . , fk mají
stupně n1, . . , nk. Formule ∃xA je v teorii RCF ekvivalentní s formulí
k
j=1
nj
i=1
(NRnj ,i(fj) &
k
r=1
(fr je záporný v pravém okolí bodu ξnj ,i(fj))) ∨
∨
k
r=1
(fr je záporný v pravém okolí bodu −∞).
(∗∗)
Formule (∗∗) je algebraickou formulí, jak vyplývá z lemmat 3.5.24 a 3.5.25. Díky
lemmatu 3.5.30 je tedy opět ekvivalentní s jistou otevřenou formulí B(y) v jazyce
LRCF, a opět platí, že formule B(y) je ekvivalentní s původní formulí ∃xA.
QED
Lemma 3.5.32 Nechť ϕ je otevřená formule v jazyce LRCF. Pak formule ∃xϕ je
v teorii RCF ekvivalentní s jistou otevřenou formulí, která nemá jiné volné proměnné
než ty, které jsou volné také ve formuli ∃xϕ.
Důkaz Formule ¬(t = u) a formule ¬(t < u) je v teorii RCF ekvivalentní s formulí
t < u ∨ u < t resp. s formulí t = u ∨ u < t. Zbývající úvahy jsou úplně
stejné jako v důkazu lemmatu 3.5.7. QED
Lemma 3.5.33 Každá atomická sentence v jazyce {+, ·, 0, 1, <, −} je v teorii RCF
dokazatelná nebo vyvratitelná.
Důkaz je podobný jako v 3.5.8 a v 3.5.16. Uplatní se tvrzení 3.2.14 (g) a (h) a
tvrzení 3.5.18(h). QED
Věta 3.5.34 Teorie RCF připouští eliminaci kvantiﬁkátorů a je úplná.
Důkaz je úplně stejný jako u vět 3.5.9 a 3.5.17. QED
254 3 Predikátová logika
Všimněme si, že konzervativní rozšíření teorie RCF hrálo trochu jinou roli než
konzervativní rozšíření teorií DO a IAdd. K teoriím DO a IAdd jsme přidali deﬁnice
symbolů 0 a S resp. symbolů =n, abychom získali teorii, která připouští eliminaci
kvantiﬁkátorů. Naproti tomu v případě teorie RCF jsme s pomocí dodatečných symbolů
NRn,i a ξn,i dokázali, že už původní teorie, tj. teorie RCF, připouští eliminaci
kvantiﬁkátorů.
Alfred Tarski v souvislosti se svým výsledkem o struktuře R reálných čísel položil
otázku, co by se stalo, kdybychom k jazyku LRCF teorie RCF přidali unární
funkční symbol, řekněme E, který bychom realizovali funkcí x → ex
. O výsledné
struktuře, kterou můžeme dočasně označit R, E , je dnes známo, že její
teorie Th( R, E ) nepřipouští eliminaci kvantiﬁkátorů. Okolo roku 1991 ale dokázal
A. Wilkie, že teorie Th( R, E ) splňuje slabší podmínku, než je eliminovatelnost
kvantiﬁkátorů: každá formule v jazyce LRCF ∪ {E} je v teorii Th( R, E ) ekvivalentní
s jistou univerzální formulí a také s jistou existenční formulí. Další zajímavé
otázky o struktuře Th( R, E ) zůstávají dodnes otevřené. Čtenáři, který se chce
dozvědět více o historii a souvislostech Tarského výsledku o struktuře R, doporučujeme
van den Driesův přehledový článek [16] a dále článek [17] téhož autora.
Výsledek A. Wilkieho je v [99].
Postup, kterým jsme ukázali, že teorie IAdd axiomatizuje strukturu Z, +, 0, s ,
vznikl zjednodušením obdobného výsledku o struktuře N, +, 0, s, < , který dokázal
M. Presburger v roce 1929 ([66]). Teorie struktury N, +, 0, s, < se dnes nazývá
Presburgerovou aritmetikou. Někdy se tímto názvem označuje také teorie blízce
příbuzné struktury Z, +, 0, s, < . O Presburgerově výsledku na rozdíl od Tarského
výsledku o struktuře R pravděpodobně nelze říci, že podnítil důležitý výzkum probíhající
v následujících desetiletích. Je ale také počítán k důležitým událostem
v logice 20. století.
Cvičení
1. Zdůvodněte, že formule ¬∃y(y < x) není v teorii DO ekvivalentní s žádnou
otevřenou formulí, a že tedy teorie DO nepřipouští eliminaci kvantiﬁkátorů.
Návod. Přizpůsobte argument z cvičení 21 v oddílu 3.1.
2. Zdůvodněte podrobně, že je-li D1 struktura pro jazyk L1 a D2 expanze struktury
D1, pak každá sentence jazyka L1 platí v D1 právě tehdy, platí-li v D2.
(Totéž se již tvrdilo ve cvičení 18 oddílu 3.1.)
3. Dokažte, že struktura N, 0, s + Z, s z obrázku 3.4.1 nemá žádnou expanzi,
která je modelem teorie Th( N, +, 0, s ).
Návod. Zdůvodněte, že ať je sčítání deﬁnováno jakkoliv, žádný z prvků oblasti
Z, s nesplňuje formuli ∃y(x = y + y ∨ x = S(y + y)).
4. Je-li T úplná, pak každé bezesporné rozšíření T teorie T je jejím konzervativním
rozšířením. Dokažte.
3.5 Eliminace kvantiﬁkátorů 255
5. Zdůvodněte na základě předchozích dvou cvičení, že větu 3.5.2 nelze obrátit.
6. Zdůvodněte užitím věty 3.5.2 nebo užitím cvičení 4, že teorie DOS je konzervativním
rozšířením teorie SUCC.
7. Nechť T2 je teorie vzniklá z teorie DOS odstraněním axiomu DO3 a nechť T1
je teorie vzniklá z teorie SUCC odstraněním axiomu Q3. Dokažte, že teorie T2
je konzervativním rozšířením teorie T1.
8. Když je teorie T2 konzervativním rozšířením teorie T1, pak ke každému modelu
A teorie T1 existuje s ním elementárně ekvivalentní model B, který má
expanzi, která je modelem teorie T2. Dokažte.
9. Zdůvodněte, že je-li T konzervativní rozšíření teorie T a je-li ϕ sentence v jazyce
teorie T, pak (T + ϕ) je konzervativní rozšíření teorie (T + ϕ).
10. Nechť F /∈ L je n-ární funkční symbol, η(x, y) je formule v L a T je teorie s jazykem
L. Nechť dále T je teorie s jazykem L ∪ {F}, jejímiž axiomy jsou všechny
axiomy teorie T a navíc sentence ∀xη(x, F(x)). Dokažte s užitím věty 3.5.2, že
platí-li T ∀x∃yη(x, y), pak teorie T je konzervativním rozšířením teorie T.
11. Dokažte, že je-li T rozšíření teorie T o deﬁnice, pak každá formule v jazyce
teorie T je v teorii T ekvivalentní s jistou formulí v jazyce teorie T.
Návod. Nechť například T je rozšířením teorie T o deﬁnici tvaru (d2) a nechť
je dána formule ϕ v jazyce teorie T . Stačí zabývat se atomickými podformulemi
formule ϕ. Když P(t1, . . , tm) je atomická podformule formule ϕ, v níž
term ti obsahuje symbol F, pak formule P(t1, . . , tm) je ekvivalentní s formulí
∃v(ti = v & P(t1, . . , ti−1, v, ti+1, . . , tm)). Opakováním tohoto postupu pro
symboly P jiné než rovnítko a všechny možné termy získáme formuli ϕ(1)
ekvivalentní
s formulí ϕ, ve které se symbol F vyskytuje pouze v rovnostech. Dále
lze získat formuli ϕ(2)
ekvivalentní s ϕ, ve které se symbol F vyskytuje vždy
pouze na levé straně rovnosti, a pak formuli ϕ(3)
, ve které se symbol F vyskytuje
vždy pouze v kontextu F(t1, . . , tn) = s, kde termy ti a s neobsahují
symbol F. Každou podformuli tvaru F(t) = s lze pak nahradit formulí η(t, s).
12. Dokažte formuli x ≤ m ≡ x = 0 ∨ . . ∨ x = m v teorii DOS.
13. Dokažte formuli ¬(x =n y) ≡ x =n y +1 ∨ . . ∨ x =n y +n − 1 v teorii IAdd.
14. Dokažte, že formule z příkladu 3.5.13 je v teorii IAdd ekvivalentní s formulí
y1 =2 y2 & y1 =5 y3 & y2 =7 y3.
15. Dokažte, že teorie SUCC připouští eliminaci kvantiﬁkátorů.
Návod. Postupujte obdobně jako v případě teorie DOS, ale nepokoušejte se
odstranit negativní literály. Lemma analogické lemmatu 3.5.5 formulujte pro
konjunkci formulí tvaru S(m)
(x) = t a S(m)
(x) = t.
256 3 Predikátová logika
16. Dokažte úplnost teorie DNO pomocí eliminace kvantiﬁkátorů.
Návod. Z triviálního důvodu není pravda, že každá sentence je v teorii DNO
ekvivalentní s otevřenou sentencí, v jazyce teorie DNO totiž žádné otevřené
sentence neexistují. Tuto potíž lze ale překonat přidáním symbolu ⊥, tj. zkratky
pro spor, mezi logické spojky.
17. Deﬁnujeme-li na množině Z × Q sčítání předpisem [a, b] + [c, d] = [a + c, b + d]
(tj. sčítá se „po složkách ) a dodeﬁnujeme-li vhodně realizace symbolů 0 a 1,
dostaneme model teorie IAdd. Dokažte. Toto cvičení a úvahy v souvisejícím
příkladu 3.6.16 navrhl I. Korec.
18. Je-li f polynom s koeﬁcienty c0, . . , cn a platí-li pro číslo a, že f(a) > 0 (nebo
že f(a) < 0), pak f je kladný (resp. záporný) v jistém okolí bodu a. Dokažte
toto tvrzení v teorii uspořádaných těles.
Návod. Zdůvodněte a užijte rovnost
|f(x) − f(a)| = |x − a| ·
n
i=0
|ci| · |xi−1
+ xi−2
a + . . + xai−2
+ ai−1
|.
První činitel je pro x blízké k a velmi malý, součet lze omezit konstantou
nezávislou na x.
19. Z faktů, že ve struktuře R reálných čísel platí axiomy R1–R15 a že ve struktuře
R, < platí věta o supremu, zdůvodněte užitím předchozího cvičení, že
v R platí schéma R16.
Návod. Platí-li a < b, f(a) > 0, f(b) < 0, označte γ supremum množiny
{ x ∈ (a, b) ; f(x) ≥ 0 }. Musí platit f(γ) = 0.
20. V důkazu lemmatu 3.5.29 byla formule NR3,2(f) přepracována na algebraickou
formuli řádu 2. Udělejte totéž s formulí NR3,3(f).
21. Navrhněte teorii, která axiomatizuje strukturu N, +, 0, s, < , a dokažte její
úplnost pomocí eliminace kvantiﬁkátorů.
3.6 Rozhodnutelnost, deﬁnovatelnost, interpreto-
vatelnost
Vraťme se ještě jednou k některému příkladu na eliminaci kvantiﬁkátorů z oddílu
3.5. Prohlédneme-li si například důkaz věty 3.5.9 a důkazy předchozích lemmat
3.5.5–3.5.8, můžeme konstatovat, že v těchto důkazech jsou vlastně obsaženy dva
algoritmy: jeden převede libovolnou formuli na formuli, která je s ní ekvivalentní
a neobsahuje kvantiﬁkátory, druhý rozhodne o dokazatelnosti otevřené sentence.
Z obou algoritmů lze utvořit ještě další algoritmus, který rozhodne o dokazatelnosti
libovolné sentence. Úloha rozpoznat, zda daná sentence v jazyce teorie DOS
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 257
je v teorii DOS dokazatelná, je tedy algoritmicky rozhodnutelnou úlohou. Nyní
budeme chtít říci více o takovýchto úlohách.
Připomeňme si, že chceme-li uvažovat o algoritmech pracujících s formulemi,
musíme mít jasno v tom, jak přesně se formule zapisují pomocí symbolů. Pro tento
účel jsme se na začátku kapitoly domluvili, že množina Var všech proměnných je
nekonečná spočetná, Var = {v0, v1, . . . }, a že každý její prvek vi zapisujeme jako
písmeno v následované zápisem čísla i. Pro určitost k tomu nyní dodejme, že
čísla zapisujeme binárně. Například je-li ϕ formule ∃v2(S(v2) = S(0)), pak ϕ je
ve skutečnosti posloupností ∃v10=(S(v10),S(0)) sestávající z osmnácti symbolů.
Nijak nevadí fakt, že symbol 0 má dvojí roli, vyskytuje se v indexech proměnných
a jako konstanta je také prvkem některých jazyků.
Budeme-li v tomto oddílu mluvit o axiomatické teorii, vždy předpokládáme, že
její jazyk je nejvýše spočetný a že je-li nekonečný, byla pro zapisování jeho prvků
přijata podobná dohoda jako pro zapisování nekonečně mnoha proměnných. Dále
se pro účely strojového zpracování důkazů domluvme, že za prvotní v tomto oddílu
považujeme hilbertovský kalkulus a že pro oddělování formulí od sebe užíváme
při zapisování důkazů znak #. Důkaz tedy nyní není posloupností formulí, nýbrž
je slovem tvaru ϕ1#ϕ2# . . #ϕm, kde každé podslovo ϕi je formulí, která je buď
takovým či onakým axiomem, nebo je odvozena z některých dříve se vyskytujících
podslov ϕj pomocí jednoho ze tří odvozovacích pravidel.
Od kapitoly 2 máme k dispozici kódovou tabulku, která přiřazuje číselné kódy
všem znakům, které kdy můžeme potřebovat. Nejsou-li číselné kódy znaků důležité
(což nikdy nejsou), můžeme kód znaku psát jako levý apostrof následovaný
tímto znakem. Od kapitoly 2 máme také k dispozici kódování konečných
posloupností přirozených čísel, které nám dovoluje libovolnou konečnou posloupnost
přirozených čísel považovat za jediné přirozené číslo. Například pro formuli ϕ
uvedenou výše můžeme tedy psát ϕ = ‘∃‘v‘1‘0‘=‘(‘S‘(‘v‘1‘0‘)‘,‘S‘(‘0‘)‘) . Kdo
by na tom trval, mohl by případně do kódové tabulky nahlédnout a zjistit, že
ϕ = 11, 91, 33, 32, 27, 12, 61, 12, 91, 33, 32, 13, 16, 61, 12, 32, 13, 13 . Šlo by také připomenout
si deﬁnici kódování posloupností a určit číslo ϕ = 211+1
· . . · 6713+1
. To
už ale pro náš výklad opravdu nemá význam. Navíc v kapitole 4 budeme potřebovat
jiné kódování než ono založené na rovnosti a0, . . , an−1 = 2a0+1
· . . · p
an−1+1
n−1 ,
které jsme deﬁnovali v kapitole 2.
Důležité je pouze to, že díky kódové tabulce a díky jednoznačné kódovatelnosti
a dekódovatelnosti konečných posloupností přirozených čísel můžeme formule
a ostatní syntaktické objekty ztotožnit s přirozenými čísly a množiny syntaktických
objektů pak považovat za množiny přirozených čísel. O libovolné množině formulí
se tedy můžeme ptát, zda je například rekurzívní.
Připomeňme si, že Thm(T) označuje množinu všech sentencí dokazatelných
v teorii T a dále že Ref(T) označuje množinu všech sentencí vyvratitelných v teorii
T, tj. množinu všech sentencí ϕ takových, že T ¬ϕ. Evidentně platí, že
množiny Thm(T) a Ref(T) jsou disjunktní právě tehdy, když teorie T je bezesporná
(viz 3.2.7(c)), a že je-li M libovolný model teorie T, pak Thm(T) ⊆ Th(M)
a Th(M) ∩ Ref(T) = ∅. Vztahy mezi množinami Thm(T), Ref(T), Th(M) a T
258 3 Predikátová logika
jsou pro případ, kdy M je model teorie T, znázorněny na obr. 3.6.1, přičemž velký
obdélník znázorňuje množinu všech sentencí v jazyce teorie T. Dále je zřejmé, že
každá z množin Thm(T) a Ref(T) je m-převeditelná na druhou a že množina Th(M)
je m-převeditelná na svůj komplement. Ve všech případech lze vystačit s (dokonce
logaritmicky počitatelnou) funkcí ϕ → ¬ϕ, tj. s pouhým připsáním negace.
Th(M)
Thm(T) Ref(T)
T
Obrázek 3.6.1: Vztahy mezi množinami Thm(T), Ref(T) a Th(M), platí-li M |= T
Deﬁnice 3.6.1 Teorie T je rozhodnutelná, jestliže množina Thm(T) je obecně
rekurzívní. Jinak je nerozhodnutelná. Struktura D je rozhodnutelná nebo nerozhodnutelná,
jestliže množina Th(D) je resp. není obecně rekurzívní.
Jak již bylo řečeno, eliminace kvantiﬁkátorů pro teorii DOS poskytuje algoritmus,
který rozhoduje o náležení do množiny Thm(DOS). Tento algoritmus by
se samozřejmě dal přepsat do formalismu jazyka RASP nebo do formalismu rekurzívních
funkcí. Teorie DOS je tedy rozhodnutelná. Ze stejného důvodu jsou
rozhodnutelné i teorie IAdd a RCF. Je zřejmé, že úplná teorie T je rozhodnutelná,
právě když některý její model je rozhodnutelný, a to je právě tehdy, když každý její
model je rozhodnutelný. Z toho plyne, že struktury N, 0, s, < , Z, +, 0, 1 a R jsou
rozhodnutelné. Protože redukt rozhodnutelné struktury je evidentně opět rozhodnutelnou
strukturou, také struktury N, 0, s , N, < a R, < jsou rozhodnutelné.
Z toho dále plyne rozhodnutelnost teorií SUCC, DO a DNO, všechny jsou totiž
úplné. Také struktury z obrázků 3.4.1 a 3.4.2 jsou rozhodnutelné. Rozhodnutelnost
teorií SUCC a DNO plyne také z faktu uvedeného ve cvičeních předchozího
oddílu, totiž že obě tyto teorie (vlastně) připouštějí eliminaci kvantiﬁkátorů.
Příklad 3.6.2 Přidejme k jazyku {0, S} teorie SUCC unární predikátový symbol P,
zvolme nerekurzívní množinu A ⊆ N a označme T1 teorii SUCC ∪ { P(n) ; n ∈ A }.
Když n /∈ A, lze zvolit expanzi M = N, 0, s, PM
struktury N, 0, s , ve které
neplatí sentence P(n). Platí tedy ∀n(n ∈ A ⇔ P(n) ∈ Thm(T1)). Z toho
plyne A ≤m Thm(T1). Teorie T1 je tedy příkladem nerozhodnutelné teorie. Struktura
N, 0, s, N , ve které je predikát P realizován celou množinou N, je modelem
teorie T1, o němž lze zdůvodnit, že je rozhodnutelnou strukturou. Naopak struktura
N, 0, s, A je příkladem nerozhodnutelného modelu teorie T1.
Příklad 3.6.3 Zvolme jazyk a množinu A /∈ OR stejně jako v předchozím příkladu
a položme T2 = T1 ∪{¬P(n); n /∈ A}. Teorie T2 je nerozhodnutelná ze stejného důvodu
jako teorie T1. Oproti příkladu 3.6.2 máme navíc A ≤m Thm(T2). Tentokrát
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 259
platí, že všechny modely teorie T2 jsou nerozhodnutelné. Pro pořádek dodejme, že
teorie T2 není úplná; stačí uvážit například sentenci ∀x(P(x) ∨ P(S(x))).
Příklad 3.6.4 Zvolme množinu A jako v předchozích dvou příkladech, zvolme jazyk
{c, P0, P1, . . . } s jednou konstantou a nekonečně mnoha unárními predikáty a
položme T3 = {Pn(c); n ∈ A}. Stejně jako v příkladu 3.6.2 platí, že T3 je nerozhodnutelnou
teorií, jejíž některé modely jsou a některé nejsou rozhodnutelné. Teorie T3
má ale dokonce jednoprvkový model, který je nerozhodnutelnou strukturou.
Věta 3.6.5 Je-li D konečná struktura pro konečný jazyk, pak D je rozhodnutelná.
Důkaz Nechť a1, . . , an jsou všechny prvky nosné množiny D struktury D, která je
strukturou pro konečný jazyk L. Snadno lze navrhnout datové struktury pro zapisování
prvků množiny D a pro zapisování ohodnocení proměnných ve struktuře D.
Můžeme si myslet, že realizace FD
libovolného funkčního symbolu F ∈ L je deﬁnována
tabulkou, podobně jako v případě struktury A z obrázku 3.1.1 na straně 141.
Tyto tabulky umožňují určit pro daný term t a ohodnocení e hodnotu tD
[e] termu t
ve struktuře D. Dále si můžeme myslet, že podobnou tabulku máme i pro realizaci
PD
každého predikátového symbolu P ∈ L. Podmínka D |= ϕ[e] je tedy v případě,
kdy formule ϕ je atomická, algoritmicky rozhodnutelná. Podmínky T8 a T9
v našem případě říkají
D |= (∃xϕ)[e] ⇔ D |= ϕ[e(x/a1)] ∨ . . ∨ D |= ϕ[e(x/an)],
D |= (∀xϕ)[e] ⇔ D |= ψ[e(x/a1)] & . . & D |= ϕ[e(x/an)].
Platí také ekvivalence
D |= (ϕ → ψ)[e] ⇔ D /|= ϕ[e] ∨ D |= ψ[e]
a tři další ekvivalence týkající se zbývajících logických spojek. Na těchto šesti ekvivalencích
lze založit proceduru, která otázku, zda daná formule je splněna daným
ohodnocením, převádí na analogické otázky týkající se jednodušších a jednodušších
formulí. Přesněji řečeno, jde o proceduru, která pro dané vstupy ϕ a e pomocí
rekurzívního volání sebe sama rozhodne, zda platí D |= ϕ[e]. Struktura D ovšem
není vstupem, ta je známa už v době psaní oné procedury. Zbytek, tj. hlavní program,
který rozhoduje o platnosti dané sentence ϕ v D, je zřejmý: sentence ϕ je
v Th(D), právě když pro libovolně zvolené ohodnocení e naše procedura řekne ano
na otázku [ϕ, e]. QED
Deﬁnujme ProofT (ϕ, d) jako zkratku pro podmínku „ϕ je sentence, d je její
důkaz v teorii T .
Věta 3.6.6 Nechť teorie T (jako množina sentencí) je primitivně rekurzívní, rekurzívní
nebo rekurzívně spočetná. Pak i podmínka ProofT (ϕ, d) je primitivně rekurzívní,
resp. rekurzívní, resp. rekurzívně spočetná. Množiny Thm(T) a Ref(T)
jsou ve všech třech případech rekurzívně spočetné.
260 3 Predikátová logika
Důkaz Platí ϕ ∈ Thm(T) ⇔ ∃dProofT (ϕ, d). Je-li podmínka ProofT (ϕ, d) rekurzívně
spočetná, pak množina Thm(T) je rekurzívně spočetná díky implikaci ⇐
ve větě 2.2.25 resp. díky tvrzení 2.2.35(e). Množina Ref(T) je rekurzívně spočetná
z podobného důvodu, anebo také proto, že Ref(T) ≤m Thm(T).
Zabývejme se tedy klasiﬁkací podmínky ProofT (ϕ, d). Nejprve nechť Number(z)
znamená „z je binárním zápisem přirozeného čísla (tj. „z je numerickým kódem
slova, které je binárním zápisem přirozeného čísla ) a nechť Var(v) znamená „v je
proměnná . Platí
Number(z) ⇔ Seq(z) & Lh(z) = 0 & (Lh(z) > 1 ⇒ (z)0 = ‘0) &
& ∀i<Lh(z)((z)i = ‘0 ∨ (z)i = ‘1),
Var(v) ⇔ ∃z<v(Number(z) & v = ‘v ∗ z),
kde ∗ označuje operaci spojení posloupností deﬁnovanou v oddílu 2.2. Podmínky
Number(z) a Var(v) jsou evidentně primitivně rekurzívní. Dále nechť Term(t)
znamená „t je term . Předpokládejme ve zbytku tohoto důkazu, že jazyk teorie T
je aritmetický. U všech úvah bude zřejmé, jak je třeba je modiﬁkovat pro jiné
jazyky. Platí
Term(t) ⇔ Var(t) ∨ t = ‘0 ∨ ∃s1 <t∃s2 <t(Term(s1) &
& Term(s2) & t = ‘( ∗ s1 ∗ ‘+ ∗ s2 ∗ ‘) ) ∨
∨ ( . . . podobně pro symboly ⋅ a S . . . ).
Číslo (posloupnost symbolů) je term, je-li to proměnná, nebo je-li to posloupnost,
jejímž jediným členem je konstanta nula, nebo lze-li je získat z jednodušších termů
pomocí závorek, operačního znaménka a příslušného počtu (jednoho nebo dvou)
menších termů. To je odvození charakteristické funkce množiny všech aritmetických
termů pomocí zobecněné primitivní rekurze (tj. na základě lemmatu 2.2.20).
Zdůvodnění, že podmínka Term(t) je primitivně rekurzívní, je tedy stejné jako zdůvodnění
z oddílu 2.2, že množina všech výrokových formulí je primitivně rekurzívní.
Také následující podmínky a funkce jsou primitivně rekurzívní:
FmAt(ϕ) ϕ je atomická formule,
Fm(ϕ) ϕ je formule,
SubT(t, v, s) výsledek substituce termu t za proměnnou v v termu s,
SubF(t, v, ϕ) výsledek substituce termu t za proměnnou v ve formuli ϕ,
OccT(v, t) proměnná v se vyskytuje v termu t,
OccF(v, ϕ) proměnná v má volné výskyty ve formuli ϕ,
Sent(ϕ) ϕ je sentence,
FreeSub(t, v, ϕ) t je term substituovatelný za proměnnou v ve formuli ϕ,
LogAx(ϕ) ϕ je logický axiom,
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 261
přičemž v případě funkce SubF je samozřejmě řeč o substituci za všechny volné
výskyty proměnné v. Kteroukoliv z těchto sedmi podmínek a dvou funkcí lze totiž
odvodit z funkcí týkajících se kódování posloupností a z funkcí a podmínek vyskytujících
se na seznamu dříve, a to většinou s užitím zobecněné primitivní rekurze.
Například FreeSub(t, v, ϕ), právě když nastane některý z následujících případů:
◦ FmAt(ϕ),
◦ ϕ je utvořena pomocí logické spojky z jedné nebo dvou menších formulí, v níž
nebo v obou z nichž je term t substituovatelný za v,
◦ ϕ je utvořena z menší formule ψ pomocí kvantiﬁkace užité na proměnnou u,
přičemž ¬OccF(v, ϕ),
◦ ϕ je utvořena z menší formule ψ pomocí kvantiﬁkace užité na proměnnou u,
přičemž FreeSub(t, v, ψ) a ¬OccT(u, t).
Přitom si všimněme, že podmínka ¬OccF(v, ϕ), „v nemá volné výskyty ve formuli
ϕ , je splněna mimo jiné tehdy, jsou-li u a v tytéž proměnné. Dále si všimněme,
že je-li ϕ tvaru ‘∃ ∗ u ∗ ψ nebo ‘∀ ∗ u ∗ ψ, pak u < ϕ a ψ < ϕ. Při popisu
kvantiﬁkace jako syntaktické operace a v odvození celé podmínky FreeSub(t, v, ϕ)
se tedy obejdeme bez neomezených kvantiﬁkátorů. Poslední podmínka LogAx(ϕ)
je disjunkcí několika podmínek, neboť ϕ je logickým axiomem, právě když ϕ má jeden
z tvarů B1, B2, A1–A7 nebo E1–E5. Přitom například ϕ je logickým axiomem
tvaru B2, právě když
∃ψ<ϕ∃v<ϕ∃t<ϕ(Term(t) & Var(v) & Fm(ψ) & FreeSub(t, v, ψ) &
& ϕ = ‘(, ‘∀ ∗ v ∗ ψ ∗ ‘→ ∗ SubF(v, t, ψ) ∗ ‘) ),
což je primitivně rekurzívní podmínka, víme-li již, že podmínky Term(t), Var(v),
Fm(ψ) a FreeSub(t, v, ψ) a funkce SubF jsou primitivně rekurzívní.
Deﬁnujme dvě pomocné podmínky Beg(c, d) a Ends(d, ϕ):
Beg(c, d) ⇔ c = d ∨ ∃x<d(d = c ∗ ‘# ∗ x),
Ends(d, ϕ) ⇔ ∀i<Lh(ϕ)((ϕ)i = ‘#) & (ϕ = d ∨ ∃x<d(d = x ∗ ‘# ∗ ϕ)).
Tyto podmínky budeme potřebovat v situaci, kdy c a d budou důkazy a ϕ formule.
Podmínku Beg(c, d) můžeme číst „(důkaz) c je počátečním úsekem (důkazu) d ,
podmínku Ends(d, ϕ) můžeme číst „(formule) ϕ je závěrem (důkazu) d . Obě jsou
evidentně primitivně rekurzívní. Nyní už můžeme posoudit to, o co nám jde. Platí
totiž ProofT (ϕ, d), právě když
Ends(d, ϕ) & ∀c<d∀ψ<d(Beg(c, d) & Ends(c, ψ) ⇒ Fm(ψ) &
& (∃b<c∃α<c∃β<c∃v<c(Fm(α) & Fm(β) & Var(v) &
& Beg(b, c) & Ends(b, ‘( ∗ α ∗ ‘→ ∗ β ‘) ) & ¬OccF(v, α) &
& ψ = ‘( ∗ α ∗ ‘→, ‘∀ ∗ v ∗ β ∗ ‘) ) ∨
∨ ( . . . podobně pro pravidla Gen-E a MP . . . ) ∨
∨ LogAx(ψ) ∨ ψ ∈ T)).
262 3 Predikátová logika
Vidíme, že podmínku ProofT (ϕ, d) lze sestavit z podmínky ψ ∈ T a primitivně rekurzívních
podmínek pomocí logických spojek a omezených kvantiﬁkátorů. Odtud
plyne tvrzení věty pro případ T ∈ PR nebo T ∈ OR. Zápis podmínky ProofT (. .)
lze snadno ekvivalentně přepsat tak, aby se v něm podmínka ψ ∈ T nevyskytovala
v rozsahu platnosti žádné implikace ani negace, tj. aby celá podmínka ProofT (. .)
byla z podmínky ψ ∈ T sestavena pouze pomocí konjunkce, disjunkce a omezené
kvantiﬁkace. Odtud plyne tvrzení věty pro případ, kdy T ∈ RS. QED
Například axiomatika Zermelovy-Fraenkelovy teorie množin je obvykle formulována
jako několik jednotlivých sentencí a několik schémat. Protože schémata
jsou deﬁnována čistě syntakticky (každá sentence takového a takového tvaru je
axiomem), teorie ZF má primitivně rekurzívní množinu axiomů. Věta 3.6.6 pro
tento případ říká, že množina Thm(ZF) je rekurzívně spočetná. Také podmínka
ProofGB(ϕ, d) je primitivně rekurzívní a množina Thm(GB) je rekurzívně spočetná.
To platí buď ze stejného důvodu, nebo proto, že teorie GB je dokonce konečně
axiomatizovatelná.
Věta 3.6.7 (Craigův trik) Nechť T je teorie taková, že množina Thm(T) je rekurzívně
spočetná. Pak existuje teorie S ve stejném jazyce a s primitivně rekurzívní
množinou axiomů, která je ekvivalentní s teorií T.
Důkaz Dle věty o projekci 2.2.25 k množině Thm(T) existuje relace R ⊆ N2
taková, že R je primitivně rekurzívní a platí ∀ϕ(ϕ ∈ Thm(T) ⇔ ∃nR(ϕ, n)).
Můžeme předpokládat, že R(m, n) platí pouze v případě, kdy m je sentence. Pro
účely tohoto důkazu deﬁnujme pro sentenci ϕ a přirozené číslo n ≥ 1 sentenci ϕn
jako (ϕ & (ϕ & (. . & ϕ) . .), tj. jako konjunkci n exemplářů sentence ϕ se závorkami
kumulujícími se doprava. Pro libovolnou sentenci ψ existuje mezi čísly n ≥ 2
nejvýše jedno takové, že ψ = ϕn
. Navíc podmínka ψ = ϕn+2
je PR. Položme
S = { ϕn+2
; R(ϕ, n) } = { ψ ; ∃n<ψ∃ϕ<ψ(ψ = ϕn+2
& R(ϕ, n)) }.
Množina S je primitivně rekurzívní. Když sentence ψ tvaru ϕn+2
je v S, pak R(ϕ, n)
a ϕ ∈ Thm(T). Z ϕ lze ovšem v T dokázat i ϕn+2
. Tedy Thm(S) ⊆ Thm(T). Když
ϕ ∈ Thm(T), pak ϕn+2
∈ S pro jisté n. Z ϕn+2
lze ovšem v S dokázat ϕ. Tedy
Thm(T) ⊆ Thm(S). QED
Vidíme, že „trik spočíval v nahrazení každé sentence z Thm(T) jinou sentencí,
která říká přesně totéž, způsob jejího zápisu ale navíc kóduje jistou numerickou
informaci.
Řekneme, že teorie T je rekurzívně axiomatizovatelná, jestliže je ekvivalentní
s nějakou teorií S, která má rekurzívní množinu axiomů. Z věty 3.6.7 plyne, že
nezáleží na tom, řekneme-li v této deﬁnici „primitivně rekurzívní nebo naopak
„rekurzívně spočetná místo „rekurzívní .
Věta 3.6.8 Je-li teorie T rekurzívně axiomatizovatelná a úplná, pak T je rozhod-
nutelná.
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 263
Důkaz Množiny Thm(T) a Ref(T) jsou rekurzívně spočetné díky větě 3.6.6. Z úplnosti
teorie T plyne, že jsou navzájem komplementární. Zbytek je věta 2.2.27, tj.
Postova věta. Trochu přesněji řečeno, množiny Thm(T) a Ref(T) sice jako množiny
čísel komplementární nejsou, jejich sjednocení je ale rekurzívní množina Sent všech
(číselných kódů všech) sentencí příslušného jazyka. Takže můžeme vzít množiny
A = Thm(T) a B = Ref(T) ∪ (N − Sent). Ty jsou navzájem komplementární a
rekurzívně spočetné, lze na ně tedy užít Postovu větu. Z B ∈ OR ovšem plyne
Ref(T) ∈ OR, neboť Ref(T) = B ∩ Sent. Viz též cvičení 21 oddílu 2.2. QED
Z věty 3.6.8 například plyne rozhodnutelnost teorie DNO (víme-li z komentáře
k větě 3.4.15, že teorie DNO je úplná), a to i bez okliky přes eliminovatelnost
kvantiﬁkátorů pro teorii RCF.
Z věty 3.6.8 a z faktu, že rozhodnutelná teorie je rekurzívně axiomatizovatelná,
dále plyne, že není-li množina tvaru Thm(T) rekurzívní, pak není ani ve sjednocení
Σ1 ∪ Π1, tj. ona ani její komplement nejsou rekurzívně spočetné.
Věta 3.6.9 Je-li T bezesporná a rekurzívně axiomatizovatelná teorie v jazyce L,
pak existuje úplná teorie S v témže jazyce L, která je rozšířením teorie T a pro niž
platí Thm(S) ∈ Σ2 ∪ Π2. E
Důkaz Deﬁnujme nekonečnou posloupnost S0, S1, . . . teorií v jazyce L následující
rekurzí:
S0 = T,
Sn+1 =
Sn ∪ {n} pokud n je sentence v L a platí Sn ¬n
Sn jinak.
Z lemmatu 3.2.7(d) plyne (indukcí), že každá teorie Sn je bezesporná. Položme S =
n Sn. Také S je bezesporná. Uvažujme libovolnou sentenci ϕ v L. V okamžiku
n = ϕ byla buď do Sn+1 přijata sentence ϕ, nebo nebyla a platilo Sn ¬ϕ.
V prvním případě platí ϕ ∈ Sn+1 a S ϕ. V druhém případě máme S ¬ϕ.
Tím je zdůvodněno, že teorie S je úplná. Uvažujme následující podmínku C(w)
pro číslo w:
Seq(w) & ∀n<Lh(w)((w)n ≤ 1 &
& ((w)n = 1 ⇔ Sent(n) & T (
ψ<n,(w)ψ=1
ψ) → ¬n)).
Lze ověřit, že podmínka C má tyto vlastnosti:
(i) ∀m∃!w(C(w) & Lh(w) = m),
(ii) ∀w∀n<Lh(w)((w)n = 1 ⇒ Sent(n)), E
(iii) ∀w(T ∪ { n ; n < Lh(w) & (w)n = 1 } = SLh(w)),
(iv) C ∈ Σ2.
264 3 Predikátová logika
Přitom (i)–(iii) se dokáže indukcí dle m či dle Lh(w). Protože T je rekurzívně
axiomatizovatelná, podmínka T ( ψ<n,(w)ψ=1 ψ) → ¬n je Π1 díky větě 3.6.6.
Podmínka C je tedy sestavena z Π1-podmínky a primitivně rekurzívních podmínek
pomocí logických spojek a omezené kvantiﬁkace. Odtud plyne (iv). Platí
také C ∈ Π2, to ale nepotřebujeme. Z (i) plyne, že podmínky
∃w(C(w) & n < Lh(w) & (w)n = 1) a ∀w(C(w) & n < Lh(w) ⇒ (w)n = 1)
pro číslo n jsou spolu ekvivalentní. Přitom první je Σ2 a druhá je Π2. Z (iii) je
vidět, že každá z těchto podmínek je ekvivalentní s n ∈ S. Tedy S ∈ Σ2 ∩Π2. QED
Věta 3.6.10 Nechť ϕ je sentence v jazyce teorie T a T je rozhodnutelná. Pak i
teorie (T + ϕ) je rozhodnutelná.
Důkaz Platí Thm(T + ϕ) ≤m Thm(T), neboť ∀ψ((T + ϕ) ψ ⇔ T ϕ → ψ).
QED
Tato věta boří občas se vyskytující představu, že nerozhodnutelné teorie obvykle
vznikají z rozhodnutelných přidáním silných axiomů. Pravda je spíš opačná, přidání
axiomů zakazuje určité situace, tj. vylučuje některé z dosud možných modelů, což
může usnadnit úvahy o případné rozhodovací proceduře.
Větu 3.6.10 lze číst také takto: odebráním axiomu z nerozhodnutelné teorie T
vznikne opět nerozhodnutelná teorie. Má-li ale teorie T jen konečně mnoho axiomů,
můžeme odebírání opakovat a odstranit všechny! Podaří-li se nám pro nějaký
jazyk L najít nerozhodnutelnou konečně axiomatizovatelnou teorii T v jazyce L,
budeme zároveň vědět, že teorie s tímže jazykem a s prázdnou množinou axiomů
je nerozhodnutelná, tj. že množina všech logicky platných formulí v jazyce L je nerozhodnutelná.
Zatím pouze víme, že existují nerozhodnutelné teorie s primitivně
rekurzívní množinou axiomů, viz cvičení.
Deﬁnice 3.6.11 Nechť D = D, . . je struktura pro jazyk L. Formule ϕ(x1, . . , xk)
deﬁnuje ve struktuře D množinu A ⊆ Dk
, jestliže A = { [a1, . . , ak] ; D |= ϕ[a] }.
Množina A je deﬁnovatelná ve struktuře D, existuje-li formule ϕ(x1, . . , xk), která
ji v D deﬁnuje. Prvek a množiny D je deﬁnovatelný ve struktuře D, jestliže {a}
je množina deﬁnovatelná v D.
Příklad 3.6.12 Ve struktuře N, + deﬁnuje formule ∃y(y +y = x) množinu všech
sudých čísel a formule ∀y(y + x = y) deﬁnuje prvek 0. V téže struktuře formule
x1 = x2 & ∃y(x1 + y = x2) deﬁnuje relaci <.
Příklad 3.6.13 Věta o čtyřech čtvercích (důkaz lze vyčíst např. z [35]) tvrdí, že
každé přirozené číslo je součtem čtyř druhých mocnin přirozených čísel. Z věty o
čtyřech čtvercích plyne, že formule
∃v1∃v2∃v3∃v4(v1 · v1 + v2 · v2 + v3 · v3 + v4 · v4 = x)
deﬁnuje množinu N ve struktuře Z, +, · .
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 265
Řekneme, že funkce f je automorﬁsmus struktury D, platí-li f : D →0 D a
navíc Rng(f) = D. Automorﬁsmus struktury D je tedy vnoření struktury D do
sebe, které je na. Snadno lze ověřit, že pro libovolný automorﬁsmus f struktury D
platí f : D →e D. Jinými slovy, každý automorﬁsmus je elementárním vnořením.
Lemma 3.6.14 Když f je automorﬁsmus struktury D, pak pro libovolnou deﬁnovatelnou
množinu A ⊆ Dk
platí A = { [f(a1), . . , f(ak)] ; [a1, . . , ak] ∈ A }. Jinými
slovy, každá deﬁnovatelná množina nebo relace se libovolným automorﬁsmem zobrazí
sama na sebe.
Důkaz ponecháváme za cvičení.
Příklad 3.6.15 Množina N není deﬁnovatelnou množinou ve struktuře Z, +, 0 .
Automorﬁsmem a → −a se tato množina totiž nezobrazí sama na sebe.
Struktura Z, +, 0, 1 nemá žádný netriviální (tj. různý od identického) automorﬁsmus.
Na základě lemmatu 3.6.14 tedy nemůžeme přímo usoudit, že množina N
není deﬁnovatelná ve struktuře Z, +, 0, 1 . I. Korec navrhl následující úvahu.
Příklad 3.6.16 Nechť ϕ(x) je formule v jazyce {+, 0, 1}, která deﬁnuje množinu N
ve struktuře Z, +, 0, 1 . Pak v této struktuře platí sentence
∀x∀y(x + y = 0 → x = 0 ∨ (ϕ(x) ≡ ¬ϕ(y))),
neboť z dvojice [a, −a] je v N pro a = 0 vždy právě jeden prvek. Tato sentence
tedy musí platit i ve struktuře D s nosnou množinou Z×Q ze cvičení 17 oddílu 3.5.
Struktura D je totiž elementárně ekvivalentní se strukturou Z, +, 0, 1 , protože
obě jsou modely téže úplné teorie IAdd. Množina, kterou deﬁnuje formule ϕ ve
struktuře D, se však automorﬁsmem [a, b] → [a, −b] jistě nezobrazí sama na sebe.
Tudíž N není množina deﬁnovatelná ve struktuře Z, +, 0, 1 .
V předchozím příkladu jsme použili vědomost, že IAdd je úplná teorie. Tuto vědomost
jsme v předchozím oddílu získali pomocí eliminace kvantiﬁkátorů. Ukažme
si ještě jiné zdůvodnění faktu, že množina N není ve struktuře Z, +, 0, 1 deﬁnovatelná.
Odvoláme se v něm opět na eliminaci kvantiﬁkátorů, obejdeme se ale bez
lemmatu 3.6.14.
Deﬁnujme dočasně, že množina X ⊆ Z je periodická, jestliže existuje přirozené
číslo m > 0 takové, že ∀a ∈ Z(a ∈ X ⇔ a + m ∈ X). Dále deﬁnujme
rovněž dočasně, že množina X ⊆ Z je skoro periodická, jestliže se od některé periodické
množiny liší o nejvýše konečně mnoho prvků. Lze ověřit, že každá atomická
formule ϕ(x) v jazyce L+
IAdd deﬁnuje ve struktuře Z, +, 0, 1, =1, =2, . . . množinu,
která je skoro periodická. Pomocí booleovských operací může ze skoro periodických
množin vzniknout opět pouze skoro periodická množina. To znamená, že
otevřené formule v jazyce L+
IAdd deﬁnují pouze skoro periodické množiny. Víme, že
každá formule ϕ(x) v jazyce {+, 0, 1} je v teorii IAdd+
ekvivalentní s otevřenou
266 3 Predikátová logika
formulí v jazyce L+
IAdd. To znamená, že každá množina deﬁnovatelná ve struktuře
Z, +, 0, 1 je skoro periodická. Množina N není skoro periodická, není tedy ve
struktuře Z, +, 0, 1 deﬁnovatelná.
Vidíme, že nedeﬁnovatelnost určitých množin lze někdy dokázat pomocí eliminace
kvantiﬁkátorů pro jisté teorie. Možná, že význam eliminace kvantiﬁkátorů
pro určitou teorii T spočívá především v tom, že poskytuje informaci o množinách
deﬁnovatelných v modelech teorie T. Řada dalších příkladů deﬁnovatelných
a nedeﬁnovatelných množin je uvedena ve cvičeních.
Obraťme pozornost k poslední problematice tohoto oddílu i kapitoly, k interpretacím
a interpretovatelnosti. Předpokládejme, že T a S jsou axiomatické teorie.
Interpretovat teorii T v teorii S znamená vyčlenit v teorii S určité objekty (objekty
teorie T „v novém smyslu ) a deﬁnovat na těchto objektech operace a relace
příslušné k symbolům jazyka teorie T (funkce a predikáty „v novém smyslu ) tak,
aby „v novém smyslu platily všechny axiomy teorie T. Přitom „vyčlenit znamená
stanovit formuli δ(x) v jazyce teorie S zvanou obor interpretace, „deﬁnovat
znamená rozšířit teorii S o deﬁnice a „aby platilo znamená „dokazatelně v S .
Než přistoupíme k formulaci deﬁnice, ukažme si jednoduchý příklad. Zvolme
za S teorii s jazykem {<} a s axiomy LO1–LO3, DO1 a DO2. Rozšiřme teorii S
o tytéž deﬁnice, jako když jsme formulovali teorii DOS: objekt S(x) je deﬁnován
jako nejmenší z objektů větších než x a dále objekt 0 je nejmenší z objektů vůbec.
Uvnitř takto deﬁnovaného rozšíření S teorie S víme, že různé objekty nemají stejného
následníka, 0 není následníkem žádného objektu, konečným nenulovým počtem
skoků následnické funkce nelze z žádného objektu x dospět zpět do x. Protože právě
vyslovené sentence (jde o axiomy Q1, Q2 a Ln teorie SUCC) jsou univerzální, zůstanou
v platnosti, když se omezíme na objekty z jakéhokoliv oboru δ(x). Jako
obor δ(x) interpretace zvolme formuli
∀y≤x(∃v(v < y) → ∃v(v < y & ∀u(u < y → u ≤ v))),
kde ≤ má obvyklý význam menší nebo rovno. Prvkem oboru interpretace čili objektem
v novém smyslu je tedy každý objekt x splňující podmínku, že objekt x
i všechny menší objekty, kromě ovšem úplně nejmenšího, mají bezprostředního předchůdce.
Máme S ∀x(δ(x) → δ(S(x)), obor interpretace je uzavřen na následnickou
funkci. Dále máme S ∀x(δ(x) & x = 0 → ∃y(δ(y) & x = S(y))), „v novém
smyslu platí či „v interpretaci platí axiom Q3. Deﬁnice symbolů 0 a S a obor δ
tedy určují interpretaci teorie SUCC v teorii S.
Nechť tedy T a S jsou axiomatické teorie a S je rozšíření teorie S o deﬁnice.
Nechť L(U) označuje jazyk libovolné teorie U. Funkce z L(T) do L(S ) je překlad
symbolů, jestliže zachovává četnost i kategorii symbolů, tj. jestliže každý n-ární
funkční či predikátový symbol jazyka L(T) se funkcí zobrazí opět na n-ární funkční
resp. predikátový symbol jazyka L(S ). Nechť δ(x) je formule jazyka L(S) s nejvýše
jednou volnou proměnnou x. Řekneme, že funkce ∗ z množiny všech formulí
jazyka L(T) do množiny všech formulí jazyka L(S ) je překlad formulí založený na
překladu symbolů a na oboru δ(x), jestliže platí:
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 267
• je-li ϕ atomická formule, pak ϕ∗
je formule vzniklá z ϕ záměnou každého funkčního
symbolu F a každého predikátového symbolu P symbolem F resp. P ,
• je-li libovolná binární logická spojka, pak (ϕ ψ)∗
je ϕ∗
ψ∗
, a dále (¬ϕ)∗
je ¬ϕ∗
pro kterékoliv formule ϕ a ψ jazyka L,
• (∃xϕ)∗
je ∃x(δ(x) & ϕ∗
) a konečně (∀xϕ)∗
je ∀x(δ(x) → ϕ∗
) pro kteroukoliv
formuli ϕ jazyka L.
K tomu poznamenejme, že při nahrazování funkčních a predikátových symbolů se
nic neděje se symbolem =, tj. rovnítko se překládá samo na sebe. Řekneme, že
trojice [S , , δ], kde S je rozšíření teorie S o deﬁnice, funkce : L(T) → L(S ) je
překlad symbolů a δ(x) je formule v jazyce L(S), je interpretace teorie T v teorii S,
jestliže formule δ, překlad symbolů a překlad formulí ∗ založený na překladu
symbolů a na oboru δ(x) splňují podmínky:
(i) S ∃xδ(x),
(ii) S ∀x1 . . ∀xn(δ(x1) & . . & δ(xn) → δ(F (x))) pro libovolný funkční symbol
F ∈ L(T),
(iii) S ϕ∗
pro libovolný axiom ϕ teorie T.
Když [S , , δ] je interpretace teorie T v teorii S, pak formuli δ(x) říkáme obor
interpretace [S , , δ]. Řekneme, že teorie T je interpretovatelná v teorii S, jestliže
existuje interpretace teorie T v teorii S.
Příklad 3.6.17 Než jsme formulovali deﬁnici interpretace, zdůvodnili jsme, že teorie
SUCC je interpretovatelná v teorii S s jazykem {<} a axiomy LO1–LO3, DO1
a DO2. Teorie SUCC je ovšem interpretovatelná také v teorii (S + DO3), tj. v teorii
DO.
Příklad 3.6.18 Tento příklad je určen čtenářům s jistou znalostí teorie množin.
Nechť S je Zermelova-Fraenkelova teorie množin ZF, nechť AR označuje axiom
regularity. V ZF deﬁnujme posloupnost množin { pα ; α ∈ On } rekurzí: p0 = ∅,
dále pα+1 = P(pα), kde P(pα) označuje potenční množinu množiny pα, a konečně
pλ = α<λ pα, je-li λ limitní. Jako rozšíření S teorie T o deﬁnice volme opět
teorii ZF. V tom případě máme jen jednu možnost pro volbu překladu symbolů:
∈ = ∈. Jako obor interpretace δ(x) volme formuli x ∈ α∈On pα. Lze ověřit, že
takto deﬁnovaná interpretace [S , , δ] je interpretací teorie (ZF + AR) v teorii ZF.
Věta 3.6.19 Když teorie T je interpretovatelná v teorii S a S je bezesporná, pak
i T je bezesporná.
Důkaz Nechť [S , , δ] je interpretace teorie T v teorii S. Pro libovolný term t
jazyka L(T) nechť t∗
označuje výsledek záměny každého funkčního symbolu F
268 3 Predikátová logika
v termu t symbolem F . Pišme δ(x) místo konjunkce δ(x1) & . . & δ(xn). Podmínka
(ii) v deﬁnici interpretace říká, že je-li t term obsahující právě jeden funkční
symbol, platí
S ∀x(δ(x) → δ(t∗
(x))). (1)
Pro term obsahující nula funkčních symbolů to ovšem platí také. Indukcí podle
složitosti termu t lze snadno dokázat, že podmínka (1) platí pro každý term t.
Nechť dále ∀ϕ označuje univerzální uzávěr formule ϕ. Indukcí podle počtu kroků
v důkazu formule ϕ v teorii T lze dokázat, že pro libovolnou formuli ϕ v L(T) platí
implikace
T ϕ ⇒ S (∀ϕ)∗
. (2)
Ukažme si podrobněji například krok, kdy ϕ je axiom speciﬁkace tvaru ∀yψ→ψx(t).
Nechť x1, . . , xn jsou všechny proměnné, které se vyskytují volně ve formuli ∀yψ,
nechť z1, . . , zk jsou všechny proměnné, které se vyskytují v termu t a přitom nejsou
mezi x1, . . , xn. Mezi z1, . . , zk může nebo nemusí být proměnná y. Formule ϕ má
tedy tvar ∀yψ(x, y) → ψ(x, t(x, z)) a formule (∀ϕ)∗
je formule
∀x∀z(δ(x) & δ(z) → (∀y(δ(y) → ψ∗
(x, y)) → ψ∗
(x, t∗
(x, z)))).
Toto je formule dokazatelná v teorii S , neboť uvnitř S z podmínky (1) víme,
že platí-li δ(x) a δ(z), pak pro y = t∗
(x, z) platí δ(y). Zbývající úvahy v důkazu
podmínky (2) jsou podobné a ponecháváme je za cvičení.
Je-li teorie T sporná, pak v T lze dokázat sentenci ∃x(x = x). Označme tuto
sentenci ϕ. Podmínka (2) dává S ϕ∗
, tj. S ∃x(δ(x) & x = x). Protože
S je konzervativní rozšíření teorie S a ϕ je sentence jazyka L(S), máme S ϕ∗
.
Evidentně ale platí i S ¬ϕ∗
. QED
Pomocí interpretací lze tedy někdy dokázat bezespornost určitých teorií. Přitom
je zajímavé, že jde o čistě syntaktickou metodu pro prokazování bezespornosti.
To má význam zejména v situaci, kterou naznačuje příklad 3.6.18, při úvahách o
„silných teoriích, u kterých nemáme k dispozici přímé konstrukce modelů. Fakt,
že (ZF + AR) je interpretovatelná v ZF, znamená, že (ZF + AR) je bezesporná
teorie, pokud ovšem ZF je bezesporná teorie. Říká se také, že interpretovatelnost
teorie (ZF + AR) v ZF znamená relativní bezespornost teorie (ZF + AR) vůči teorii
ZF. Tvrdíme-li, že nějaká teorie tvaru (T + ϕ) je relativně bezesporná vůči
teorii T, říkáme tím, že teorie (T + ϕ) sice může být sporná, nový axiom ϕ však za
případný spor určitě nemůže.
Pojem interpretace není zvlášť stabilním pojmem, v literatuře lze nalézt jeho
různé varianty. Například teorie T je lokálně interpretovatelná v teorii S, jestliže
každá konečná množina F ⊆ T je (v našem smyslu) interpretovatelná v S. Všimněme
si, že věta 3.6.19 by platila i v případě, kdybychom v ní psali „lokálně interpretovatelná
místo „interpretovatelná . Jsou možné také interpretace s neabsolutní
rovností nebo vícedimenzionální interpretace. Deﬁnice interpretace s neabsolutní
rovností připouští, aby překladem rovnítka byl nějaký binární predikátový symbol
(ne nutně rovnítko); podmínka (iii) v deﬁnici interpretace pak zní „S ϕ∗
, kdykoliv
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 269
ϕ je axiom teorie T nebo axiom rovnosti . Deﬁnice vícedimenzionální interpretace
teorie T v teorii S připouští (požaduje), aby překladem formule s k volnými proměnnými
byla formule s m · k volnými proměnnými, tj. aby objekt teorie T byl
interpretován jako m-tice objektů teorie S. Náš pojem interpretace byl deﬁnován
v knize [92] a lze jej označit za globální jednodimenzionální interpretaci s absolutní
rovností.
Studium interpretovatelnosti axiomatických teorií a různých variant pojmu interpretace
má v pražském či středoevropském prostředí velmi dobrou tradici, viz
např. Hájkovy články [33] nebo [30]. Také větu 3.6.22 a související tvrzení uvedené
ve cvičení 24 dokázal Petr Hájek. Novější zdroj relevantních odkazů a informací
o interpretovatelnosti axiomatických teorií je například Visserův přehledový článek
[96]. Protože se však tento článek týká interpretovatelnosti teorií obsahujících
nějakou verzi aritmetiky, lze jej doporučit pouze čtenářům, kteří mají představu o
obsahu kapitoly 4 a oddílu 5.3 našeho textu.
Řekneme, že struktura A je deﬁnovatelná ve struktuře B, jestliže nosná množina
A struktury A a realizace FA
a PA
všech funkčních a predikátových symbolů
jsou deﬁnovatelné množiny ve struktuře B.
Lemma 3.6.20 Když teorie T je interpretovatelná v teorii S, pak ke každému
modelu M teorie S existuje model D teorie T, který je deﬁnovatelnou strukturou
v modelu M.
Důkaz Nechť [S , , δ] je interpretace teorie T v teorii S, nechť ∗ je překlad formulí
založený na překladu symbolů a na oboru δ a nechť je dán model M teorie S.
Za nosnou množinu struktury D vezměme množinu D = { a ∈ m ; M |= δ[a] }.
Nechť F ∈ L(T) je libovolný n-ární funkční symbol. Když F ∈ L(S), vezměme
za formuli η(x, y) formuli (F(x) = y)∗
, tj. formuli F (x) = y. Když
F ∈ L(S ) − L(S), vezměme za formuli η(x, y) formuli užitou k deﬁnování symbolu
F , tj. tu formuli, která vystupuje v podmínce (d2) věty 3.5.3. V obou případech
je formule η(x, y) formulí jazyka L(S). Deﬁnujme realizaci FD
symbolu F
jako množinu { [a, b] ; M |= η[a, b] }. Množina FD
je deﬁnovatelnou množinou
struktury M. Analogicky deﬁnujeme realizaci PD
libovolného predikátového symbolu
P. Tím jsme získali strukturu D deﬁnovatelnou ve struktuře M. Snadno lze
ověřit, že pro libovolnou formuli ϕ(x1, . . , xk) jazyka L(T) a prvky a1, . . , ak ∈ D
platí ekvivalence
D |= ϕ[a] ⇔ M |= ϕ∗
[a].
Protože M |= ϕ∗
pro libovolný axiom ϕ teorie T, struktura D je modelem teorie T.
QED
Příklad 3.6.21 Ukažme pomocí lemmatu 3.6.20, že teorie DO není interpretovatelná
v teorii SUCC. Vezměme model M = N, 0, s + Z, s + Z, s , tj. model
podobný jako na obrázku 3.4.1, ale se dvěma celočíselnými oblastmi. Nechť D
je struktura deﬁnovatelná ve struktuře M, která je modelem teorie DO. Modiﬁkací
úvahy z cvičení 15, tj. na základě faktu, že teorie SUCC připouští eliminaci
270 3 Predikátová logika
kvantiﬁkátorů, lze zdůvodnit, že každá množina deﬁnovatelná ve struktuře M je
buď konečnou podmnožinou oblasti N, 0, s , nebo je komplementem takové podmnožiny.
Protože každý model teorie DO je nekonečný, pro nosnou množinu D
struktury D platí druhý případ. Množina D tedy obsahuje všechny prvky obou celočíselných
oblastí modelu M (plus skoro všechny prvky oblasti N, 0, s ). Zvolme
prvky a a b různých celočíselných oblastí. Zvolme automorﬁsmus f, pro který
platí f(a) = b a f(b) = a. Automorﬁsmus f zobrazí každou z obou celočíselných
oblastí na druhou z nich a oblast N, 0, s ponechá na místě. Z platnosti axiomů
LO2 a LO3 (viz str. 172) ve struktuře D plyne ekvivalence a <D
b ⇔ ¬(b <D
a).
Použití lemmatu 3.6.14 na relaci <D
dává [a, b] ∈ <D
⇔ [f(a), f(b)] ∈ <D
, tj.
a <D
b ⇔ b <D
a. To je spor.
Někdy se píše S £ T jako zkratka pro fakt, že teorie T je interpretovatelná
v teorii S. Relace £ je reﬂexivní a tranzitivní, a má některé vlastnosti společné
s relací ≤m. Vztah S £ T můžeme číst „T není o mnoho silnější než S . Naše
příklady říkají, že teorie (ZF + AR) není o mnoho silnější než teorie ZF, kdežto
teorie DO je o dost silnější než teorie SUCC. Snadno lze domyslet, že například
teorie LO a SUCC jsou vůči relaci £ nesrovnatelné.
Nakonec si ukažme, že je-li teorie T konečně axiomatizovatelná, pak tvrzení
lemmatu 3.6.20 lze obrátit. To znamená, že pojem interpretace má (alespoň za
jistého předpokladu o interpretované teorii) také sémantickou charakterizaci.
Věta 3.6.22 Nechť T je konečně axiomatizovatelná a nechť ke každému modelu M
teorie S existuje model teorie T, který je deﬁnovatelnou strukturou v modelu M.
Pak T je interpretovatelná v S.
Důkaz Nechť ϕ1, . . , ϕm jsou všechny axiomy teorie T. Můžeme si myslet, že
jazyk L(T) je konečný a že L(T) = {P1, . . , Pq, F1, . . , Fr}, kde P1, . . , Pq jsou predikátové
symboly a F1, . . , Fr jsou funkční symboly. Uvažujme rozšíření S teorie S
o deﬁnice a funkci z L(T) do L(S ), která je překladem symbolů. Teorie S
je z teorie S utvořena přidáním axiomů γ1, . . , γp, kde každá sentence γi má tvar
(d1) nebo (d2) z věty 3.5.3, tj. deﬁnuje nějaký funkční nebo predikátový symbol pomocí
jisté formule ε nebo η, přičemž ε či η je formule v jazyce L(S ∪{γ1, . . , γi−1}).
Protože z cvičení 11 předchozího oddílu víme, že každá formule s deﬁnovanými
symboly je ekvivalentní s formulí v původním jazyce L(S), můžeme si myslet, že
formule ε či η je formule v L(S). Překlad tedy vlastně každému predikátovému
(či funkčnímu) symbolu P (či F) četnosti n přiřazuje buď formuli ε(x1, . . , xn)
(či η(x1, . . , xn)) užitou k deﬁnici symbolu P (či F ), nebo symbol P ∈ L(S)
(či symbol F ∈ L(S)). V druhém případě si mysleme, že mu přiřazuje formuli
P (x1, . . , xn) (či formuli F (x1, . . , xn) = y). Rozšíření S teorie S o deﬁnice
spolu s překladem symbolů a překladem formulí je tedy vlastně totéž co posloupnost
[ε1(x), . . , εq(x), η1(x, y), . . , ηr(x, y), δ(x)], (1)
přičemž x ve formuli εi(x) znamená x1, . . , xni , kde ni je četnost symbolu Pi, a x
ve formuli ηi(x, y) znamená x1, . . , xnq+i , kde nq+i je četnost symbolu Fi. Naopak,
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 271
máme-li posloupnost s formulí tvaru (1), je určeno rozšíření S(s) teorie S o deﬁnice,
překlad symbolů (s) a překlad formulí ∗(s). Můžeme tedy říci, že posloupnost (1)
je interpretací (určuje interpretaci) teorie T v teorii S, je-li v S dokazatelná sentence
r
i=1
∀x∃!yηi(x, y) &
r
i=1
∀x∀y(δ(x) & ηi(x, y) → δ(y)) & ∃xδ(x) &
m
j=1
ϕ
∗(s)
j .
Označme tuto sentenci ξ(s).
Dále postupujme sporem. Předpokládejme, že T není interpretovatelná v S a současně
že pro každý model M teorie S existuje model D teorie T, který je deﬁnovatelnou
strukturou v modelu M. Protože T není interpretovatelná v S, pro každou
posloupnost s tvaru (1) je S, ¬ξ(s) bezespornou teorií. Rozmysleme-si, že je-li
s1 = [ε(1)
, η(1)
, δ(1)
], s2 = [ε(2)
, η(2)
, δ(2)
], . . , sk = [ε(k)
, η(k)
, δ(k)
]
libovolná konečná posloupnost posloupností tvaru (1), pak i S∪{¬ξ(s1), . . , ¬ξ(sk)}
je bezespornou teorií. Když ne, pak S ξ(s1) ∨ . . ∨ ξ(sk). Deﬁnujme formuli δ(x)
předpisem
δ(x) ≡ (δ(1)
(x) & ξ(s1)) ∨
∨ (δ(2)
(x) & ¬ξ(s1) & ξ(s2)) ∨
...
∨ (δ(k)
(x) & ¬ξ(s1) & . . & ¬ξ(sk−1)).
(2)
Přitom u posledního řádku si všimněme, že uvnitř teorie S z ¬ξ(s1)& . . &¬ξ(sk−1)
plyne ξ(sk). Překlad Fi symbolu Fi, kde 1 ≤ i ≤ r, deﬁnujme předpisem
Fi(x, y) ≡ (η
(1)
i (x, y) & ξ(s1)) ∨
∨ (η
(2)
i (x, y) & ¬ξ(s1) & ξ(s2)) ∨
...
∨ (η
(k)
i (x, y) & ¬ξ(s1) & . . & ¬ξ(sk−1)).
(3)
Analogicky deﬁnujme překlad Pi , kde 1 ≤ i ≤ q, každého predikátového symbolu
Pi ∈ L(T). Z podmínky S ξ(si) plyne, že formule (2), r formulí (3) a
příslušných q formulí pro predikátové symboly deﬁnují interpretaci teorie T v teorii
S, což je spor s předpokladem, že T není interpretovatelná v S. Každé rozšíření
S ∪ {¬ξ(s1), . . , ¬ξ(sk)} teorie S, kde s1, . . , sk jsou posloupnosti tvaru (1), je tedy
bezesporné. Dle věty o kompaktnosti či věty o silné úplnosti existuje model M
teorie S, ve kterém současně platí všechny sentence ¬ξ(s), kde s je posloupnost
tvaru (1). Podle předpokladu existuje model D teorie T, který je deﬁnovatelnou
strukturou v M.
Vezměme formuli δ, která ve struktuře M deﬁnuje nosnou množinu struktury D,
formule ε1, . . , εq, které deﬁnují realizace PD
1 , . . , PD
q predikátových symbolů, a formule
η1, . . , ηr, které deﬁnují realizace FD
1 , . . , FD
r funkčních symbolů jazyka L(T).
272 3 Predikátová logika
Protože posloupnost s = [ε, η, δ] je tvaru (1), máme M |= ¬ξ(s). Na druhé straně,
pro překlad ∗ založený na posloupnosti s a pro libovolnou sentenci ψ v L(T) platí
ekvivalence M |= ψ∗
⇔ D |= ψ, a to ze stejných důvodů jako v důkazu lemmatu
3.6.20. Protože D je model teorie T, máme M |= ϕ∗
j pro libovolný axiom ϕj
teorie T. Tedy M |= ξ(s), spor. QED
Na závěr této kapitoly o predikátové logice je pravděpodobně užitečné připomenout
si otázky vyjmenované v Úvodu a uvědomit si, že alespoň na některé nyní
umíme uspokojivě odpovědět. Ano, pojem důkazu lze (více způsoby) formálně deﬁnovat.
Díky tomu můžeme v některých případech ukázat, že určité tvrzení není
dokazatelné z daných předpokladů. Za rozumných předpokladů o množině předpokladů
existuje algoritmus, který o dané posloupnosti znaků rozhodne, zda je nebo
není důkazem, a pro některé struktury existuje algoritmus, který pro danou formuli
rozhodne, zda v oné struktuře platí. Nad rámec otázek uvedených v Úvodu také
víme, že existují metody, které dovolují dokázat, že určité vlastnosti struktur nejsou
vyjádřitelné v daném jazyce, tj. že určité třídy struktur nejsou axiomatizovatelné.
Vynořily se ale také otázky, na které odpovědět zatím neumíme. Nevíme například,
zda existují konečně axiomatizovatelné nerozhodnutelné teorie. Také jsme se zatím
nepokusili axiomatizovat strukturu N přirozených čísel.
Cvičení
1. Zdůvodněte, že je-li D konečná struktura pro konečný jazyk, pak Th(D) je
v PSPACE.
2. Zdůvodněte užitím věty 3.6.6, že když nerekurzívní množina v příkladech
3.6.2 a 3.6.3 je navíc rekurzívně spočetná, pak Thm(T1) ∈ RS. Pro teorii T2
ale v tom případě platí Thm(T2) /∈ RS.
3. Zdůvodněte, že z první části předchozího cvičení a z věty 3.6.7 plyne existence
teorií, které mají primitivně rekurzívní množinu axiomů a jsou nerozhodnu-
telné.
4. Když má teorie T jen konečně mnoho úplných rozšíření a všechna jsou rozhodnutelná,
pak T je rozhodnutelná. Dokažte.
5. Dokažte na základě předchozího cvičení, že teorie s jazykem {<} a axiomy
LO1–LO3 a Dn1 je rozhodnutelná.
6. Dokažte, že množina všech totálních aritmetických funkcí, jejichž graf je současně
v Σ2 i v Π2, je uzavřená na operace substituce a primitivní rekurze.
7. Dokažte, že ke každé rozhodnutelné teorii existuje její rozšíření v tomtéž jazyce,
které je úplné a rozhodnutelné.
3.6 Rozhodnutelnost, deﬁnovatelnost, interpretovatelnost 273
8. Dokažte, že každá jednoprvková množina je deﬁnovatelná ve struktuře N, < .
Nechť dále R je relace { [x, y] ; |x − y| = 1 }. Dokažte, že i ve struktuře N, R
je každá jednoprvková množina deﬁnovatelná.
9. Dokažte, že ve struktuře N, 0, s, · je deﬁnovatelné sčítání přirozených čísel.
Návod. Ověřte a využijte implikaci a+b = c ⇒ (1+ac)(1+bc) = 1+c2
(1+ab).
10. Dokažte, že ve struktuře N, +, 0, s, f , kde f je umocňování na druhou (jako
funkce jedné proměnné), je deﬁnovatelná operace násobení.
11. Která celá čísla jsou deﬁnovatelná ve struktuře Z, + ? A která ve struktuře
Z, +, 0, 1 ?
12. Dokažte lemma 3.6.14.
13. Když f : A →0 B a každý prvek struktury A je deﬁnovatelný, pak f : A →e B.
Dokažte.
14. Když f : A →e B a Rng(f) = B, pak množina Rng(f) není ve struktuře B
deﬁnovatelná. Dokažte. Vyvoďte z předchozích dvou cvičení, že množina N
není deﬁnovatelná ve struktuře z obrázku 3.4.1.
15. Zdůvodněte, že množina X ⊆ N je deﬁnovatelná ve struktuře N, 0, s , právě
když X nebo N − X je konečná množina. Množina všech sudých čísel tedy ve
struktuře N, 0, s není deﬁnovatelná.
16. Je-li relace R ⊆ Nk
deﬁnovatelná ve struktuře N, 0, s , pak existuje číslo m
takové, že pro každé i a každou volbu čísel a1, . . , ai−1, ai+1, . . , ak množina
{ b ; [a1, . . , ai−1, b, ai+1, . . , ak] ∈ R } nebo její komplement má nejvýše m
prvků. Dokažte. Platí analogická věta i pro strukturu N, 0, s, < ? Vyvoďte
z toho, že relace < není ve struktuře N, 0, s deﬁnovatelná.
17. Vyvoďte z cvičení 16 oddílu 3.5, že je-li X ⊆ Q deﬁnovatelná ve struktuře
Q, < , pak X = ∅ nebo X = N, a že je-li X ⊆ Q2
deﬁnovatelná ve
struktuře Q, < , pak X je jedna z osmi množin ∅, =, <, ≤, =, >, ≥, Q2
.
18. Zdůvodněte, že každá množina X ⊆ R deﬁnovatelná ve struktuře R je konečným
sjednocením intervalů a jednoprvkových množin, přičemž se ovšem
připouštějí i intervaly s nevlastními konci. Množina N tedy ve struktuře R
není deﬁnovatelná.
19. Vypracujte všechny vynechané případy v důkazu věty 3.6.19. V kterých z nich
se uplatní podmínka S ∃xδ(x)?
20. Zdůvodněte, že relace £ je reﬂexivní a tranzitivní.
21. Dokažte, že žádná z teorií LO a SUCC není interpretovatelná v druhé.
274 3 Predikátová logika
22. Dokažte, že teorie DO není interpretovatelná v teorii IAdd.
Návod. Přizpůsobte úvahu o skoro periodických množinách uvedenou za příkladem
3.6.16 pro model M z cvičení 17 oddílu 3.5. Úvahu z příkladu 3.6.21
pak přizpůsobte pro automorﬁsmus [a, b] → [a, −b].
23. Dokažte, že ani teorie IAdd není interpretovatelná v teorii DO.
24. Když ϕ a ψ jsou sentence v jazyce teorie S a teorie T je interpretovatelná
v teorii S, ϕ i v teorii S, ψ, pak T je interpretovatelná i v teorii S, ϕ ∨ ψ.
Dokažte.
25. Dokažte, že když T je rekurzívně axiomatizovatelná, pak { ϕ ; T £ (T + ϕ) },
tj. množina všech sentencí ϕ takových, že teorie T + ϕ je interpretovatelná
v teorii T, je Σ3. Když T je konečně axiomatizovatelná, pak {ϕ; T £ (T +ϕ)}
je dokonce rekurzívně spočetná.
4
Peanova a Robinsonova
aritmetika
Hilbert . . . had, if not criteria, guidelines in the selection of axioms. Completeness
and simplicity were two desiderata he cited in the introduction to Grundlagen;
consistency was, of course, another. None of these desiderata was entirely unproblematic.
(C. Smory´nski, [81])
Z dosavadního textu čtenář jistě vytušil, že strukturu N přirozených čísel pokládáme
za jednu z nejdůležitějších matematických struktur. V této kapitole se budeme
zabývat studiem Peanovy aritmetiky PA, kterou lze chápat jako vážný pokus
o axiomatizaci struktury N. Budeme se ptát, zda jde o pokus úspěšný, a pokud ne,
zda lze uspět s nějakou teorií jinou než Peanova aritmetika. K nalezení odpovědí
na tyto otázky použijeme některé vědomosti z teorie rekurzívních funkcí.
Budeme se snažit čtenáře přesvědčit, že bez ohledu na to, jak dopadnou odpovědi
na tyto otázky, Peanova aritmetika je životaschopnou teorií, která může být
pokládána za (jedno z možných) prostředí pro matematickou práci. Na námitku,
že jako standardní prostředí pro matematickou práci je většinou přijímána (taková
nebo onaká) teorie množin, odpovídáme ano, je tomu tak, ale všechny důležité
výsledky, které získáme pro Peanovu aritmetiku, se budou vztahovat i na teorii
množin a obecně na všechny axiomatické teorie, ve kterých lze Peanovu aritmetiku
interpretovat.
Kromě Peanovy aritmetiky se budeme zabývat také Robinsonovou aritmetikou
Q. Brzy zjistíme, že Robinsonova aritmetika je o mnoho slabší teorií než
aritmetika Peanova, takže ji nelze považovat za pokus o axiomatizaci struktury N.
Bude ale zajímavé pozorovat, že některé důležité vlastnosti, které sdílejí Peanova
aritmetika a teorie množin, má už Robinsonova aritmetika. Důležitou výhodou
Robinsonovy aritmetiky je také to, že má jen konečně mnoho axiomů.
4.1 Axiomy a modely
Peanova a Robinsonova aritmetika jsou axiomatické teorie formulované ve společném
aritmetickém jazyce, s kterým jsme se již setkali v kapitole 3. Jde o jazyk
276 4 Peanova a Robinsonova aritmetika
{+, ·, 0, S, ≤, <} obsahující dva binární funkční symboly, jednu konstantu, jeden
unární funkční symbol a dva binární predikátové symboly. Robinsonova aritmetika
Q má následujících devět axiomů:
Q1: ∀x∀y(S(x) = S(y) → x = y),
Q2: ∀x(S(x) = 0),
Q3: ∀x(x = 0 → ∃y(x = S(y))),
Q4: ∀x(x + 0 = x),
Q5: ∀x∀y(x + S(y) = S(x + y)),
Q6: ∀x(x · 0 = 0),
Q7: ∀x∀y(x · S(y) = x · y + x),
Q8: ∀x∀y(x ≤ y ≡ ∃v(v + x = y)),
Q9: ∀x∀y(x < y ≡ ∃v(S(v) + x = y)).
Peanova aritmetika PA má týchž devět axiomů Q1–Q9 a navíc schéma indukce
Ind: ∀y1 . . ∀yn(ϕ(0, y) & ∀x(ϕ(x, y) → ϕ(S(x), y)) → ∀xϕ(x, y)),
kde ϕ je formule, která nemá jiné volné proměnné než x, y1, . . , yn. Peanova aritmetika
má tedy nekonečně mnoho axiomů. Schéma indukce dovoluje vytvořit axiom
indukce z libovolné formule ϕ; tento axiom označme Ind(ϕ). Proměnným y1, . . , yn
ve formuli Ind(ϕ) se říká parametry a schéma Ind se někdy označuje přesněji jako
schéma parametrické indukce.
Všimněme si, že v axiomech Q1–Q3 se vyskytují pouze symboly 0 a S, v Q1–Q5
se nevyskytuje násobení, v Q1–Q7 se nevyskytují symboly ≤ a < pro uspořádání.
Axiomy Q8 a Q9 dávají do souvislosti sčítání a uspořádání a jsou vlastně deﬁnicemi
symbolů ≤ a < (ve smyslu věty 3.5.3). Za „opravdové axiomy lze pokládat jen axiomy
Q1–Q7. Axiomy Q1–Q3 sdílí Robinsonova i Peanova aritmetika s teorií SUCC
z kapitoly 3.
Ukažme si dvě jednoduchá použití axiomu indukce. Nejprve označme ϕ(x) formuli
0 + x = x a uvažujme za předpokladu ϕ(x):
Nechť 0 + x = x. Pak S(0 + x) = S(x). Axiom Q5 dává S(0 + x) = 0 + S(x).
Tedy 0 + S(x) = S(x).
Tím jsme v Q, a tedy i v PA, dokázali sentenci ∀x(ϕ(x) → ϕ(S(x))). Sentence ϕ(0),
tj. sentence 0+0 = 0, je ovšem také dokazatelná díky axiomu Q4. V axiomu Ind(ϕ)
příslušném k formuli ϕ jsou tedy dokazatelné obě premisy. Tedy PA ∀x(0+x = x).
To je ne zcela triviální výsledek, protože zatím nevíme, zda z axiomů Robinsonovy
nebo Peanovy aritmetiky plyne komutativita sčítání.
Nyní za ϕ(x, y, z) vezměme formuli (z + y) + x = z + (y + x). Dokazujme
v Peanově aritmetice:
4.1 Axiomy a modely 277
Nechť y a z jsou dána. Axiom Q4 dává ϕ(0, y, z). Nechť dále x je dáno a nechť
(z + y) + x = z + (y + x). Pak S((z + y) + x) = S(z + (y + x)). Užijme
axiom Q5 jednou na levou stranu: S((z +y)+ x) = (z +y)+S(x) a dvakrát na
pravou stranu: S(z + (y + x)) = z + S(y + x) = z + (y + S(x)). Dohromady:
(z+y)+S(x) = z+(y+S(x)). Ověřili jsme, že ∀x(ϕ(x, y, z) → ϕ(S(x), y, z)).
Aplikujeme-li axiom Ind(ϕ) na y a z, máme ∀xϕ(x, y, z). Protože čísla y a z
byla libovolná, máme ∀x∀y∀zϕ(x, y, z).
Tím jsme v PA lze dokázali asociativitu sčítání. Další vlastnosti aritmetických
operací a uspořádání dokazatelné v PA jsou uvedeny v následující větě.
Věta 4.1.1 Následující sentence jsou dokazatelné v PA.
(a) Vlastnosti aritmetických operací:
∀x∀y∀z((z + y) + x = z + (y + x)), ∀x∀y∀z(z · (y + x) = z · y + z · x),
∀x(0 + x = x), ∀x∀y∀z((z · y) · x = z · (y · x)),
∀x∀y(S(y) + x = S(y + x)), ∀x(x = S(x)),
∀x∀y(y + x = x + y), ∀x∀y∀z(y + x = z + x → y = z),
∀x(0 · x = 0), ∀x∀y(x + y = 0 → x = 0 & y = 0),
∀x∀y(S(y) · x = y · x + x), ∀x∀y(x · y = 0 → x = 0 ∨ y = 0),
∀x∀y(y · x = x · y), ∀x∀y∃u(u + x = y ∨ u + y = x).
(b) Vlastnosti relace <:
∀x∀y∀z(x < y & y < z → x < z), ∀x∀y(x < y ∨ x = y ∨ y < x).
∀x¬(x < x),
(c) Vztah relací ≤ a < k sobě navzájem a k operacím:
∀x∀y(x ≤ y ≡ x < y ∨ x = y), ∀x∀y∀z(x < y → x + z < y + z),
∀x∀y(x < S(y) ≡ x < y ∨ x = y), ∀x∀y∀z(x < y & z = 0 → x · z < y · z).
Důkaz Většinu sentencí v (a) lze dokázat indukcí podobně, jako jsme už dokázali
první dvě sentence v levém sloupci. „Indukční proměnná je v tom případě vždy
označena x. Sentence jsou seřazeny, někdy lze využít už dokázané předchozí sentence.
Podívejme se třeba na poslední sentenci vpravo dole. Označme ϕ(x, y) formuli
∃u(u+x = y ∨ u+y = x) a ukažme si důkaz formule ∀x(ϕ(x, y)→ϕ(S(x), y)):
Nechť u je takové, že u + x = y nebo u + y = x. Když u + y = x, pak dle třetí
sentence v levém sloupci S(u) + y = S(x). Nechť tedy u + x = y. Rozlišme
ještě případy u = 0 a u = 0. Když u = 0, pak, podle Q3, u = S(v) pro
jisté v. Tedy S(v) + x = y. Opětovné užití třetí sentence vlevo a axiomu Q5
dává v + S(x) = y. Když u = 0, druhá a třetí sentence vlevo dávají y = x
a S(0) + y = S(x). Ve všech případech tedy lze k jednomu z čísel S(x) a y
přičíst zleva něco tak, aby výsledek byl roven druhému z nich.
278 4 Peanova a Robinsonova aritmetika
Převedeme-li užitím axiomů Q8 a Q9 sentence v (b) a (c) na ekvivalentní sentence
neobsahující symboly ≤ a <, vždy dostaneme sentence, které lze snadno dokázat
ze sentencí v (a), a to bez indukce. QED
V PA lze tedy dokázat, že operace s přirozenými čísly a uspořádání mají očekávané
vlastnosti: sčítání i násobení jsou asociativní a komutativní operace, násobení
je distributivní vůči sčítání, relace ≤ a < skutečně jsou neostré a ostré uspořádání,
nula je nejmenší přirozené číso, největší přirozené číslo neexistuje, číslo S(x) je vždy
nejmenší mezi čísly většími než x atd.
Existuje několik axiomatických schémat ekvivalentních se schématem indukce.
Jedním z nich je princip nejmenšího prvku, anglicky least number principle: existuje-li
nějaké přirozené číslo s určitou vlastností nebo s určitým vztahem k daným
parametrům, pak existuje i nejmenší přirozené číslo s onou vlastností nebo s oním
vztahem k týmž parametrům:
LNP: ∀y1 . . ∀yn(∃xϕ(x, y) → ∃x(ϕ(x, y) & ∀v<x¬ϕ(v, y))).
Zápis ∀v<x¬ϕ(v, y) je ovšem zkratka pro ∀v(v < x → ¬ϕ(v, y)). Stejně jako
u schématu indukce i tady označme LNP(ϕ) instanci schématu LNP utvořenou
z formule ϕ. V souladu s úmluvou uzavřenou na str. 152 před příkladem 3.1.25
má proměnná v ve formuli LNP(ϕ) pouze ty výskyty, které jsou naznačeny (tj.
v kvantiﬁkátoru ∀v, v atomické formuli v < x a dále výskyty v podformuli ¬ϕ(v, y),
které se tam objevily substitucí za proměnnou x), a nemá tedy žádné volné výskyty
ve formuli ϕ(x, y).
Věta 4.1.2 Teorie s axiomy Q1–Q9, ∀x(x < S(x)) a se schématem LNP je ekvivalentní
s PA.
Důkaz Sentence ∀x(x < S(x)) snadno plyne z druhé formule vlevo v 4.1.1(c), a je
tedy dokazatelná v PA. Nechť proměnná v se nevyskytuje volně ve formuli ϕ(x, y).
Dokážeme v PA formuli LNP(ϕ). Vynechme v LNP(ϕ) kvantiﬁkátory ∀y1 . . ∀yn a
výslednou formuli pišme v ekvivalentním tvaru
∀x(∀v<x¬ϕ(v, y) → ¬ϕ(x, y)) → ∀x¬ϕ(x, y).
Uvažujme v PA:
Předpokládejme, že pro daná y platí
∀x(∀v<x¬ϕ(v, y) → ¬ϕ(x, y)). (1)
Z implikace → v druhé formuli vlevo v 4.1.1(c) víme, že před S(x) není nic
jiného než x a čísla menší než x. Tedy
∀x(∀v<x¬ϕ(v, y) → ∀v<S(x)¬ϕ(v, y)). (2)
Protože neexistují čísla menší než 0 (cvičení), máme také
∀v<0¬ϕ(v, y). (3)
Axiom Ind(∀v<x¬ϕ(v, y)) spolu s (2) a (3) dává ∀x∀v<x¬ϕ(v, y). Z toho
dále plyne ∀x∀v<S(x)¬ϕ(v, y), a také ∀x¬ϕ(x, y), protože mezi čísly v menšími
než S(x) je i x. To jsme měli dokázat.
4.1 Axiomy a modely 279
Nechť nyní formule ϕ a proměnná x jsou dány. Dokažme formuli Ind(ϕ) v teorii,
jejíž axiomy jsou Q1–Q9, ∀x(x < S(x)) a schéma LNP:
Nechť ϕ(0, y) a ∀x(ϕ(x, y) → ϕ(S(x), y)). Platí-li ¬∀xϕ(x, y), pak podle
LNP(¬ϕ) existuje nejmenší číslo, pro které neplatí ϕ. Označme toto číslo z.
Máme tedy ¬ϕ(z, y) a ∀v<z ϕ(v, y). Z ¬ϕ(z, y) a ϕ(0, y) plyne z = 0. Dle
Q3 tedy platí z = S(u) pro jisté u. Takže ¬ϕ(S(u), y) a ∀v<S(u)ϕ(v, y).
Mezi čísly v menšími než S(u) je i u. Tedy ¬ϕ(S(u), y) a ϕ(u, y). To je spor
s předpokladem ∀x(ϕ(x, y) → ϕ(S(x), y)).
QED
O sentenci ∀x(x < S(x)) v tomto okamžiku není zřejmé, je-li dokazatelná s užitím
schématu LNP. Zatím není vyloučeno ani to, že je dokazatelná už v Q. O všech
případech, kdy jsme dosud použili schéma Ind nebo LNP, vlastně z dosavadního
výkladu není zřejmé, že použití některého z těchto schémat bylo nutné.
• Lze ty sentence z věty 4.1.1, které jsme dokázali užitím schématu Ind, dokázat
i bez užití indukce? Jinými slovy, lze je dokázat už v Q?
• Lze sentenci ∀x(x < S(x)) dokázat v teorii s axiomy Q1–Q9 a se schématem
LNP?
Odpovědi na tyto otázky se ozřejmí ještě v tomto oddílu, jakmile obrátíme pozornost
k modelům Robinsonovy aritmetiky.
Před větou 4.1.1 jsme uvedli dva příklady užití axiomu indukce. V druhém z nich
jsme axiom indukce utvořili z formule (z + y) + x = z + (y + x), a v příslušném axiomu
tedy vystupovaly dva parametry y a z. V prvním příkladu jsme se obešli bez
parametrů. Lze se vždy obejít bez parametrů? Schéma neparametrické indukce připouští
jako axiom každou sentenci tvaru ϕ(0) & ∀x(ϕ(x) → ϕ(S(x)) → ∀xϕ(x),
kde formule ϕ nemá jiné volné proměnné než x.
• Jsou schémata parametrické a neparametrické indukce navzájem ekvivalentní?
Na tuto otázku můžeme odpovědět okamžitě.
Věta 4.1.3 Schémata parametrické a neparametrické indukce jsou nad Robinsonovou
aritmetikou ekvivalentní. Jinými slovy, každou instanci schématu parametrické
indukce lze dokázat s užitím neparametrické indukce a případně axiomů Q1–Q9.
Důkaz Mějme axiom indukce Ind(ϕ(x, y)) utvořený z formule ϕ(x, y), která obsahuje
parametry y1, . . , yn, kde n ≥ 1. Tento axiom máme dokázat neparametrickou
indukcí. Označme ψ(z) formuli
∀y(ϕ(0, y) & ∀x(ϕ(x, y) → ϕ(S(x), y)) → ϕ(z, y)).
Dívejme se na formuli ϕ(z, y) tak, že reprezentuje systém množin. Pro každou n-tici
(formálních) přirozených čísel y1, . . , yn máme množinu Ay = { z ; ϕ(z, y) }. Pro
280 4 Peanova a Robinsonova aritmetika
některé n-tice y1, . . , yn množina Ay obsahuje nulu a pro některé n-tice y1, . . , yn je
uzavřena na přičítání jedničky. Nastane-li pro y1, . . , yn obojí, tj. platí-li zároveň
ϕ(0, y) a ∀x(ϕ(x, y) → ϕ(S(x), y)), deﬁnujme pro účely tohoto důkazu, že množina
Ay je induktivní. Formule ψ(z) vyjadřuje, že z je v průniku všech těch Ay,
které jsou induktivní. Domluvme se, že znak ve zbytku tohoto důkazu značí
dokazatelnost v teorii s axiomy Q1–Q9 a se schématem neparametrické indukce.
Snadno lze dokázat
ψ(0) a ∀z(ψ(z) → ψ(S(z))).
Průnik všech induktivních množin systému {Ay ; y} tedy obsahuje nulu a je uzavřen
na přičítání jedničky, a je tedy také induktivní množinou. Formule ψ nemá jiné
volné proměnné než z. Neparametrická indukce dává ∀zψ(z), tedy
∀z∀y(ϕ(0, y) & ∀x(ϕ(x, y) → ϕ(S(x), y)) → ϕ(z, y)),
∀y(ϕ(0, y) & ∀x(ϕ(x, y) → ϕ(S(x), y)) → ∀zϕ(z, y)).
Poslední řádek je ekvivalentní s axiomem Ind(ϕ(x, y)). Poznamenejme ještě, že
axiomy Q1–Q9 jsme v důkazu nepotřebovali. QED
Máme-li sčítání, násobení a uspořádání, můžeme mluvit také o dalších aritmetických
pojmech: o dělení, dělitelnosti, prvočíslech a (v příštím oddílu) o nesoudělnosti.
Uvidíme, že vlastnosti těchto pojmů lze dokázat v Peanově aritmetice.
Domluvme se, že například místo S(u) budeme raději psát u + 1 a že závorky ve
výrazech budeme pokud možno vypouštět: b · x · u + z znamená ((b · x) · u) + z nebo
(b·(x·u))+z (což je v PA totéž díky vlastnostem operací dokázaným v 4.1.1). Kromě
formulí dokázaných v 4.1.1 budeme v důkazech také užívat formule z cvičení 4.
Označme x | y formuli ∃v(v·x = y). Lze ji číst „x dělí y nebo „číslo y je dělitelné
číslem x . Použitím formule x | y utvořme dále formule Irred(x) a Prime(x):
Irred(x) ≡ x > 1 & ∀v<x(v | x → v = 1),
Prime(x) ≡ x > 1 & ∀u∀v(x | u · v → x | u ∨ x | v),
které čteme číslo x je ireducibilní resp. číslo x je prvočíslo. Postupně v PA dokážeme,
že tyto dvě formule jsou spolu ekvivalentní. Nejprve dokažme větu o dělení
se zbytkem, která tvrdí, že každé přirozené číslo lze dělit libovolným nenulovým
přirozeným číslem. Výsledkem dělení je podíl a zbytek menší než dělitel.
Věta 4.1.4 V PA lze dokázat sentenci pro každou dvojici čísel x a y, z nichž y je
nenulové, existuje právě jedna dvojice čísel u a v tak, že x = y · u + v a přitom v < y.
Důkaz Existenci čísel u a v lze snadno dokázat indukcí podle x, tj. s užitím axiomu
Ind(y = 0 → ∃u∃v(x = y · u + v & v < y)):
Když y = 0, pak 0 = 0 · y + 0 & 0 < y.
Když x = y · u + v & v < y, pak S(x) = y · u + S(v). Z v < y plyne
S(v) < y nebo S(v) = y. Pokud S(v) < y, jsme hotovi. Jinak S(x) = y · u + y
a S(x) = y · (u + 1) + 0.
4.1 Axiomy a modely 281
Jednoznačnost čísel u a v plyne z formulí dokázaných v 4.1.1 bez dalšího užití
indukce:
Nechť y · u1 + v1 = y · u2 + v2 a přitom v1 < y a v2 < y. Když u1 = u2,
pak u1 < u2 nebo u2 < u1. Nechť například u1 < u2. Pak u1 + 1 ≤ u2
a y · (u1 + 1) ≤ y · u2. Tedy y · u1 + y ≤ y · u2 ≤ y · u2 + v2 = y · u1 + v1.
Z toho plyne y ≤ v1, a to je spor.
Platí tedy u1 = u2 a y · u1 + v1 = y · u1 + v2. Takže v1 = v2.
QED
Věta 4.1.5 V PA lze dokázat následující vlastnosti relace dělitelnosti:
(a) ∀x∀y∀z(x | y & y | z → x | z), (f) ∀x∀y∀z(x | y → x · z | y · z),
(b) ∀x(x | x), (g) ∀x∀y∀z(x · z | y · z & z = 0 → x | y),
(c) ∀x∀y(x | y & y | x → x = y), (h) ∀x∀y(x | x · y),
(d) ∀x(1 | x), (i) ∀x∀y∀v(v | x & v | y → v | (x + y)),
(e) ∀x(x | 0), (j) ∀x∀y∀z(x | x · z + y → x | y).
Důkaz Trochu obtížnější je jen (j):
Nechť x·v = x·z+y. Když x = 0, pak x·z+y = 0, takže y = 0 a x | y. Nechť
tedy x = 0. Nemůže platit v < z, jinak bychom měli x·v < x·z ≤ x·z+y = x·v.
Tudíž z ≤ v, čili existuje u takové, že z + u = v. Pak x · (z + u) = x · z + y,
takže x · u = y a x | y.
QED
Klasický důkaz tvrzení, že množina všech prvočísel je nekonečná, tj. že ke každému
y existuje prvočíslo, které je větší než y, je založen na myšlence uvažovat
rozklad čísla y! + 1 na prvočísla. V Peanově aritmetice (zatím) nemůžeme mluvit o
funkcích, jako je faktoriál nebo mocnina. Vlastnost „býti prvočíslem jsme už v aritmetickém
jazyce zapsali, ale tvrzení „každé přirozené číslo je součinem prvočísel
zapsat (také zatím) neumíme. Přesto uvidíme, že obě potíže jsou překonatelné a že
klasický důkaz tvrzení, že prvočísel je nekonečně mnoho, je formalizovatelný v PA.
Místo o faktoriálu čísla y postačí mluvit o čísle dělitelném všemi čísly 2, 3, . . , y. A
tvrzení, že každé číslo má prvočíselný rozklad, postačí nahradit tvrzením, že každé
číslo je dělitelné nějakým prvočíslem. O tom jsou body (a) a (b) následujícího
lemmatu. Bod (c) použijeme v důkazu tvrzení 4.1.7(b).
Lemma 4.1.6 V PA lze dokázat sentence
(a) ∀y∃z(z = 0 & ∀v≤y(v = 0 → v | z)),
(b) ∀w(w > 1 → ∃x(Irred(x) & x | w)),
(c) ∀a = 0∀b∀z(∃x∃y(a · x + z = b · y) → ∃x∃y(b · x + z = a · y)).
Důkaz Tvrzení (a) lze dokázat přímočaře indukcí podle y. V důkazu tvrzení (b)
použijeme schéma LNP:
282 4 Peanova a Robinsonova aritmetika
Nechť w0 je nejmenší z čísel větších než 1, která nejsou dělitelná žádným ireducibilním
číslem. Protože w0 | w0, číslo w0 samo není ireducibilní. Tedy existuje
v < w0 takové, že v | w0 a v > 1. Protože w0 je nejmenší, v je dělitelné nějakým
ireducibilním x. Relace | je tranzitivní, tedy x | w0. To je spor s předpokladem,
že w0 není dělitelné ireducibilním číslem.
Dokažme tvrzení (c):
Nechť a · x + z = b · y. Z a = 0 plyne y ≤ y · a. Vezměme v takové, že
v + y = y · a, a spočítejme číslo (b · v + z) + a · x:
b · v + z + a · x = b · v + b · y = b · (v + y) = b · y · a.
Tedy a | ((b · v + z) + a · x). Podle 4.1.5(j) platí a | ((b · v) + z). Tedy existuje
u takové, že b · v + z = a · u.
QED
Věta 4.1.7 V Peanově aritmetice lze dokázat sentence
(a) ∀y∃x(y < x & Irred(x)),
(b) ∀a = 0∀b = 0∃x∃y∃z(a · x + z = b · y & z | a & z | b),
(c) PA ∀x(Irred(x) ≡ Prime(x)).
Důkaz (v PA) (a) Nechť y je dáno. Díky tvrzení 4.1.6(a) můžeme vzít číslo z = 0,
které je dělitelné všemi čísly 2, 3, . . , y. Je-li v ≤ y a v = 0, pak z + 1 lze psát ve
tvaru z + 1 = u · v + 1. Je-li navíc v > 1, pak díky jednoznačnosti dělení se zbytkem,
viz 4.1.4, nelze číslo z + 1 psát ve tvaru u · v. Tedy žádné v takové, že v > 1 a v ≤ y,
nedělí z + 1. To znamená, že pro každé ireducibilní číslo x takové, že x | (z + 1),
platí x > y. Podle 4.1.6(b) taková x existují.
(b) Nechť čísla a a b různá od nuly jsou dána. Jistě existují nějaká čísla z splňující
podmínku
z = 0 & ∃x∃y(a · x + z = b · y), (1)
například a · 0 + b = b · 1. Dle principu LNP můžeme vzít nejmenší z0 splňující
podmínku (1). Navíc platí
z0 ≤ b. (2)
Podle 4.1.6(c) je číslo z0 zároveň nejmenším číslem z splňujícím podmínku
z = 0 & ∃x∃y(b · x + z = a · y). (3)
Vezměme x0 a y0 taková, že
a · x0 + z0 = b · y0. (4)
Protože z0 = 0, můžeme dělit číslo b se zbytkem číslem z0:
b = z0 · u + v & v < z0. (5)
4.1 Axiomy a modely 283
Z (2) plyne u = 0 a z (4) máme y0 = 0. Existuje tedy číslo w takové, že S(w) = y0 ·u.
Vyjděme z (4) a (5) a počítejme:
a · x0 · u + z0 · u = b · y0 · u
a · x0 · u + z0 · u + v = b · y0 · u + v
a · x0 · u + b = b · (w + 1) + v
a · x0 · u = b · w + v.
Kdyby platilo v = 0, číslo v by bylo menším číslem než z0 splňujícím podmínku (3).
Tedy v = 0 a z (5) plyne z0 | b. Podobně (o něco jednodušeji) lze ověřit i z0 | a.
(c) Nechť x > 1 a x | a · b. Můžeme předpokládat a = 0, jinak x | a. Dle tvrzení (b)
existují u, v a z taková, že x · u + z = a · v a přitom z | x a z | a. Je-li x ireducibilní,
pak z = x nebo z = 1. Když z = x, pak x | a. Když z = 1, pak x · u + 1 = a · v
a x · u · b + b = a · b · v. Z 4.1.5(j) plyne x | b. Důkaz implikace ← ponecháváme za
cvičení. QED
Platí-li pro číslo z rovnost a · x + z = b · y, pak dle tvrzení 4.1.5(j) je z dělitelné
všemi společnými děliteli čísel a a b. Je-li z takové jako v tvrzení (b) věty 4.1.7,
tj. splňuje-li navíc podmínky z | a a z | b, pak z je největším společným dělitelem
čísel a a b. Tvrzení 4.1.7(b) je známo jako Bezoutova věta. Její důkaz je odvozen
z Eukleidova algoritmu pro nalezení největšího společného dělitele, který pracuje
takto: máme-li nalézt největší společný dělitel čísel a a b, položíme d0 := max{a, b},
d1 := min{a, b}, a dále vždy dn+2 := zbytek po dělení čísla dn číslem dn+1; poslední
nenulové dn je hledaný největší společný dělitel.
Bezoutova věta by se trochu snáz formulovala a dokazovala v teorii celých čísel
(kdybychom ovšem nějakou zavedli). To bychom pracovali s číslem z tvaru a·x+b·y,
které má nejmenší možnou nenulovou absolutní hodnotu, a obešli bychom se bez
tvrzení 4.1.6(c).
Přemýšlejme nyní o modelech teorií Q a PA. V příkladu 3.1.25 jsme dokázali, že
ve struktuře N = N, +, ·, 0, s, ≤, < platí všechny instance schématu Ind. Je jasné,
že v N platí také všechny axiomy Q1–Q9. To znamená, že struktura N je modelem
jak Robinsonovy, tak Peanovy aritmetiky, a platí
Thm(Q) ⊆ Thm(PA) ⊆ Th(N).
Struktura N se nazývá standardní model aritmetiky. Teorie Th(N) je teorie standardního
modelu nebo též úplná aritmetika (anglicky true arithmetic). Strukturám
pro aritmetický jazyk, které nejsou izomorfní se strukturou N, říkáme nestandardní.
Než se zamyslíme nad nestandardními strukturami a modely, formulujme první
z řady tvrzení (další se objeví v následujících oddílech) o deﬁnovatelnosti množin
a relací ve struktuře N. Připomeňme, že pro libovolný numerál n platí nN
= n,
číslo n je hodnotou numerálu n ve standardním modelu aritmetiky. To dále dle
lemmatu 3.1.14 znamená, že je-li ϕ(x1, . . , xk) libovolná aritmetická formule, pak
podmínky N |= ϕ(x)[n1, . . , nk] a N |= ϕ(n1, . . , nk) jsou navzájem ekvivalentní.
284 4 Peanova a Robinsonova aritmetika
Lemma 4.1.8 Formule x | y deﬁnuje v N relaci {[n, m]; n dělí m}. Obě formule
Irred(x) a Prime(x) deﬁnují v N množinu všech prvočísel.
Důkaz Pro libovolná dvě přirozená čísla n a m platí
N |= n | m ⇔ N |= ∃v(v · n = m)
⇔ ∃k ∈ N(N |= k · n = m)
⇔ ∃k ∈ N(k · n = m)
⇔ n dělí m.
Použili jsme podmínky T8, T3 a T2 z deﬁnice 3.1.9 a dále fakty, že hodnoty termů
k, n a m jsou čísla k, n a m a že symboly „· a „= jsou v N realizovány násobením
přirozených čísel a rovností.
Úvaha pro formuli Irred(x) je zcela analogická. Protože formule Irred(x) a Prime(x)
jsou v PA ekvivalentní, deﬁnují v N (a v jakémkoliv jiném modelu Peanovy aritmetiky
také) tutéž množinu. QED
a0 a1 a2 a3 · · · b0 b1 b2 b3 · · ·E E E E
¤
¥
§
c
¤
¥
§
c
¤
¥
§
c
¤
¥
§
c
+ am bm
an an+m bm+1
bn bn bm+1
· a0 am+1 bm
an a0 an·(m+1) b0
bn a0 bn+1 bn+1
Obrázek 4.1.1: Nestandardní model Robinsonovy aritmetiky
Na obrázku 4.1.1 je znázorněna struktura M pro aritmetický jazyk, kterou
navrhla Marta Vlasáková (tehdy Bendová). Nosná množina M struktury M je
sjednocením dvou disjunktních nekonečných spočetných množin {a0, a1, a2, . . . }
a {b0, b1, b2, . . . }. Realizace následnické funkce je znázorněna šipkami, operace jsou
deﬁnovány tabulkami, a0 realizuje symbol 0. Relace ≤M
a <M
znázorněny nejsou,
protože jsou jednoznačně určeny sčítáním. Snadno lze ověřit M |= Q (cvičení).
Sentence ∀x∀y(x + y = y + x) v M neplatí (například protože a0 +M
b0 se
liší od b0 +M
a0). Komutativitu sčítání — a také většinu sentencí dokázaných ve
větě 4.1.1, jak uvidíme ve cvičeních — nelze dokázat v Robinsonově aritmetice, a
indukce nebo jiné dodatečné axiomy jsou tedy k jejich důkazu nutné.
Rozmysleme si, jak je v M realizováno uspořádání. Protože bm +M
an = bm,
každý z prvků an je ve smyslu relace <M
menší než kterýkoliv z prvků bm. Z tabulky
deﬁnující sčítání modelu M je dále zřejmé, že ve smyslu relace <M
před an jsou
4.1 Axiomy a modely 285
prvky a0, . . , an−1, a žádné jiné, před b0 jsou všechny standardní prvky, a žádné jiné,
před bn+1 je bn, všechny standardní prvky, a žádné jiné. Relace <M
není tranzitivní:
pro libovolné n platí bn <M
bn+1 a bn+1 <M
bn+2, neplatí ale bn <M
bn+2.
Nechť ϕ(x, y1, . . , yk) je aritmetická formule a nechť d1, . . , dk ∈ M jsou taková,
že M |= (∃xϕ(x, y))[d]. Kromě relace <M
máme na M ještě jedno uspořádání,
označme je R, deﬁnované takto: an R am ⇔ n < m, dále bn R bm ⇔ n < m,
a konečně an R bm pro každé n a m. Relace R je dobré uspořádání množiny M
typu ω + ω. Nechť c je R-nejmenší prvek množiny M, splňující M |= ϕ(x, y)[c, d].
Vzhledem k tomu, že všechny <M
-menší prvky než c jsou mezi těmi, které jsou
R-menší než c, máme M |= (ϕ(x, y) & ∀v<x¬ϕ(v, y))[c, d]. Tím jsme ověřili,
že v M platí schéma LNP. Struktura M je tedy nestandardním modelem teorie
(Q + LNP). Sentence ∀x(x < S(x)) v M neplatí. To znamená, že ji v Q nelze
dokázat ani užitím schématu LNP.
Obraťme pozornost od Robinsonovy aritmetiky k teoriím PA a Th(N). Mají i
tyto teorie nějaké nestandardní modely? Naše dosavadní výsledky dovolují zdůvodnit,
že určitě ano. Především, dle Löwenheimovy-Skolemovy věty 3.4.5 mají obě
tyto teorie modely všech nekonečných mohutností. Protože nespočetná struktura
pro aritmetický jazyk jistě není izomorfní s N, teorie PA a Th(N) (a ovšem i Q)
mají nestandardní modely všech nespočetných mohutností. Dále, dle věty 3.4.3 má
teorie Th(N) spočetný model M takový, že M, <M
není dobře uspořádaná množina.
A takový model M je spočetným nestandardním modelem jak teorie Th(N),
tak Peanovy aritmetiky.
Udělejme si bližší představu o struktuře nestandardního modelu Peanovy aritmetiky,
a tím i o struktuře nestandardního modelu teorie Th(N). Nechť tedy M
je nestandardní model Peanovy aritmetiky. M je struktura se třemi operacemi,
s prvkem 0M
, který je realizací symbolu 0, a s relacemi ≤M
a <M
, které jsou realizacemi
symbolů ≤ a <. Protože v PA lze dokázat, že relace < je uspořádání, musí
to platit v každém modelu: <M
je tranzitivní, antireﬂexivní a trichotomická relace
na nosné množině M struktury M. Z podobného důvodu 0M
je <M
-nejmenší prvek
množiny M, největší prvek neexistuje.
Domluvme se, že řekneme-li v následujících odstavcích o prvcích množiny M,
že jsou menší nebo větší, znamená to menší nebo větší ve smyslu relace <M
.
Pro každé a ∈ M platí, že a je největší z prvků menších než S(a) a S(a) je
nejmenší z prvků větších než a. To znamená, že struktura M, <M
je modelem
teorie DO z oddílu 3.4 a platí o ní všechny fakty, o kterých z příkladu 3.4.14 víme,
že platí o modelech teorie DO. Zopakujme si je. Na množině M můžeme deﬁnovat
ekvivalenci „blízkosti : a ∼ b, jestliže mezi a a b je jen konečně mnoho prvků. Třída
ekvivalence obsahující 0M
je izomorfní se strukturou N, < , je tedy uspořádanou
množinou typu ω. Každá jiná třída ekvivalence je izomorfní se strukturou Z, < ,
je tedy uspořádanou množinou typu ω∗
+ ω. Protože model M je nestandardní,
faktorová množina M/∼ má více než jeden prvek. Třídu ekvivalence (tj. prvek
množiny M/∼) obsahující prvek a ∈ M značíme [a]. Na množině M/∼ můžeme
deﬁnovat relaci R předpisem [a] R [b] ⇔ a < b & ¬(a ∼ b). Struktura M/∼, R
je lineárně uspořádanou množinou, [0M
] je její nejmenší prvek. Lze tedy říci, že
286 4 Peanova a Robinsonova aritmetika
struktura M, <M
je lineárně uspořádanou množinou typu ω + (ω∗
+ ω) · λ, kde
λ je lineární uspořádání s nejmenším prvkem. Strukturu M, <M
tedy lze popsat
jako strukturu, která vznikla z nějaké lineárně uspořádané množiny s nejmenším
prvkem tak, že nejmenší prvek byl nahrazen strukturou N, < a všechny ostatní
prvky byly nahrazeny strukturou Z, < .
Prvkům třídy ekvivalence [0M
] říkáme standardní prvky modelu M. Standardní
prvky modelu M jsou právě ty prvky, které jsou realizacemi numerálů. Před
realizací libovolného numerálu n je v modelu M právě n menších prvků, totiž
prvky 0M
, 1M
, . . , n − 1M
. Prvkům, které nejsou realizacemi numerálů, říkáme
nestandardní prvky modelu M. Nestandardní prvek modelu M není dosažitelný
z nejmenšího prvku 0M
konečně mnoha skoky funkce SM
a ve smyslu uspořádání
před ním existuje nekonečně mnoho jiných prvků.
| )
N
q q q q q q ( )
Z
q q q ( )
Z
q q q q q ( )
Z
q q q
hustě uspořádané kopie struktury Z, <
Obrázek 4.1.2: Uspořádání nestandardního modelu Peanovy aritmetiky
Redukt M, <M
našeho modelu M pro jazyk {<} má kromě vlastností, které
musí mít každý model teorie DO, ještě další vlastnosti, které plynou z faktu, že
uspořádání <M
má úzký vztah ke sčítání +M
. Vezměme prvky a a b modelu M
takové, že a < b a ¬(a ∼ b). V PA lze dokázat sentenci
∀x∀y(x < y → ∃z(x + 2 · z = y ∨ x + 2 · z + 1 = y)).
To znamená, že k a a b existuje prvek d takový, že a+2·d = b nebo a+2·d+1 = b.
Protože a a b si nejsou blízké, jejich vzdálenost 2 · d nebo 2 · d + 1 je nestandardní
prvek modelu M. Protože 2·d = d+d, i d je nestandardní prvek, a tedy prvek a+d
není blízký k a ani k b. Struktura M, <M
je tudíž typu ω + (ω∗
+ ω) · λ, kde λ je
hustě uspořádaná množina. Podobně lze zdůvodnit, že λ nemá největší prvek. Můžeme
tedy shrnout, že z hlediska uspořádání náš nestandardní model M Peanovy
aritmetiky vypadá tak, jak je znázorněno na obrázku 4.1.2: v nějaké lineárně hustě
uspořádané množině s nejmenším a bez největšího prvku byl nejmenší prvek nahrazen
kopií struktury N, < a každý jiný prvek byl nahrazen kopií struktury Z, < ,
čímž vznikla struktura typu ω +(ω∗
+ω)·λ, kde λ je husté uspořádání bez nejmenšího
a největšího prvku. Víme, že spočetná hustě lineárně uspořádaná struktura bez
nejmenšího a největšího prvku je až na izomorﬁsmus jen jedna (viz příklad 3.4.12).
To znamená, že je-li model M navíc spočetný, pak struktura M, <M
má jediný
možný tvar ω + (ω∗
+ ω) · η, kde η značí strukturu Q, < racionálních čísel s uspo-
řádáním.
Nic podobně přehledného nedokážeme říci o sčítání a násobení modelu M. Navíc
z věty 4.1.9 plyne, že sčítání a násobení modelu M není jednoznačně určeno jeho
4.1 Axiomy a modely 287
uspořádáním. V modelu M ale musí platit všechny formule, které jsou dokazatelné
v PA. To například znamená, že za každým prvkem modelu M existují prvky, o
kterých v M platí, že jsou prvočísly. V M tedy existují nestandardní prvočísla!
Lze zjistit počet neizomorfních nestandardních modelů Peanovy aritmetiky?
Třída všech spočetných modelů PA není množinou. Ale: každý spočetný model
je izomorfní s modelem, který má jednu předem danou nosnou množinu. Můžeme
tedy nosnou množinu D považovat za pevně zvolenou a uvažovat o izomorfních a
neizomorfních modelech Peanovy aritmetiky s nosnou množinou D. A v této situaci
už má dobrý smysl ptát se na mohutnost. Například realizace symbolu ≤ je podmnožina
množiny D×D a takových podmnožin je 2|D×D|
= 2ℵ0·ℵ0
= 2ℵ0
. Podobně
lze odhadnout počet možností, jak zvolit realizace ostatních pěti symbolů aritmetického
jazyka. Horní odhad pro počet všech (izomorfních i neizomorfních) modelů
jak Peanovy aritmetiky, tak teorie Th(N), s předem danou nosnou množinou, která
je nekonečná spočetná, je
2ℵ3
0 · 2ℵ3
0 · ℵ0 · 2ℵ2
0 · 2ℵ2
0 · 2ℵ2
0 = 2ℵ0
,
kde jednotlivé činitele vyjadřují počet možností, jak zvolit realizace symbolů +, ·,
0, S, ≤ a <. Na první pohled by se mohlo zdát, že počítáme zbytečně velkoryse.
Následující věta ale tvrdí, že ne, 2ℵ0
je optimální horní odhad.
Věta 4.1.9 Teorie Th(N) má 2ℵ0
navzájem neizomorfních spočetných modelů.
Důkaz Označme P množinu všech prvočísel a zvolme její podmnožinu X. Máme
2ℵ0
možností, jak zvolit tuto množinu X.
Další postup je podobný, jako v důkazu o neaxiomatizovatelnosti dobrého uspořádání:
přidat k jazyku dočasně další symboly, formulovat teorii v takto rozšířeném
jazyce a užít větu o kompaktnosti k důkazu, že ona teorie má nějaké modely. Z dočasných
dodatečných symbolů tentokrát vystačíme s jedinou konstantou.
Považujme tedy teorii Th(N) za teorii v jazyce {+, ·, 0, S, ≤, <, c}, kde c je konstanta,
označme SX množinu sentencí
{ n | c ; n ∈ X } ∪ { ¬(n | c) ; n ∈ P − X }
a uvažujme o teorii Th(N) ∪ SX. Nechť p1, . . , pn jsou libovolné prvky množiny X.
Je jasné, a případně to také plyne z tvrzení 4.1.7(c) a faktu, že N |= PA, že
součin r =
n
i=1 pi je dělitelný všemi čísly p1, . . , pn, ale není dělitelný žádným
prvočíslem různým od všech p1, . . , pn. Číslo r tedy není dělitelné žádným prvkem
množiny P − X. To znamená, že sestrojíme-li expanzi struktury N pro jazyk
{+, ·, 0, S, ≤, <, c} tak, že konstantu c realizujeme prvkem r, dostaneme model
teorie
Th(N) ∪ { pi | c ; 1 ≤ i ≤ n } ∪ { ¬(n | c) ; n ∈ P − X }.
Ověřili jsme, že teorie Th(N) ∪ F ∪ { ¬(n | c) ; n ∈ P − X } má model pro
každou konečnou podmnožinu F množiny { n | c ; n ∈ X }. Tím spíše každá
288 4 Peanova a Robinsonova aritmetika
konečná množina F ⊆ Th(N) ∪ SX má model. Podle věty o kompaktnosti má
teorie Th(N) ∪ SX nějaký model, a podle Löwenheimovy-Skolemovy věty má i
spočetný model.
Dokázali jsme, že existuje spočetný model M teorie Th(N) a jeho prvek a takový,
že M |= (n | x)[a] pro n ∈ X a M |= ¬(n | x)[a] pro n ∈ P − X. Prvek a je v M
dělitelný všemi prvočísly z množiny X a není dělitelný žádným jiným prvočíslem.
Deﬁnujme tedy dočasně, že prvek a modelu M teorie Th(N) kóduje množinu prvočísel
X, jestliže a je v M dělitelný každým číslem n pro n ∈ X a není v M dělitelný
žádným číslem n pro n ∈ P − X. A model M kóduje množinu prvočísel X, jestliže
ji kóduje některý prvek a modelu M. Dosud jsme dokázali, že každou množinu
prvočísel kóduje nějaký spočetný model teorie Th(N).
Každý prvek libovolného modelu kóduje právě jednu množinu prvočísel. Spočetný
model tedy kóduje nejvýše spočetně mnoho množin. Izomorfní modely jistě kódují
tytéž množiny prvočísel. Ke kódování všech 2ℵ0
množin prvočísel tedy potřebujeme
2ℵ0
navzájem neizomorfních modelů. QED
Máme tedy 2ℵ0
různých spočetných modelů teorie Th(N). Z nich jen jeden je
standardní, takže počet všech nestandardních navzájem neizomorfních spočetných
modelů teorie Th(N) je také 2ℵ0
. A každý z nich je zároveň modelem Peanovy
aritmetiky. Kdybychom byli zjistili, že spočetných modelů Peanovy aritmetiky je
ve smyslu mohutností víc než modelů teorie Th(N), měli bychom zvláštní nepřímý
důkaz, že Peanova aritmetika je neúplná. To ale nenastalo a otázka, zda Peanova
aritmetika je úplnou teorií, zůstala v tomto oddílu otevřená.
Peanovu aritmetiku se nám tedy nepodařilo odlišit od teorie Th(N). Podařilo se
nám ale odlišit Peanovu aritmetiku a aritmetiku Robinsonovu: o Robinsonově aritmetice
jsme už zjistili, že není ekvivalentní s Peanovou aritmetikou a že není úplná.
Naše důkazy existence nestandardních modelů Robinsonovy a Peanovy aritmetiky
naznačily další možný rozdíl mezi oběma teoriemi. K důkazu existence nestandardního
modelu Peanovy aritmetiky jsme použili větu o kompaktnosti, kdežto nestandardní
model Robinsonovy aritmetiky jsme sestrojili „přímo , zvolili jsme nosnou
množinu a deﬁnovali jsme na ní operace větvením na konečně mnoho případů.
O žádné z teorií Q, PA a Th(N) zatím také nevíme, je-li rozhodnutelná. Vyjmenujme
tedy otázky, které se vynořily v tomto oddílu a kterými se v dalším výkladu
budeme zabývat.
• Je Peanova aritmetika úplná? Pokud ne, lze ji zúplnit přidáním vhodných
axiomů nebo schémat?
• Je Robinsonova aritmetika, Peanova aritmetika či teorie Th(N) rozhodnu-
telná?
• Lze nějaký nestandardní model Peanovy aritmetiky sestrojit podobně přímým
postupem, jakým jsme sestrojili nestandardní model Robinsonovy aritmetiky,
tj. bez užití věty o kompaktnosti?
4.1 Axiomy a modely 289
• Je Peanova aritmetika konečně axiomatizovatelná?
Mezi těmito otázkami samozřejmě existují určité souvislosti. Je-li Peanova aritmetika
úplná, pak je ekvivalentní s Th(N) a podle věty 3.6.8 jsou obě teorie rozhodnutelné.
Lze-li Peanovu aritmetiku rozšířit přidáním rekurzívní množiny axiomů
na teorii ekvivalentní s Th(N), pak alespoň Th(N) je rozhodnutelnou teorií.
Pro hlubší informaci o modelech Peanovy aritmetiky a příbuzných teorií doporučujeme
knihu R. Kaye [47]. Touto knihou jsou inspirována některá cvičení a je z ní
také převzat obrázek 4.1.2. Zevrubnou informaci o všem, čeho se dotýkáme v této
kapitole, a o mnohém dalším souvisejícím s metamatematikou různých aritmetik,
lze získat z obsáhlé Hájkovy a Pudlákovy monograﬁe [31].
Cvičení
1. Dokažte, že axiom Q3 je v PA redundantní, tj. lze jej dokázat z ostatních
axiomů. Dokažte, že všechny axiomy teorie SUCC jsou dokazatelné v PA.
2. Dokažte v PA všechny zbývající formule z 4.1.1(a).
3. Dokažte, že všechny formule v 4.1.1 (b) a (c) jsou dokazatelné z formulí v (a)
a případně axiomů Q1–Q9 bez dalšího užití indukce.
4. Teorie PA−
má aritmetický jazyk a axiomy Q1–Q9 a dále všechny formule
z věty 4.1.1. Dokažte, že následující formule jsou dokazatelné v PA−
:
∀x∀y(x < y ≡ x ≤ y & x = y), ∀x∀y(x < y ≡ S(x) < y ∨ S(x) = y),
∀x∀y(x < y → ¬(y < x)), ∀x∀y∀z(x + z < y + z → x < y),
∀x(x < S(x)), ∀x∀y∀z(x · z = y · z & z = 0 → x = y),
∀x¬(x < 0), ∀x∀y∀z(x · z < y · z & z = 0 → x < y).
∀x∀y(x < y ≡ S(x) < S(y)),
5. Navrhněte pro PA−
úspornější axiomatický systém.
Návod. Lze například vypustit tranzitivitu relace < v 4.1.1(b), v (a) ponechat
jen pět formulí vyjadřujících asociativitu a komutativitu obou operací a
distributivitu násobení vůči sčítání, a dále vypustit axiomy Q1, Q2 a Q8.
6. Dokažte, že je-li ϕ(x, y) libovolná aritmetická formule, pak každá z následujících
tří sentencí je dokazatelná v PA:
(a) ∀u≤x∃vϕ(u, v) → ∃y∀u≤x∃v≤yϕ(u, v),
(b) ∀x∀y(ϕ(x, y) & x = 0 → ∃u∃v(ϕ(u, v) & v < y)) →
→ (∃x∃yϕ(x, y) → ∃yϕ(0, y)),
(c) ϕ(0, 0) & ∀x∀y(ϕ(x, y) → ϕ(x, S(y))) &
& ∀x(∀yϕ(x, y) → ϕ(S(x), 0)) → ∀x∀yϕ(x, y).
7. Deﬁnice axiomatické teorie dovoluje volit libovolně axiomy teorie, nedovoluje
ale volit odvozovací pravidla. Zapomeňte na chvíli na toto omezení a zdůvod-
290 4 Peanova a Robinsonova aritmetika
něte, že s použitím „pravidla indukce
ϕ(0) , ∀x(ϕ(x) → ϕ(S(x))) / ∀xϕ(x)
lze v Q dokázat všechny formule dokazatelné v PA.
8. Dokažte podrobně tvrzení 4.1.5 (a)–(i), 4.1.6(a), vynechaný případ v 4.1.7(b)
a implikaci ← v 4.1.7(c).
9. Dokažte, že v modelu z obrázku 4.1.1 platí všechny axiomy Robinsonovy arit-
metiky.
10. Přidejme ke struktuře N přirozených čísel dva nové prvky a, b a rozšiřme následnickou
funkci na množinu M = N ∪ {a, b} předpisem S(a) = b, S(b) = a.
Dokažte, že sčítání a násobení je možno rozšířit na celou množinu M tak, aby
v M platily všechny axiomy Robinsonovy aritmetiky.
11. Rozhodněte, které z následujících formulí jsou dokazatelné v Q.
∀x(x ≤ x), ∀x∀y(x + y = 0 → x = 0 & y = 0),
∀x(x ≤ 0 → x = 0), ∀x∀y(x ≤ y ≡ S(x) ≤ S(y)),
∀x(0 ≤ x), ∀x∀y(x < y → x < S(y)),
∀x(0 · x = 0), ∀x∀y(S(x) < y → x < y),
∀x(x · 1 = x), ∀x∀y(x · y = 0 → x = 0 ∨ y = 0),
∀x∀y∃z(x ≤ z & y ≤ z), ∀x(x ≤ 1 → x = 0 ∨ x = 1),
∀x¬(x < x), ∀x∀y∀z((z + y) + x = z + (y + x)).
∀x∀y(x ≤ y → x < y ∨ x = y),
12. Nechť Z[X] je množina všech polynomů v jedné proměnné X s celočíselnými
koeﬁcienty. Označme Z[X]+
množinu všech polynomů a0 + a1X + . . + anXn
v Z[X] s nezáporným an, tj. s nezáporným koeﬁcientem u nejvyššího členu. Dokažte,
že množina Z[X]+
, deﬁnujeme-li na ní přirozeným způsobem operace a
uspořádání, je modelem teorie PA−
. Dokažte, že v PA−
nelze dokázat sentenci
∀x∃y(y + y = x ∨ S(y + y) = x). Které axiomy teorie PA−
neplatí v Z[X],
deﬁnujeme-li i na této struktuře přirozeným způsobem operace a uspořádání?
Které axiomy teorie PA−
neplatí v množině N[X] všech polynomů s nezápornými
koeﬁcienty?
13. Uvažujte teorii Th(N) ∪ { n < c ; n ∈ N } v jazyce, který vznikl z aritmetického
jazyka přidáním nové konstanty c. Dokončete jednoduchý důkaz tvrzení, že
teorie Th(N) má alespoň jeden nestandardní model.
14. Dokažte, že množina všech standardních prvků nestandardního modelu M Peanovy
aritmetiky není v M deﬁnovatelná.
15. Nechť M je nestandardní model Peanovy aritmetiky a nechť relace ∼ a R mají
stejný význam, jako na str. 285.
4.1 Axiomy a modely 291
(a) Dokažte, že struktura M/∼, R nemá největší prvek.
(b) Dokažte, že když a1 ∼ a2 a b1 ∼ b2, pak a1 + b1 ∼ a2 + b2. Tedy ∼ je
kongruentní vůči sčítání.
(c) Je ∼ kongruentní i vůči násobení?
16. Nechť M je nestandardní model teorie Th(N), nechť ϕ(x) je aritmetická formule
s jednou volnou proměnnou. Dokažte, že následující podmínky jsou ekvi-
valentní.
(i) Množina všech standardních prvků modelu M splňujících v M formuli ϕ
je nekonečná.
(ii) Existuje nestandardní prvek modelu M splňující v M formuli ϕ.
(iii) M |= ∀y∃x(y < x & ϕ(x)).
Návod. Struktury M a N se nemohou lišit platností žádné sentence tvaru
∃x(n < x & ϕ(x)) ani platností sentence v (iii).
17. Zdůvodněte, že pro důkaz implikace (i) ⇒ (ii) v předchozím cvičení stačí předpokládat,
že M je model Peanovy aritmetiky.
18. Dokažte, že každá teorie s nejvýše spočetným jazykem má nejvýše 2ℵ0
navzájem
neizomorfních nejvýše spočetných modelů.
19. Navrhněte teorii se spočetným jazykem, která má 2ℵ0
konečných navzájem
neizomorfních modelů.
20. Které množiny prvočísel jsou ve smyslu důkazu věty 4.1.9 kódované ve struktuře
N? Je-li a nestandardní prvek modelu M Peanovy aritmetiky, musí množina
prvočísel, kterou a kóduje v M, být nekonečná?
21. Zdůvodněte, že existuje 2ℵ0
spočetných modelů Peanovy aritmetiky takových,
že jejich redukty pro jazyk {·, 0, S} jsou po dvou neizomorfní. Modiﬁkujte důkaz
věty 4.1.9 a dokažte, že také existuje 2ℵ0
spočetných modelů Peanovy aritmetiky
takových, že jejich redukty pro jazyk {+, 0, S} jsou po dvou neizomorfní.
4.2 Aritmetizace logické syntaxe
V minulém oddílu jsme ukázali, že v Peanově aritmetice lze dokázat existenci nekonečně
mnoha prvočísel. Tímto příkladem jsme chtěli naznačit, že o mnohých
vlastnostech přirozených čísel a o operacích s přirozenými čísly můžeme v aritmetickém
jazyce mluvit, přestože jim bezprostředně neodpovídají žádné symboly. A
v Peanově aritmetice můžeme dokazovat tvrzení o těchto vlastnostech a operacích,
ale někdy je třeba známé důkazy poněkud přizpůsobit. Vzpomeňme si, že jedním
z dobrých nápadů bylo to, že místo o faktoriálu čísla y stačilo mluvit o číslu z
dělitelném všemi čísly 2, 3, . . , y.
292 4 Peanova a Robinsonova aritmetika
Nyní uvidíme, že situace je ještě o něco lepší. V Peanově aritmetice lze mluvit
o faktoriálu, o mocnině a o mnoha dalších funkcích a pojmech, které jsou na metamatematické
úrovni deﬁnovány primitivní rekurzí. Podmínka „z je součinem všech
čísel od dvojky do y je tedy jiného druhu než podmínka „před z je jen konečně
mnoho menších čísel , kterou (jak víme například z úvah o kompaktnosti) nelze
vyjádřit aritmetickou formulí.
Ukažme si postup na příkladu mocniny. Proč platí 25
= 32? Protože existuje
šestičlenná posloupnost čísel začínající jedničkou, končící číslem 32 a taková, že
každý následující člen je dvojnásobkem předchozího (je samozřejmě řeč o posloupnosti
1, 2, 4, 8, 16, 32). Obecně podmínku z = 2y
budeme moci v aritmetickém
jazyce zapsat formulí
∃w(Seq(w) & Lh(w, y + 1) & B(w, 0, 1) & B(w, y, z) &
& ∀x<y∀v(B(w, x, v) → B(w, x + 1, 2 · v))),
jakmile nalezneme aritmetické formule Seq(w), Lh(w, x) a B(w, x, v), které vyjadřují,
že číslo w je kódem posloupnosti, že x je délkou posloupnosti (s kódem) w a že v
je členem s indexem x posloupnosti w. Formule Seq(w), Lh(w, x) a B(w, x, v) tedy
budou v aritmetickém jazyce vyjadřovat podmínky Seq(w), Lh(w) = x a (w)x = v,
se kterými jsme pracovali v kapitole 2.
Naším prvním cílem je tedy popsat v aritmetickém jazyce kódování konečných
posloupností přirozených čísel přirozenými čísly a dokázat v Peanově aritmetice
jeho vlastnosti. Jakmile se to podaří, otevře se nám možnost mluvit v Peanově
aritmetice o funkcích, které jsou odvozeny (z funkcí, o kterých už víme, že o nich
lze mluvit) pomocí operace primitivní rekurze.
Možnost mluvit v Peanově aritmetice o funkcích odvozených primitivní rekurzí
chceme v tomto oddílu vztáhnout zejména na charakteristické funkce množiny všech
termů, formulí (v nějakém jazyce) a důkazů (z nějakých předpokladů). V tomto
oddílu tedy ukazujeme, že díky možnosti deﬁnovat (formalizovat) v PA nebo v jiné
dostatečně silné axiomatické teorii kódování posloupností lze v PA formalizovat i
řadu logických pojmů. Díky tomu si pak budeme moci klást otázky tohoto druhu:
co je Peanova aritmetika (nebo teorie množin) schopna dokázat o dokazatelnosti
v konkrétních teoriích, jako je Q, PA nebo ZF?
Pro formalizaci v Peanově aritmetice není vhodné kódování posloupností užité
v kapitole 2, neboť v jeho deﬁnici se vyskytují funkce odvozené primitivní rekurzí
(například ona před chvílí zmíněná mocnina), a primitivní rekurzi se nyní musíme
vyhnout. Potřebujeme tedy jiné kódování. Čtenář, který se zabýval programováním,
si jistě dovede představit situaci, kdy nějaký větší programový celek má být
přizpůsoben pro provoz na jiném počítači nebo hardwaru. Naším „novým hardwarem
je Peanova aritmetika, resp. aritmetický jazyk. A tento hardware nemá
zabudovanou operaci primitivní rekurze. S vynaložením určité námahy ji však lze
simulovat. A navíc, je-li programový celek rozumně strukturován, jeho velké části
zůstanou beze změny, neboť strojově závislé instrukce jsou soustředěny jen do určitých
podprogramů, a jen ty postačí nově implementovat.
4.2 Aritmetizace logické syntaxe 293
Užijeme kódování blízké tomu, jaké původně použil Gödel a které je popsáno
v Shoenﬁeldově knize [75]. Ukazuje se, že snažší než deﬁnovat rovnou kódování
posloupností je deﬁnovat nejprve kódování konečných množin. Množina se od posloupnosti
liší tím, že u ní nelze mluvit o pořadí prvků. Jakmile budeme mít množiny,
můžeme posloupnosti deﬁnovat stejným způsobem, jako se v teorii množin
deﬁnují funkce: posloupnost bude taková a taková množina dvojic.
Gödelovo (Shoenﬁeldovo) kódování je založeno na následujících dvou faktech.
Fakt 1 Nechť B = {b0, . . , bn−1} je množina po dvou nesoudělných čísel větších
než 1, nechť X ⊆ B. Pak číslo k = i∈X bi není dělitelné žádným b ∈ B − X.
Fakt 2 Je-li m = 0 dělitelné čísly 2, 3, . . , r, pak čísla 1+m, 1+2m, . . , 1+(r+1)m
jsou po dvou nesoudělná.
Ve formulaci faktu 2 jsme ovšem užili stejný postup jako při důkazu existence
nekonečně mnoha prvočísel: protože jsme se zařekli, že nebudeme užívat faktoriál,
mluvíme o číslu m dělitelném všemi čísly 2, 3, . . , r.
Fakty 1 a 2 zatím nedokazujme. Chceme nalézt takové reformulace, které budeme
schopni dokázat v Peanově aritmetice. Kromě faktů 1 a 2 budeme potřebovat
také párovací funkci. Párovací funkce je libovolná vzájemně jednoznačná funkce
z N2
na N. Jedna z párovacích funkcí je dána touto tabulkou:
0 1 3 6 10 . . .
2 4 7 11 . . .
5 8
9
...
Označme tuto funkci c. Platí například c(2, 0) = 5, c(2, 2) = 12 a c(3, 1) = 13.
Nechť na chvíli d označuje funkci jedné proměnné, jejíž hodnoty jsou uvedeny v nultém
řádku tabulky, tj. funkci deﬁnovanou předpisem d(y) = c(0, y). Pro každé y
platí d(y) = 1+2+ . . +y, tedy d(y) = 1
2 y(y +1). Dále platí c(x, y) = d(x+y)+x.
Tím jsme odvodili předpis pro výpočet funkce c:
c(x, y) =
1
2
(x + y)(x + y + 1) + x.
V dalším pišme (x, y) místo c(x, y) a číslu (x, y) říkejme kód dvojice [x, y].
Kódování množin a posloupností založené na faktech 1 a 2 deﬁnujeme následovně.
Máme-li zjistit, zda číslo j je prvkem čísla q, nalezneme nejprve čísla m a k
taková, že q = (m, k). Pak ověříme, zda všechna čísla 2, 3, . . , j dělí m. Pokud ne,
nebo pokud m nebo k je nula, j není prvkem čísla q. Pokud ano, zjistíme, zda
1 + (1 + j) · m dělí k. To znamená, že j je prvkem čísla q = (m, k), je-li splněna
podmínka
m = 0 & k = 0 & ∀i≤j (i = 0 ⇒ i dělí m) & 1 + (j + 1) · m dělí k.
294 4 Peanova a Robinsonova aritmetika
Máme-li naopak k dané konečné množině F přirozených čísel nalézt q, jehož prvky
jsou prvky množiny F a nic jiného, nejprve zvolíme r ≥ max F a nenulové m dělitelné
všemi čísly 2, 3, . . , r. Pak utvoříme součin k = j∈F (1 + (j + 1) · m) a
stanovíme číslo q = (m, k). Řekneme, že číslo q je množinou (neboli je kódem nějaké
množiny), a píšeme Set(q), jestliže žádné q < q nemá stejné prvky jako q. Dále
deﬁnujeme, že číslo q je kódem posloupnosti a0, . . , an−1, a píšeme q = a0, . . , an−1 ,
jestliže q je kódem množiny {(0, a0), . . , (n − 1, an−1)}. Řekneme, že číslo q je posloupností
(je kódem nějaké posloupnosti), a píšeme Seq(q), jestliže levé členy všech
jeho prvků tvoří „souvislou množinu tvaru {0, . . , n − 1}. Délka Lh(q) posloupnosti
q je nejmenší číslo n takové, že (n, k) /∈ q pro žádné k.
Příklad 4.2.1 Předpokládejme, že máme číslo q = 86 435 497 642 921 a máme určit
všechny jeho prvky. S určitým úsilím a užitím vhodných prostředků nejprve
rozložíme q na dvojici: q = (60, 13 147 981). Číslo m = 60 je dělitelné čísly 2 až 6,
není dělitelné sedmi. Tedy j je prvkem q, pokud j ≤ 6, a navíc 1 + (j + 1) · 60
dělí k = 13 147 981. Snadno lze ověřit, že pro j ∈ {1, 4, 5} číslo 1 + (j + 1) · 60
dělí, pro j ∈ {0, 2, 3, 6} nedělí k. Prvky čísla q jsou tedy všechny tři prvky množiny
F = {1, 4, 5}, a nic jiného. Lze ověřit, že m je nejmenší číslo dělitelné všemi
čísly 2, 3, . . , max F a že k je nejmenší číslo dělitelné všemi čísly tvaru 1+(j +1)·m,
kde j ∈ F. Protože funkce [m, k] → (m, k) je monotonní v obou proměnných
(cvičení), číslo q je nejmenší číslo s prvky 1, 4 a 5. Platí tedy Set(q). Protože
1 = (0, 1), 4 = (1, 1) a 5 = (2, 0), číslo q je kódem posloupnosti, neboli Seq(q), a
platí q = 1, 1, 0 a Lh(q) = 3.
Při vývoji větších programových celků se často uplatňují knihovny podprogramů.
Jsou-li často užívané podprogramy umístěny v takové knihovně, mohou být
užity při sestavení více různých programů. A jsou-li v takové knihovně umístěny
strojově závislé podprogramy, někdy lze hlavní program přizpůsobit jinému hardwaru
pouhým novým sestavením při použití jiné knihovny podprogramů. V tom
případě není nutné hlavní program nijak měnit, jiná knihovna obsahuje jiné, ale
stejně pojmenované podprogramy. Tím chceme říci, že užití symbolů Seq, Lh atd.
v jiném významu než v kapitole 2, kde jsme se s nimi již setkali, nepokládáme za
nedbalost, ale za užitečnou praxi.
Nyní jsme schopni postupně zapsat právě popsané kódování aritmetickými formulemi
a dokázat jejich vlastnosti. Nejprve deﬁnujme formule Pair(z, t, w), x ∈ w
a Set(w):
Pair(z, t, w) ≡ 2 · w = (z + t) · (z + t + 1) + 2 · z,
x ∈ w ≡ ∃z∃t(z = 0 & t = 0 & Pair(z, t, w) &
& ∀v≤x(v = 0 → v | z) & 1 + (x + 1) · z | t),
Set(w) ≡ ¬∃w <w∀v(v ∈ w ≡ v ∈ w).
Formule Pair(z, t, w) v aritmetickém jazyce popisuje párovací funkci, formule x ∈ w
a Set(w) vyjadřují podmínku číslo x je prvkem čísla w resp. číslo w je množina.
4.2 Aritmetizace logické syntaxe 295
Lemma 4.2.2 (a) V PA lze dokázat sentenci pro každou dvojici [z, t] existuje právě
jedno w takové, že Pair(z, t, w), a také sentenci pro každé w existuje právě jedna
dvojice [z,t] taková, že Pair(z, t, w).
(b) PA ∀z∀t∀w(Pair(z, t, w) → z ≤ w & t ≤ w).
(c) N |= Pair(m, k, q), právě když (m, k) = q.
Důkaz Uvažujme v PA.
Nechť w je dáno. Nalezněme maximální y takové, že y · (y + 1) ≤ 2 · w. To
lze, neboť y je zároveň minimální takové, že (y + 1) · (y + 2) > 2 · w. Obě čísla
2 · w a y · (y + 1) jsou sudá, a jejich rozdíl lze tedy psát jako 2 · z. Platí tedy
y · (y + 1) + 2 · z = 2 · w < (y + 1) · (y + 2) = y · (y + 1) + 2 · (y + 1).
Z toho plyne 2 · z < 2 · (y + 1) a z ≤ y. Číslo y tedy lze psát jako součet
y = z + t, a z a t jsou hledaná čísla splňující Pair(z, t, w).
Zbývající úvahy ponecháváme za cvičení. QED
Lemma 4.2.3 (a) PA ∀x∀w(x ∈ w → x < w).
(b) N |= j ∈ q, právě když číslo j je prvek čísla q.
Důkaz Tvrzení (a) lze dokázat takto:
Je-li z = 0, pak x < 1 + (x + 1) · z. Je-li t = 0, pak z 1 + (x + 1) · z | t plyne
1 + (x + 1) · z ≤ t. Vezmeme-li v úvahu ještě (b) lemmatu 4.2.2 a tranzitivitu
uspořádání, máme (a).
Důkaz tvrzení (b) ponecháváme na čtenáři, užije se 4.2.2(c). QED
Tvrzení 4.2.3(a) zdaleka není všechno, co hodláme v PA dokázat o náležení.
Potřebujeme ještě tvrzení, které bychom mohli interpretovat jako každá konečná
množina má nějaký kód. To uděláme v podstatě formalizací (důkazů) faktů 1 a 2.
Ve znění faktů 1 a 2 je řeč o nesoudělných číslech. Relaci nesoudělnosti lze deﬁnovat
dvěma způsoby:
(i) Čísla a a b jsou nesoudělná, jestliže nemají společného dělitele většího než 1.
(ii) Čísla a a b jsou nesoudělná, jestliže a dělí každé číslo x takové, že a dělí b · x.
Obě deﬁnice jsou (v případě, kdy a = 0) ekvivalentní. Důkaz (v PA) lze získat modiﬁkací
důkazu tvrzení 4.1.7(c) z předchozího oddílu. Ponecháváme jej za cvičení,
protože v dalším výkladu plně vystačíme s deﬁnicí (ii):
RPrime(x, y) ≡ ∀v(x | y · v → x | v).
Formuli RPrime(x, y) lze číst číslo x je nesoudělné s číslem y. Následující lemma je
téměř doslova převzato z [75].
296 4 Peanova a Robinsonova aritmetika
Lemma 4.2.4 Následující sentence jsou dokazatelné v PA:
(a) ∀x∀y(x = 0 & RPrime(x, y) → RPrime(y, x)),
(b) ∀z∀xRPrime(z, 1 + x · z),
(c) ∀u∀z∀x(u | z → RPrime(1 + x · z, 1 + (x + u) · z)).
Důkaz (v PA) (a) Nechť platí oba předpoklady a nechť y | x · v. Pak existuje u1
takové, že y · u1 = x · v. Tedy x | y · u1. Protože RPrime(x, y), platí x | u1. Tedy
x · u2 = u1 pro vhodné u2. Tedy y · x · u2 = x · v. Protože x = 0, máme y · u2 = v
a y | v.
(b) Nechť z | (1 + x · z) · v. Pak z | v + x · z · v. Z 4.1.5(j) plyne z | v.
(c) Uvažujme za předpokladu 1 + x · z | (1 + (x + u) · z) · v:
1: 1 + x · z | (1 + (x + u) · z) · v
2: 1 + x · z | v + x · z · v + u · z · v
3: 1 + x · z | (1 + x · z) · v + u · z · v
4: 1 + x · z | u · z · v ; 4.1.5(j)
5: 1 + x · z | u · v ; (a), (b)
6: 1 + x · z | z · v ; u | z
7: 1 + x · z | v ; (a), (b).
QED
Následující věta říká, že pro naše náležení platí schéma vydělení: vždy existuje
množina všech čísel, která mají takovou a takovou vlastnost.
Věta 4.2.5 Každá sentence ∀u∀y∃w(Set(w) & ∀v(v ∈ w ≡ v < y & ϕ(v, u))) je
v PA dokazatelná.
Důkaz Budeme postupovat v podstatě tak, jak naznačují fakty 1 a 2 a naše deﬁnice
náležení. Protože ale obrat „označme t součin všech čísel tvaru 1 + (v + 1) · z
takových, že v < y a ϕ(v, u) není (alespoň zatím) v aritmetickém jazyce zcela
korektní, obejdeme jej pomocí indukce. Uvažujme v PA:
Nechť čísla u1, . . , un a y jsou dána. Zvolme nenulové z dělitelné všemi čísly
2, 3, . . , y − 1. Indukcí podle x dokážeme, že
∀x(x ≤ y → ∃t∀v(v ∈ (z, t) ≡ v < x & ϕ(v, u))), (1)
kde v ∈ (z, t) je zkratka pro formuli ∀w(Pair(z, t, w) → v ∈ w) nebo pro
formuli ∃w(Pair(z, t, w) & v ∈ w). Z (1) dostaneme tvrzení věty volbou x := y.
Protože z je dělitelné všemi nenulovými čísly menšími než y, podmínka v ∈ (z, t)
je pro v < y ekvivalentní s podmínkou 1 + (v + 1) · z | t, viz deﬁnice náležení.
Pro v ≥ y platí alespoň implikace v ∈ (z, t) → 1 + (v + 1) · z | t. Z toho plyne,
že místo (1) stačí dokázat
∀x(x ≤ y → ∃t∀v(1 + (v + 1) · z | t ≡ v < x & ϕ(v, u))). (2)
4.2 Aritmetizace logické syntaxe 297
Je-li x = 0, pak t = 1 vyhovuje, protože 1+(v+1)·z je alespoň 2 pro libovolné v,
a tedy 1 + (v + 1) · z nedělí t. Nechť tedy t vyhovuje pro x, tj. platí
∀v(1 + (v + 1) · z | t ≡ v < x & ϕ(v, u)), (3)
a nechť navíc x + 1 ≤ y. Když ¬ϕ(x, u), pak t = t vyhovuje i pro x + 1. Když
naopak ϕ(x, u), zvolme t = t · (1 + (x + 1) · z). V ekvivalenci
∀v(1 + (v + 1) · z | t · (1 + (x + 1) · z) ≡ v < x + 1 & ϕ(v, u))
jistě platí implikace ←. Ověříme implikaci →. Nechť
1 + (v + 1) · z | t · (1 + (x + 1) · z).
Když v = x, pak, díky 4.2.4(c), 1 + (v + 1) · z a 1 + (x + 1) · z jsou nesoudělná
čísla. Tedy 1 + (v + 1) · z | t. Zbytek plyne z (3).
Máme tedy dokázánu podmínku (1). Vezměme t, jehož existence je v (1) zaručena
pro x := y. Pro w takové, že Pair(z, t, w), platí
∀v(v ∈ w ≡ v < y & ϕ(v, u)). (4)
Díky principu LNP můžeme vzít nejmenší w splňující podmínku (4). Pro takové
w platí navíc Set(w).
QED
V důkazu předchozí věty jsme si dovolili zápis v ∈ (z, t), jehož význam byl
číslo v je prvkem některého neboli každého w takového, že Pair(z, t, w). Takto budeme
postupovat i v budoucnu, čili budeme někdy v symbolických zápisech užívat
funkční symboly, jejichž význam je zřejmý, ale jejichž deﬁnici (ve smyslu tvrzení (b)
věty 3.5.3) jsme nevyslovili, protože aritmetický jazyk rozšiřovat nechceme. Díky
tvrzení věty 4.2.5 můžeme v Peanově aritmetice mluvit o množině {v < y; ϕ(v, u)}.
Zápis { v < y ; ϕ(v, u) } lze také počítat k nedeﬁnovaným funkčním symbolům, jejichž
význam je zřejmý a jejichž užití bychom se snadno mohli vyhnout za cenu
méně přehledných zápisů.
Za formuli ϕ(v, u) můžeme například zvolit formuli v = u1 ∨ v = u2. Protože
uvnitř PA můžeme říci, že „mez y volíme dostatečně velkou, můžeme v PA mluvit
o dvouprvkové množině {u1, u2}. Stejným právem můžeme mluvit i o tříprvkových,
čtyřprvkových atd. množinách (formálních) přirozených čísel, a také užívat zápisy
tvaru w ∪ {x}. Pišme w1 ⊆ w2 místo ∀v(v ∈ w1 → v ∈ w2).
Lemma 4.2.6 V PA lze dokázat sentence:
(a) ∀w1∀w2(Set(w1) & Set(w2) & w1 ⊆ w2 & w2 ⊆ w1 → w1 = w2),
(b) ∀w1∀w2(Set(w1) & Set(w2) & w1 ⊆ w2 → w1 ≤ w2),
(c) ∀w∀x∀y(Set(w) & y /∈ w & x ≤ y → w ∪ {x} ≤ w ∪ {y}).
Důkaz Dokažme například tvrzení (c):
Vezměme čísla z a t taková, že (z, t) = w∪{y}. Čísla z a t jsou obě nenulová, z
je dělitelné všemi prvky množiny w i číslem y a platí 1+(y+1)·z | t. Vezměme t1
takové, že t1 · (1 + (y + 1) · z) = t. Když x /∈ w, volme t = t1 · (1 + (x + 1) · z),
298 4 Peanova a Robinsonova aritmetika
jinak volme t = t1. V obou případech platí t ≤ t, tedy (z, t ) ≤ (z, t). Úvahami
podobnými jako v důkazu věty 4.2.5 lze ověřit, že (z, t ) je číslo, jehož prvky
jsou všechny prvky množiny w, číslo x, a nic jiného. Protože množina w ∪ {x}
je deﬁnována jako nejmenší číslo, jehož prvky jsou všechny prvky množiny w,
číslo x, a nic jiného, máme w ∪ {x} ≤ w ∪ {y}.
QED
Tvrzení (b) a (c) předchozího lemmatu říkají, že odstraníme-li z množiny některé
prvky nebo nahradíme-li některé prvky menšími čísly, kód výsledné množiny není
větší. Vzhledem k tvrzení (a), tj. vzhledem k platnosti axiomu extenzionality,
můžeme tvrdit, že kód výsledné množiny je dokonce ostře menší.
Tím jsme dospěli ke kódování konečných posloupností:
B(w, u, v) ≡ ∃x(Pair(u, v, x) & x ∈ w),
Lh(w, y) ≡ ¬∃vB(w, y, v) & ∀u<y∃vB(w, u, v),
Seq(w) ≡ Set(w) & ∃y(Lh(w, y) & ∀u∀v(B(w, u, v) → u < y) &
& ∀u<y∃!vB(w, u, v)).
Formule Seq(w), Lh(w, y) a B(w, u, v) čteme číslo w je posloupnost, číslo y je délka
čísla w a číslo v je u-tý člen čísla w. Formule jsme pro jednoduchost deﬁnovali
tak, že o délce a o u-tém členu čísla w dovolují mluvit i v případě, kdy w není
posloupností (dokonce i když není množinou). Všimněme si ještě, že formule Pair
se ve formuli B vyskytuje na dvou místech: abychom určili, zda B(w, u, v), musíme
w rozložit na dvojici z, t a pak se mimo jiné ptát, zda pro dvojici x utvořenou
z u a v platí 1+(x+1)·z | t. Za zápisem B(w, u, v) si můžeme představit názornější
zápis (u, v) ∈ w.
Písmeno B odkazuje k řeckému „β ; funkci, která číslům w a u přiřazuje u-tý
člen posloupnosti s kódem w, se často říká Gödelova β-funkce. „Lh a „Seq jsou
samozřejmě zkratky anglických slov length a sequence.
Lemma 4.2.7 Formule Seq, Lh a B deﬁnují příslušné pojmy v N. To znamená,
že pro libovolná čísla j, k, q a n platí: N |= Seq(q), právě když Seq(q) (tj. právě
když q je posloupnost), N |= Lh(q, n), právě když Lh(q) = n, a N |= B(q, j, k),
právě když (q)j = k.
Důkaz je podobný jako v 4.2.3(b), 4.2.2(c) a předtím v 4.1.8.
Zdůrazněme ještě jednou, že zápisy Seq(q), Lh(q) a (q)j = k užíváme ve významu,
který byl deﬁnován v příkladu 4.2.1 a před ním, nikoliv ve významu z kapitoly
2.
Rozmysleme si, že v Peanově aritmetice lze dokázat, že naše kódování posloupností
má očekávané vlastnosti: prvky ani délka posloupnosti w nepřevyšují (číslo) w,
členy posloupnosti jsou určeny jednoznačně, existuje posloupnost, která nemá žádné
členy, z libovolného čísla lze utvořit jednoprvkovou posloupnost, ke každým dvěma
4.2 Aritmetizace logické syntaxe 299
posloupnostem w1 a w2 existuje posloupnost w, která je slepením (konkatenací)
posloupností w1 a w2.
Věta 4.2.8 Následující sentence jsou dokazatelné v PA:
(a) ∀w∀u∀v(B(w, u, v) → u < w & v < w),
(b) ∀w∃!y Lh(w, y) & ∀w∀y(Lh(w, y) → y ≤ w),
(c) ∀w∀u∀v1∀v2(Seq(w) & B(w, u, v1) & B(w, u, v2) → v1 = v2),
(d) ∃w(Seq(w) & Lh(w, 0)),
(e) ∀v∃w(Seq(w) & Lh(w, 1) & B(w, 0, v)),
(f) ∀w1∀w2∀y1∀y2∃w(Seq(w1) & Seq(w2) & Lh(w1, y1) & Lh(w2, y2) →
→ Seq(w) & Lh(w, y1 + y2) & ∀u<y1 ∀v(B(w, u, v) ≡ B(w1, u, v)) &
& ∀u<y2 ∀v(B(w, y1 + u, v) ≡ B(w2, u, v))).
Důkaz Tvrzení (a) plyne z 4.2.3(a) a z 4.2.2(b). Ukažme si důkaz tvrzení (f),
ostatní úvahy jsou podobné nebo lehké. V (f) máme zdůvodnit, že existuje množina
w1 ∪ { (y1 + u, v) ; (u, v) ∈ w2 }. Uvažujme v PA:
Nechť čísla w1, w2, y1 a y2 splňující předpoklady Seq(w1), Seq(w2), Lh(w1, y1)
a Lh(w2, y2) jsou dána. Zvolme číslo v0 větší než všechny prvky obou posloupností
w1 a w2. To lze díky již dokázanému tvrzení (a). Zvolme číslo z takové,
že Pair(y1 + y2, v0, z). Podle věty 4.2.5 existuje množina w všech x < z, pro
která platí
x ∈ w1 ∨ ∃u∃v(Pair(y1 + u, v, x) & B(w2, u, v)).
Je jasné, že když Pair(u, v, x) a B(w1, u, v), nebo Pair(y1+u, v, x) a B(w2, u, v),
pak x < z. Číslo z tedy bylo zvoleno dostatečně velké, a tudíž w je opravdu
hledaným slepením obou posloupností w1 a w2.
QED
Díky tvrzením (e) a (f) věty 4.2.8 můžeme rozšířit naši úmluvu o užívání nedeﬁnovaných
funkčních symbolů se zřejmým významem: w1 ∗ w2 označuje ono (jednoznačně
určené) číslo, které je konkatenací posloupností w1 a w2, dále například
w ∗ x označuje prodloužení posloupnosti w o člen x (čili množinu w ∪ {(y, x)},
kde Lh(w, y)), a podobně.
Lemma 4.2.9 V PA lze dokázat sentenci ∀w1∀w2(w1 ≤ w1 ∗w2 & w2 ≤ w1 ∗w2).
Toto tvrzení plyne téměř bezprostředně z tvrzení (b) lemmatu 4.2.6. Z tvrzení
(a) téhož lemmatu navíc plyne, že konkatenace dvou posloupností w1 a w2
nenulové délky je dokonce ostře větší než kterékoliv z čísel w1 a w2.
Raději připomeňme, že kódy a prvky (formalizovaných) množin a posloupností
či délky posloupností jsou formální přirozená čísla, tj. čísla, jejichž vlastnosti vyjadřujeme
uvnitř Peanovy aritmetiky aritmetickým jazykem a která je vhodné si
300 4 Peanova a Robinsonova aritmetika
představovat jako libovolné, čili standardní nebo nestandardní, prvky nějakého modelu
Peanovy aritmetiky. Každý prvek takového modelu M je v M délkou nějakých
posloupností, tj. prvků a ∈ M, které v M splňují formuli Seq(w)!
Můžeme-li mluvit o posloupnostech, lze přikročit k úvahám o tom, jak v aritmetickém
jazyce deﬁnovat termy, formule a další syntaktické pojmy a jak v Peanově
aritmetice dokázat jejich vlastnosti. Můžeme tedy přikročit k aritmetizaci logické
syntaxe. Postupujeme podobně jako v důkazu věty 3.6.6. Tam jsme postupně
mimo jiné zdůvodnili, že podmínka ProofT (ϕ, d), čili podmínka „d je důkaz formule
ϕ v teorii T , je rekurzívní, je-li T rekurzívní. Tady chceme také mluvit
o proměnných, termech a řadě dalších syntaktických pojmů. Pro každý z těchto
pojmů chceme sestrojit aritmetickou formuli, která jej popisuje (deﬁnuje v N), a
zmínit se o jejích vlastnostech. Někdy konstrukci příslušné formule jen naznačíme.
Tím dospějeme k formuli Proofτ (x, y), která za přirozených předpokladů o teorii T
a formuli τ deﬁnuje v N podmínku ProofT (ϕ, d) a má ještě další užitečné vlastnosti.
Až budeme mít formuli Proofτ (x, y), budeme v aritmetickém jazyce moci mluvit o
formálních důkazech, o dokazatelnosti a o bezespornosti.
Stejně jako v důkazu věty 3.6.6 předpokládáme, že indexy u proměnných jsme
se rozhodli zapisovat binárně a že jazyk, který formalizujeme, je aritmetický.
Nejprve si vzpomeňme, že proměnná je posloupnost, ve které za jedním znakem
„v následuje zápis přirozeného čísla, a deﬁnujme formuli Var(v):
Var(v) ≡ Seq(v) & ¬Lh(v, 0) & ¬Lh(v, 1) & B(v, 0, ‘v) &
& (B(v, 1, ‘0) → Lh(v, 2)) &
& ∀u∀z(B(v, u, z) & u = 0 → z = ‘0 ∨ z = ‘1).
Stejně jako v kapitole 2, levý apostrof následovaný znakem označuje číselný kód,
který naše kódová tabulka přiřazuje onomu znaku. Například protože číselným
kódem znaku 0 je číslo 32, zápisy ‘0 a 32 představují tytéž termy.
Term je posloupnost symbolů, která je buď proměnná, nebo je jednočlennou
posloupností sestávající jen ze symbolu 0, nebo vznikla z nějakých termů pomocí
jednoho ze symbolů +, ·, S a závorek:
Term(x) ≡ ∃w(Seq(w) & Lh(w, x + 1) & B(w, x, 1) &
∀u∀v(B(w, u, v) → v ≤ 1) &
∀u(B(w, u, 1) ≡ (Var(u) ∨ u = ‘0 ∨
∨ ∃u1 <u∃u2 <u(B(w, u1, 1) & B(w, u2, 1) &
& u = ‘( ∗ u1 ∗ ‘+ ∗ u2 ∗ ‘) )
∨ ( . . . podobně pro symbol „⋅ . . . )
∨ ( . . . a symbol „S . . . ) ))).
Posloupnost w ve formuli Term je posloupnost nul a jedniček, která o každém
čísle nepřevyšujícím x říká, zda je kódem termu. Jednička znamená ano, nula
ne. Posloupnost w je tedy počátečním úsekem charakteristické funkce množiny
4.2 Aritmetizace logické syntaxe 301
všech termů. S její pomocí se nám podařilo simulovat v aritmetickém jazyce primitivní
rekurzi. Vzpomeňme si, že stejně jsme postupovali v důkazu věty 3.6.9.
Posloupnosti w můžeme říkat dosvědčující posloupnost.
Zápis u = ‘( ∗ u1 ∗ ‘+ ∗ u2 ∗ ‘) ve formuli Term je zkratka pro číslo u je posloupnost,
jejíž nejlevější člen je ‘(, pak následují členy totožné s členy posloupnosti u1,
pak člen ‘+ a členy posloupnosti u2, nakonec člen ‘). Čtyři hvězdičky naznačují, že
u je konkatenací pěti posloupností, z nichž tři jsou jednoprvkové sestávající pouze
z číselného kódu přiřazeného levé závorce, symbolu + resp. pravé závorce. Domluvme
se, že v této situaci budeme nadále psát u = (u1+u2) , formální výraz u
vznikl z formálních výrazů u1 a u2 a tří jednotlivých symbolů. Podobně budeme
psát například u = ∀xz , jestliže formální výraz u je posloupnost, která je utvořena
konkatenací posloupností x a z a připojením (na začátek) ještě jednoho členu ‘∀.
Zápisy tvaru . . , tj. výrazy vymezené „horními růžky , umožňují vypustit hvězdičky,
levé apostrofy a pruhy nad ciframi. K typu písma ještě poznamenejme, že
například +, · a S jsou tytéž symboly jako +, ⋅ a S. Strojopisnou verzi užíváme
stejně jako v kapitole 2 tehdy, chceme-li zdůraznit, že opravdu jde o symboly. V zápisech
typu (u1+u2) a ∀xz umožňuje strojopisné písmo odlišit jednotlivé symboly
od zkratek zastupujících posloupnosti symbolů.
Lemma 4.2.10 (a) N |= Var(m), právě když m je (ve smyslu kódování z tohoto
oddílu) kódem nějaké proměnné.
(b) N |= Term(m), právě když m je kódem nějakého termu.
(c) PA ∀x1∀x2(Term(x1) & Term(x2) → Term( (x1+x2) ) &
& Term( (x1⋅x2) ) & Term( S(x1) )).
(d) PA ∀x(Term(x) → Var(x) ∨ x = 0 ∨ ∃x1(Term(x1) & x = S(x1) ) ∨
∨ ∃x1∃x2(Term(x1) & Term(x2) & x = (x1+x2) ∨ x = (x1⋅x2) )).
Důkaz Tvrzení (a) plyne z lemmatu 4.2.7, tj. z faktu, že všechny tři formule Seq,
Lh a B použité k sestavení formule Var(v) deﬁnují v N to, co mají deﬁnovat.
Podívejme se na (c). Označme α(x, w) formuli Seq(w) & Lh(w, x + 1) & (. . .),
kde závorka s tečkami označuje druhý až sedmý řádek ve formuli Term(x). Formule
Term(x) je tedy ekvivalentní s ∃w(α(x, w) & B(w, x, 1)). Formuli α(x, w) lze
číst číslo w je dosvědčující posloupnost délky x + 1. Platí
PA ∃wα(0, w) a PA ∀x(∃wα(x, w) → ∃w α(x + 1, w )).
Přitom se uplatní 4.2.8(d)–(f) (viz též cvičení 9). Indukce dává
PA ∀x∃wα(x, w). (1)
Dále platí
PA ∀x1∀x2∀w1∀w1∀y(y ≤ x1 & y ≤ x2 & α(x1, w1) & α(x2, w2) →
→ ∀u≤y(B(w1, u, 1) ≡ B(w2, u, 1)).
(2)
302 4 Peanova a Robinsonova aritmetika
Toto se rovněž dokáže indukcí (podle y s parametry x1, x2, w1 a w2). Z (2) plyne,
že v každé dvojici dosvědčujících posloupností je některá z nich počátečním úsekem
druhé. Uvažujme v PA:
Nechť Term(x1) a Term(x2). Tedy existují čísla w1 a w2 taková, že α(x1, w1),
α(x2, w2), B(w1, x1, 1) a B(w2, x2, 1). Vezměme posloupnost w takovou, že
α( (x1+x2) , w), tj. vezměme dosvědčující posloupnost délky (x1+x2) + 1.
Taková existuje dle (1). Z lemmatu 4.2.9 a z poznámky uvedené za tímto lemmatem
plyne x1 < (x1+x2) a x2 < (x1+x2) . Posloupnost w tedy přiřazuje
nějaké hodnoty číslům x1 a x2. Dle (2) se w až do x1 shoduje s w1 a až do x2
s w2. Tedy B(w, x1, 1) a B(w, x2, 1). Užití poslední části formule α, začínající
kvantiﬁkátorem ∀u, na u = (x1+x2) dává B(w, (x1+x2) , 1). Tím jsme
ověřili, že Term( (x1+x2) ).
Zbývající úvahy v (c) a (d) jsou podobné.
Vraťme se ještě krátce k tvrzení (b). Je-li m term, můžeme vzít posloupnost q
délky m + 1, která každému j ≤ m přiřazuje hodnotu 1 nebo 0 podle toho, je-li j
termem. Musí platit N |= α(m, q) a N |= B(m, q, 1). Tedy N |= Term(q). Když
naopak q je takové, že N |= α(m, q) a N |= B(m, q, 1), pak ve skutečnosti (tj. na
metamatematické úrovni) q je počátečním úsekem charakteristické funkce množiny
všech termů přiřazující hodnotu 1 číslu m. Tedy m je term. QED
Podobně jako se to podařilo u proměnných a termů, můžeme zavést formule
deﬁnující ostatní syntaktické pojmy a podmínky:
Numeral(x, y) y je x-tý numerál,
FmAt(z) z je atomická formule,
Fm(z) z je formule,
SubT(v, x, t, y) y je výsledek substituce termu t za proměnnou v v termu x,
SubF(v, z, t, y) y je výsledek substituce termu t za proměnnou v ve formuli z,
OccT(v, t) proměnná v se vyskytuje v termu t,
OccF(v, z) proměnná v má volné výskyty ve formuli z,
Sent(z) z je sentence,
FreeSub(v, z, t) t je term substituovatelný za v ve formuli z,
LogAx(z) z je logický axiom,
UnivClo(z, y) z je formule a y je její univerzální uzávěr.
Předpokládáme, že čtenář je schopen kteroukoliv z těchto deseti formulí zapsat
pomocí formulí popisujících kódování posloupností a případně s užitím formulí,
které se na seznamu vyskytují dříve. Například Numeral(x, y) je formule term y je
onen term, který vznikne x-násobnou aplikací operace v → S(v) z termu 0 , kdežto
UnivClo(z, y) je formule číslo z je formule, číslo y je tvaru uz , kde u je posloupnost,
která začíná kvantiﬁkátorem a která má navíc vlastnost, že každá její podposloupnost
4.2 Aritmetizace logické syntaxe 303
umístěná mezi dvěma kvantiﬁkátory nebo za posledním kvantiﬁkátorem je proměnná,
která má volné výskyty v z.
Můžeme-li mluvit o substituovatelnosti termů, snadno aritmetickou formulí vyjádříme,
že formule z je logickým axiomem tvaru B1:
∃v∃x∃t∃y(FreeSub(v, x, t) & SubF(v, x, t, y) & z = (∀vx→y) ).
Naprosto analogicky popíšeme schéma B2. Pak už snadno zapíšeme formulí, že z
je logickým axiomem: LogAx(z), jestliže z má jeden z tvarů B1, B2, A1–A7, E1–E5.
Věta 4.2.11 (a) Všechny dosud utvořené formule deﬁnují příslušné pojmy v N.
Například N |= Fm(ϕ), právě když ϕ je (číselný kód) formule, a N |= LogAx(ϕ),
právě když ϕ je logický axiom (jazyka aritmetiky).
(b) Triviální fakty o syntaktických objektech analogické tvrzením 4.2.10 (c) a (d)
jsou dokazatelné v PA. Například:
– Konjunkcí, disjunkcí, implikací, negací a kvantiﬁkací z formulí vzniknou opět for-
mule.
– Každá formule je atomická, nebo má některý z tvarů ¬z1 , ∀vz1 , ∃vz1 , (z1→z2) ,
(z1&z2) , nebo (z1∨z2) , kde z1 je formule resp. z1 a z2 jsou formule.
(c) U těch formulí, které deﬁnují graf funkce, lze i v PA dokázat, že deﬁnují graf
funkce:
– PA ∀x∃!yNumeral(x, y),
– PA ∀v∀x∀t∃!ySubT(v, x, t, y),
– PA ∀v∀z∀t∃!ySubF(v, z, t, y),
– PA ∀z∃!yUnivClo(z, y).
Důkaz Formulí Term jsme se dost podrobně zabývali v 4.2.10. Všechna tvrzení
v (a) se dokáží víceméně stejně jako v 4.2.10(b) a všechna tvrzení v (b) se dokáží
víceméně stejně jako v 4.2.10 (c) a (d). Tvrzení (c) je analogické tvrzení 4.2.8(b)
(o jednoznačnosti délky posloupnosti). QED
Tím jsme v aritmetizaci logické syntaxe dospěli k důkazům a dokazatelnosti.
Postupujeme opět stejně jako v důkazu věty 3.6.6. Chceme vyjádřit formulí, že
důkaz je číslo tvaru z1#z2# . . #zt , kde každá podposloupnost zv je formule, která
je z některých předchozích formulí odvozena tak, jak se požaduje v deﬁnici hilbertovského
kalkulu, přičemž počet t formulí v důkazu w může být libovolné (formální!)
číslo. Formule Beg(w1, w) říká, že posloupnosti w1 a w jsou totožné, nebo
posloupnost w1 lze z w získat odstraněním všech členů od některého členu ‘# do konce.
Formule Ends(w, x) říká, že posloupnost x neobsahuje člen ‘#, a je buď rovna posloupnosti
w, nebo ji lze z w získat odstraněním počátečních členů až do některého členu ‘#.
Je-li w důkazem, pak formuli Beg(w1, w) lze číst důkaz w1 je počátečním úsekem
důkazu w, kdežto formuli Ends(w, x) lze číst formule x je poslední formulí důkazu w.
304 4 Peanova a Robinsonova aritmetika
Nechť nyní τ(z) je formule s jednou volnou proměnnou. S pomocí formulí
Beg(w1, w) a Ends(w, x) deﬁnujme formuli Proofτ (x, w):
Ends(w, x) & ∀w1∀z(Beg(w1, w) & Ends(w1, z) → Fm(z) &
& (∃w2∃z1∃z2∃v(Fm(z1) & Fm(z2) & Var(v) &
& Beg(w2, w1) & Ends(w2, (z1→z2) ) & ¬OccF(v, z1) &
& z = (z1→∀vz2) ) ∨
∨ ( . . . podobně pro pravidla Gen-E a MP . . . ) ∨
∨ LogAx(z) ∨ (τ(z) & Sent(z)))).
Formule τ vystupuje ve formuli Proofτ (x, w) jako podformule, která popisuje množinu
předpokladů. Formuli Proofτ (x, w) čteme číslo w je důkaz formule x, případně
podrobněji číslo w je důkaz formule x z množiny předpokladů { z ; τ(z) & Sent(z) }.
Věta 4.2.12 Nechť formule τ deﬁnuje v N množinu axiomů teorie T. Pak formule
Proofτ (x, w) deﬁnuje v N relaci {[ϕ, d]; d je důkaz formule ϕ v T }, tj. podmínku
Proof(ϕ, d).E
Důkaz je analogický jako v 4.2.11(a), 4.2.10 (a) a (b) a v řadě podobných tvrzení
uvedených dříve.
Máme-li pojem důkazu, můžeme v aritmetickém jazyce mluvit i o dokazatelnosti
a bezespornosti:
Prτ (x) ≡ ∃wProofτ (x, w), Con(τ) ≡ ¬Prτ (0 = S(0)).
Formule x je dokazatelná, má-li nějaký důkaz, a množina { z ; τ(z) & Sent(z) } je
bezesporná, není-li z ní dokazatelná sentence 0 = S(0), o které jsme se tedy tímto
rozhodli, že reprezentuje spor.
Dále se domluvme na tom, jak popíšeme rozšíření teorie přidáním jednoho axiomu
a jak aritmetickými formulemi popíšeme axiomatiku teorií Q a PA.
Nechť τ(z) je formule s jednou volnou proměnnou z. Označme (τ + y) formuli
τ(z) ∨ z = y. Formule Proof(τ+y)(x, w), Pr(τ+y)(x) a Con(τ + y) (zde jeden
pár závorek vynecháváme) připouštějí jako axiomy kromě formálních sentencí
s vlastností τ i předpoklad y, pokud ovšem y je také (formální) sentencí.
Je-li F konečná množina aritmetických sentencí, F = {ϕ1, . . , ϕn}, pak [F](z)
označuje formuli z = ϕ1 ∨ . . ∨ z = ϕn. Domluvme se, že je-li [F] v indexu
u formule Proof nebo Pr nebo v závorce u sentence Con, vynecháváme hranaté
závorky. Formule ProofQ(x, w) tedy vyjadřuje, že číslo w je důkazem formule x
v Robinsonově aritmetice. Axiomy Peanovy aritmetiky popišme následující formulí,
kterou označme π(z):
[Q](z) ∨ ∃u∃u1∃u2∃y∃v∃t1∃t2(Var(v) & t1 = 0 & t2 = S(v) &
& SubF(v, u, t1, u1) & SubF(v, u, t2, u2) &
& y = ((u1&∀v(u→u2))→∀vu) & UnivClo(y, z)),
4.2 Aritmetizace logické syntaxe 305
formule z je axiomem Peanovy aritmetiky, je-li axiomem Robinsonovy aritmetiky
nebo je-li axiomem indukce, tj. univerzálním uzávěrem nějaké formule y tvaru
((u1&∀v(u→u2))→∀vu) , kde formule u1 a u2 jsou výsledky substituce termu 0
resp. termu S(v) za proměnnou v ve formuli u.
Věta 4.2.13 (a) Když formule τ deﬁnuje v N množinu axiomů teorie T, pak
formule Prτ (x) deﬁnuje množinu Thm(T). Když navíc ϕ je libovolná sentence,
pak formule (τ + ϕ) deﬁnuje množinu axiomů teorie (T + ϕ) a formule Pr(τ+ϕ)(x)
deﬁnuje množinu Thm(T + ϕ).
(b) Formule [Q](z) a π(z) deﬁnují množinu axiomů teorie Q resp. PA. Obecně
každá formule [F](z), kde F je konečná množina sentencí, deﬁnuje množinu F.
(c) Formule PrQ(x) a Prπ(x) deﬁnují množiny Thm(Q) a Thm(PA). Obecně
je-li F konečná množina sentencí, pak formule PrF (x) deﬁnuje množinu Thm(F).
(d) N |= Con(Q) a N |= Con(π).
Důkaz Pro libovolnou sentenci ϕ platí
T ϕ ⇔ existuje důkaz d formule ϕ z předpokladů T
⇔ ∃d(N |= Proofτ (ϕ, d))
⇔ N |= ∃wProofτ (ϕ, w),
kde druhá ekvivalence plyne z 4.2.12. Tím jsme dokázali první část tvrzení (a).
Druhá část a (b) jsou jasné. Tvrzení (c) plyne z (a) a (b). Protože PA je bezesporná
teorie (neboť N je jejím modelem), žádné číslo d není důkazem sentence 0 = S(0).
Protože formule Proofπ(x, w) deﬁnuje podmínku ProofT (ϕ, d), máme E
∀d(N |= ¬Proofπ(0 = S(0), d)) a N |= ∀w¬Proofπ(0 = S(0), w).
Úvaha pro teorii Q je úplně stejná. QED
Věta 4.2.14 (a) PA ∀x(LogAx(x) ∨ (τ(x) & Sent(x)) → Prτ (x)).
(b) PA ∀x∀y(Prτ (x) & Prτ ( (x→y) ) → Prτ (y)).
(c) PA ∀x(τ1(x) & Sent(x) → Prτ2
(x)) → ∀x(Prτ1
(x) → Prτ2
(x)).
(d) Když PA Prτ (αi) pro každý z devíti axiomů α1, . . , α9 Robinsonovy aritmetiky,
pak PA ∀x(PrQ(x) → Prτ (x)).
(e) PA ∀x(PrQ(x) → Prπ(x)).
(f) PA ∀x∀y(Sent(y) → (Pr(τ+y)(x) ≡ Prτ ( (y→x) ))).
(g) PA ¬Con(τ) ≡ ∀xPrτ (x).
(h) PA ∀y(Sent(y) → (Con(τ + y) ≡ ¬Prτ ( ¬y ))).
Důkaz Snadno lze ověřit PA ∀x(τ(x) & Sent(x) → Proofτ (x, x)):
306 4 Peanova a Robinsonova aritmetika
Platí-li Beg(w1, x) a Ends(w1, z), tj. je-li z na konci některého počátečního
úseku posloupnosti x, pak z splňuje disjunkci (. . .)∨LogAx(z)∨(τ(z)&Sent(z)),
neboť jediné takové z je x a x splňuje některý ze dvou posledních členů.
Podobně snadno se dokáže tvrzení (b):
Je-li Proofτ (x, w1) a Proofτ ( (x→y) , w2), pak Proofτ (y, w1#w2#y ).
V (c) užijeme indukci:
Předpokládejme ∀z(τ1(z) & Sent(z) → Prτ2
(z)) a Proofτ1
(x, w). Dokažme
∀y∀w1∀z(Beg(w1, w) & Ends(w1, z) & Lh(w1, y) → Prτ2 (z)) indukcí dle y. Platí-li
τ1(z) & Sent(z), pak Prτ2 (z) dle předpokladu. Je-li LogAx(z), pak Prτ2 (z)
dle (a). Je-li z odvozena z předchozích členů (z1→z) a z1 pomocí pravidla MP,
pak počáteční úseky důkazu w1 končící formulemi (z1→z) a z1 mají délku menší
než y, takže na ně lze užít indukční předpoklad. Tedy Prτ2
(z1) a Prτ2
( (z1→z) ).
Z toho plyne Prτ2 (z) díky již dokázanému tvrzení (b). Zbývající dva případy,
kdy z je odvozena z předchozích členů pomocí pravidla Gen-A nebo Gen-E, jsou
analogické.
Všimněme si, že tvrzení (b) je formalizací pravidla MP. Dvě analogická tvrzení
týkající se pravidel Gen-A a Gen-E jsme pro stručnost vynechali, ale v předchozím
důkazu tvrzení (c) jsme je použili. Tvrzení (f) lze označit jako formalizovanou
větu o dedukci a lze je dokázat podobně jako tvrzení (c), tj. formalizací běžného
důkazu věty o dedukci známého z kapitoly 3. Jsou-li α1, . . , α9 axiomy Robinsonovy
aritmetiky, pak PA ∀x([Q](x) & Sent(x) → x = α1 ∨ . . ∨ x = α9). Z toho
a z (c) plyne (d). Tvrzení (e) plyne z (d) volbou τ := π. Tvrzení (g) a (h) lze
dokázat „přeříkáním v PA příslušných důkazů z 3.2.7. QED
Peanova aritmetika tedy ví o platnosti nejzákladnějších faktů z predikátové
logiky, jako je věta o dedukci nebo fakt, že PA není slabší teorií než Q. A ví to
proto, že příslušné důkazy v ní lze formalizovat.
V tomto oddílu se vyskytla také dvě tvrzení, která lze celkem lehko dokázat, ale
jejichž běžné důkazy nejsou čistě syntaktické. Jde o tvrzení Robinsonova aritmetika
je bezesporná a o tvrzení Peanova aritmetika je bezesporná vyjádřená sentencemi
Con(Q) a Con(π). Vypadá to, že k jejich formalizaci uvnitř PA bychom potřebovali
formalizovat v PA také logickou sémantiku. Formalizovat v PA logickou sémantiku
nebo alespoň její vhodnou část a dokázat tak v PA bezespornost teorií Q a PA
— je to rozumný plán, který poskytne žádoucí a očekávané výsledky? Varujeme
čtenáře před ukvapenou odpovědí. S „ano se celkem dá souhlasit a něco v tomto
směru v příštích oddílech uděláme. Ale případný důkaz, že některá ze sentencí
Con(Q) a Con(π) je v PA nedokazatelná, by také byl žádoucím výsledkem, protože
by znamenal (negativní) odpověď na otázku, zda PA je úplná. Z věty 4.2.13(d)
víme, že obě sentence Con(Q) a Con(π) platí v N. Položme si tedy otázky:
• Platí PA Con(Q) nebo PA Con(π)?
4.2 Aritmetizace logické syntaxe 307
Podobně jako jsme to udělali pro aritmetický jazyk a teorie Q a PA, lze v PA
formalizovat i dokazatelnost v jakékoliv jiné teorii (s konečným jazykem), například
v teorii množin. O tom a o dokazatelnosti bezespornosti teorie množin v Peanově
aritmetice nebo v samotné teorii množin se v dalším výkladu ještě zmíníme.
Neklademe si otázku, zda nějaké tvrzení vyjadřující bezespornost je dokazatelné
už v Q. Logickou syntax jsme se rozhodli formalizovat v Peanově aritmetice, ačkoliv
je známo, že to není poslední slovo. Všude, kde ve větě 4.2.14 stojí „PA vlevo od
znaku „ , by mohla stát mnohem slabší teorie než PA. A po určitých (spíše
značných) modiﬁkacích dokazovaných sentencí by tam dokonce mohlo stát „Q . O
tom jsou například Pudlákovy články [68] a [67] nebo článek Wilkieho a Parise [98].
Ale dokud to není učiněno, tj. dokud uvnitř nějaké teorie T není dokázáno, že
dokazatelnost má obvyklé vlastnosti, nemá asi smysl se ptát, zda v T je dokazatelné
jakékoliv tvrzení vyjadřující bezespornost.
Zalistujeme-li ještě jednou v tomto oddílu, můžeme si všimnout, že všechna tvrzení
lze rozdělit do dvou skupin. Tvrzení 4.2.14 a předtím 4.2.2 (a) a (b), 4.2.3(a),
4.2.4, 4.2.5, 4.2.6, 4.2.8, 4.2.9, 4.2.10 (c) a (d) a 4.2.11 (b) a (c) se týkají dokazatelnosti
obecných faktů o množinách, posloupnostech a syntaktických objektech. A
tvrzení 4.2.12 a 4.2.13 a předtím 4.2.2(c), 4.2.3(b), 4.2.7, 4.2.10 (a) a (b) a 4.2.11(a)
se týkají platnosti numerických instancí různých formulí ve struktuře N. Víme například,
kdy v N platí sentence Prπ(n): právě tehdy, když n je (numerickým kódem)
formule, která je ve skutečnosti dokazatelná v PA. Nezabývali jsme se ale dokazatelností
numerických instancí. Víme-li například PA 3 + 2 = 4 (což víme),
znamená to, že platí také PA ¬Prπ(3 + 2 = 4)? A víme-li, že PA 3 + 2 = 5
(což ponecháváme jako cvičení), znamená to, že platí i PA Prπ(3 + 2 = 5)? Tyto
otázky lze zobecnit:
• Když τ(z) deﬁnuje v N množinu axiomů teorie T, jaký je vztah mezi podmínkami
T ϕ a PA Prτ (ϕ)?
• Když τ(z) deﬁnuje v N množinu axiomů teorie T, jaký je vztah mezi podmínkami
T ϕ, PA Prτ (ϕ) a PA ¬Prτ (ϕ)?
Některé odpovědi jsou zřejmé. Například když PA Prτ (ϕ), pak sentence Prτ (ϕ)
platí v každém modelu teorie PA, tedy i v N. Věta 4.2.13(a) říká, že platí-li sentence
Prτ (ϕ) v N, pak T ϕ. Další odpovědi se dozvíme v následujících oddílech.
Je také zřejmé, že otázky, zda PA ¬Prπ(ϕ) pro určitou sentenci ϕ, souvisejí
s výše zmíněnou otázkou, zda PA Con(π). Z tvrzení 4.2.14(h) totiž plyne, že
PA ¬Prπ(ϕ) → Con(π) pro každou aritmetickou sentenci ϕ.
Cvičení
1. Formuli ∀x∀y(x · x = 2 · y · y → x = 0 & y = 0) lze číst číslo
√
2 je iracionální.
Dokažte ji v PA.
2. Nalezněte všechny prvky čísla q = (24, 29 341). Je q kódem množiny či po-
sloupnosti?
308 4 Peanova a Robinsonova aritmetika
3. Dokažte zbývající případy v 4.2.2(a): levý člen konjunkce a jednoznačnost
v pravém členu.
4. Dokažte v PA, že podmínky RPrime(a, b) a ∀x(x | a & x | b → x = 1) jsou za
předpokladu a = 0 ekvivalentní.
Návod. Při důkazu implikace ⇐ (v němž se předpoklad a = 0 neuplatní) užijte
Bezoutovu větu na dvojici [a, b].
5. Deﬁnujte v PA největšího společného dělitele D(a, b) čísel a a b:
D(a, b) = c ≡ c | a & c | b & ∀v(v | a & v | b → v | c).
Dokažte v PA, že tato deﬁnice je korektní, tj. že ke každé dvojici a, b existuje
právě jedno c splňující podmínku na pravé straně ekvivalence. Dokažte dále,
že nahradíme-li ve formulích Ax1–Ax5 v Úvodu na str. 9 symboly ≤, · a +
symboly |, D a ·, pak v PA lze dokázat, že výsledné formule pro nenulová čísla
platí. Zdůvodněte, že distributivní pravidlo D(a · c, b · c) = D(a, b) · c je v PA
dokazatelné pro všechna a, b a c.
6. Na předchozím cvičení lze založit alternativní důkaz tvrzení z cvičení 4:
Nechť a | b · x, a = 0, x = 0. Vezměme d takové, že d = D(a, x), a
vezměme v takové, že d · v = a. Platí D(a · b, b · x) = d · b. Tedy a | d · b.
Z toho a z podmínek d · v = a a D(a, b) = 1 plyne v = 1. Tedy d = a
a a = D(a, x). Takže a | x.
Domyslete a dokončete!
7. Dokažte v PA formuli ∀x∀y∀z(RPrime(x, y) & x | z & y | z → x · y | z).
8. Zdůvodněte, že číslo q z příkladu 4.2.1 je nejmenším přirozeným číslem, jehož
prvky jsou 1, 4 a 5, a že tedy q je množinou.
9. Dokažte v PA formuli
∀w∀x∀y∃w (Seq(w) & Lh(w, y) → Seq(w ) & Lh(w , y + 1)
& ∀u<y∀v(B(w, u, v) ≡ B(w , u, v)) & B(w , y, x)).
10. Zdůvodněte, že pro každý z axiomů α1, . . , α9 Robinsonovy aritmetiky platí
PA Prπ(αi). Ukažte na místo v důkazu věty 4.2.14, kde bylo toto tvrzení
použito.
11. Jestliže sentence Con(π) je v PA dokazatelná, pak i sentence Con(Q) je v PA
dokazatelná, a to proto, že PA Con(π) → Con(Q). Dokažte.
12. Nechť formule τ(z) deﬁnuje množinu axiomů teorie T v N. Zdůvodněte implikace
PA ¬Prτ (ϕ) ⇒ T ϕ a T ϕ ⇒ PA Prτ (ϕ).
4.2 Aritmetizace logické syntaxe 309
4.3 Hierarchie aritmetických formulí
V tomto oddílu se budeme zabývat otázkami, jaké množiny přirozených čísel jsou
deﬁnovatelné ve struktuře N a jak složité jsou formule, které je deﬁnují. Nejprve
uvažujme o syntaktické složitosti aritmetických formulí. Stejně jako v kapitole 2
přijímáme hledisko, že syntaktická složitost formule je především dána střídáním
kvantiﬁkátorů.
Deﬁnice 4.3.1 Řekneme, že aritmetická formule ϕ je utvořena z formule ψ omezenou
kvantiﬁkací, jestliže ϕ má jeden z tvarů
∀v(v < x → ψ), ∃v(v < x & ψ), ∀v(v ≤ x → ψ), ∃v(v ≤ x & ψ), (∗)
kde v a x jsou různé proměnné. Formule (∗) zapisujeme ∀v<xψ, ∃v<xψ, ∀v≤xψ
resp. ∃v≤xψ. Zápisy „∀v<x , „∃v<x , „∀v≤x a „∃v≤x nazýváme omezené
kvantiﬁkátory. Aritmetická formule je omezená, jestliže obsahuje pouze omezené
kvantiﬁkátory. Množinu všech omezených formulí značíme ∆0. Místo omezená
formule říkáme také ∆0-formule.
Netvrdí se, že omezená formule obsahuje nějaké (omezené) kvantiﬁkátory. Tvrdí
se ale, že neobsahuje žádné jiné kvantiﬁkátory než omezené, čili že neobsahuje neomezené
kvantiﬁkátory. Například formule Pair(z, t, w) je omezená, protože neobsahuje
vůbec žádné kvantiﬁkátory. Formule ∃v(v · x = y), kterou zkráceně zapisujeme
x | y, omezená není. Je ale v PA ekvivalentní s formulí ∃v≤y(v · x = y), která
omezená je. U formule tvaru například ∀v≤xψ, která vznikla z ψ omezenou kvantiﬁkací,
je samozřejmě přípustné, aby proměnné v a x měly volné výskyty ve formuli
ψ. Formuli tvaru ∀v(v ≤ v → ψ) pochopitelně neuznáváme za formuli, která
vznikla z ψ pomocí omezené kvantiﬁkace. Všimněme si dále, že omezené kvantiﬁkátory
očekávaným způsobem interagují s negací: například formule ¬∀v≤xψ je
v PA (a dokonce už v predikátové logice) ekvivalentní s ∃v≤x¬ψ atd. Význam
omezených formulí je zejména v tom, že úloha, zda daná omezená formule je v N
splněna daným ohodnocením proměnných, je algoritmicky rozhodnutelná. K tomu
se ještě vrátíme.
Deﬁnice 4.3.2 Řekneme, že formule ϕ je Σ-formule, jestliže ϕ je sestavena z omezených
formulí pomocí konjunkce, disjunkce, existenční kvantiﬁkace a libovolné
omezené kvantiﬁkace. Formule ϕ je Σn, kde n ≥ 0, je-li je tvaru ∃v1∀v2∃ . . vnθ,
kde θ ∈ ∆0. Formule ϕ je Πn, kde n ≥ 0, je-li naopak tvaru ∀v1∃v2∀ . . vnθ,
kde θ ∈ ∆0. Nechť T je teorie s (alespoň) aritmetickým jazykem a nechť Γ je
některá z množin ∆0, Σ, Σn nebo Πn. Řekneme, že ϕ je Γ-formule v T, jestliže
existuje formule ψ ∈ Γ taková, že T ϕ ≡ ψ. Řekneme, že ϕ je ∆n-formule v T,
jestliže ϕ je zároveň Σn i Πn v T. Množinu všech formulí, které jsou Γ-formulemi
v T, kde Γ je ∆0, Σ, Σn, Πn nebo ∆n, značíme Γ(T).
Takže Σn-formule či Πn-formule je taková formule, která je utvořena z ∆0-formule
pomocí n střídajících se kvantiﬁkátorů, z nichž první zleva je existenční resp.
310 4 Peanova a Robinsonova aritmetika
univerzální a poslední (úplně vnitřní) je takový nebo onaký podle toho, je-li n sudé
nebo liché. Platí Σ0 = Π0 = ∆0. Dále Σn+1-formule (Πn+1-formule) jsou přesně ty,
které vznikly pomocí jednoho existenčního (univerzálního) kvantiﬁkátoru z Πn-formulí
resp. ze Σn-formulí. Formule x | y je ∆0 v PA. Rovněž formule Prime(x) je
∆0 v PA, neboť je ekvivalentní s formulí
x > 1 & ∀u≤x∀v<x(u · v = x → v = 1),
která je omezená. Všimněme si také, že množina ∆0(T) je v 4.3.2 deﬁnována
dvakrát, ale shodně: ∆0(T) v druhém významu je Σ0(T) ∩ Π0(T), ale Σ0(T)- i
Π0(T)-formule jsou formule vzniklé z ∆0(T)-formulí (v prvním významu) pomocí
nulového počtu střídajících se kvantiﬁkátorů.
Je jasné, že když teorie T obsahuje PA (tj. když PA je podteorií teorie T),
pak Γ(PA) ⊆ Γ(T), neboli každá formule, která je Γ-formulí v PA, je zároveň Γ-formulí
v T. Vzhledem k tomuto faktu formulujeme lemma 4.3.4 pouze pro množiny
formulí tvaru Γ(PA). V důkazu lemmatu 4.3.4 budeme potřebovat následující tvrzení
o dokazatelnosti schématu B, které se nazývá schématem kolekce.
Lemma 4.3.3 Každá instance schématu
B: ∀y∀z(∀u<z ∃vϕ(u, v, y) → ∃w∀u<z ∃v<wϕ(u, v, y))
je dokazatelná v PA.
Důkaz Následující důkaz je možná čtenáři velice povědomý, protože schéma B se
již vyskytlo ve cvičeních oddílu 4.1.
Postupujme indukcí podle z. Je-li z = 0, pak podmínka ∀u<z ∃v<wϕ(u, v, y)
platí bez ohledu na w. Nechť ∀u<(z+1)∃vϕ(u, v, y). Pak ∀u<z ∃vϕ(u, v, y) a
zároveň ∃vϕ(z, v, y). Zvolme w0 takové, že ∀u<z ∃v<w0 ϕ(u, v, y). Takové w0
existuje dle indukčního předpokladu. Zvolme v0 takové, že ϕ(z, v0, y). Pak pro
libovolné číslo w takové, že w ≥ w0 a w > v0, platí ∀u<(z+1)∃v<wϕ(u, v, y).
QED
Lemma 4.3.4 (a) Σn(PA) ∪ Πn(PA) ⊆ Σn+1(PA) ∩ Πn+1(PA)
(b) Když ϕ ∈ Σn(PA), pak ¬ϕ ∈ Πn(PA). Když ϕ ∈ Πn(PA), pak ¬ϕ ∈ Σn(PA).
(c) Konjunkce, disjunkce a omezená kvantiﬁkace užitá na Σn(PA)-formule nebo
na Πn(PA)-formule dává formuli, která je PA-ekvivalentní se Σn- resp. s Πn-formulí.
Jinými slovy, každá z množin Σn(PA) i Πn(PA) je uzavřena na konjunkci,
disjunkci a omezenou kvantiﬁkaci.
(d) Je-li n ≥ 1, pak množina Σn(PA) je uzavřena na existenční kvantiﬁkaci a
množina Πn(PA) je uzavřena na univerzální kvantiﬁkaci.
(e) Všechny množiny ∆n(PA) jsou uzavřeny na logické spojky a na omezenou kvan-
tiﬁkaci.
(f) Každá Σ-formule je zároveň v Σ1(PA).
4.3 Hierarchie aritmetických formulí 311
Důkaz Postupujeme víceméně stejně jako v lemmatu 2.2.35. Tvrzení (a) je jasné:
přidáme-li ke kvantiﬁkátorům formule ϕ další jalové kvantiﬁkátory, které vážou nové
proměnné (tj. proměnné nevyskytující se ve ϕ), dostaneme formuli ekvivalentní s ϕ.
(b) Když ϕ je ekvivalentní s formulí tvaru ∃v1∀v2∃ . . vnθ, pak ¬ϕ je ekvivalentní
s ∀v1∃v2∀ . . vn¬θ. Je-li θ ∈ ∆0, pak i ¬θ ∈ ∆0 a ∀v1∃v2∀ . . vn¬θ je Πn. Druhý
případ je úplně stejný.
Tvrzení (c) a (d) lze dokázat najednou indukcí podle n. Množiny Σ0(PA) a Π0(PA)
jsou očividně uzavřeny na konjunkci, disjunkci a omezenou kvantiﬁkaci. Ze všech
případů (tvrzení (d) a uzavřenost třídy Σn+1(PA) a Πn+1(PA) na konjunkci, disjunkci
a na čtyři tvary omezené kvantiﬁkace) dokažme jen jeden nejdůležitější:
množina Σn+1(PA) je uzavřena na omezený kvantiﬁkátor tvaru ∀u<z . Nechť ϕ
je Σn+1(PA). To znamená, že ϕ je ekvivalentní s formulí tvaru ∃vψ, kde ψ ∈ Πn.
Tři formule ∀u<z ϕ, ∀u<z ∃vψ, ∃w∀u<z ∃v<wψ jsou spolu ekvivalentní: jedna implikace
je lemma 4.3.3 a ostatní lze snadno ověřit. Protože předpokládáme, že množina
Πn(PA) je uzavřena na omezenou kvantiﬁkaci, platí ∀u<z ∃v<wψ ∈ Πn(PA),
a formule ∀u<z ϕ je tedy PA-ekvivalentní se Σn+1-formulí. Ostatní úvahy jsou
stejné jako v 2.2.35.
(e) Nechť ϕ je PA-ekvivalentní s ψ i s χ, kde ψ ∈ Σn a χ ∈ Πn. Pak ¬ϕ je
ekvivalentní s ¬ψ i s ¬χ. Tvrzení (b) dává ¬ψ ∈ Πn(PA) a ¬χ ∈ Σn(PA). Tedy ¬ϕ
je ekvivalentní se Σn- i s Πn-formulí, a je tedy ∆n(PA). Uzavřenost množiny ∆n(PA)
na konjunkci, disjunkci a omezenou kvantiﬁkaci plyne z (d). Implikaci lze vyjádřit
pomocí negace a disjunkce.
(f) V (c) a (d) je řečeno, že množina Σ1(PA) je uzavřena na konjunkci, disjunkci,
existenční kvantiﬁkaci a libovolnou omezenou kvantiﬁkaci, což jsou přesně ty operace,
které se vyskytují v deﬁnici Σ-formule. QED
Lemma 4.3.5 (a) Formule x | y, Prime(x), Pair(z, t, w), x ∈ w, RPrime(x, y),
Set(w), B(w, u, v), Lh(w, y), Seq(w), Var(x), UnivClo(z, y), Beg(w1, w), Ends(w, z)
a [Q](z) jsou ∆0 v PA.
(b) Formule Term(x), Numeral(x, y), FmAt(z), Fm(z), SubT(v, x, t, y), OccT(v, t),
SubF(v, z, t, y), OccF(v, z), Sent(z), FreeSub(v, z, t) a LogAx(z) jsou ∆1 v PA.
(c) Když τ(z) je ∆1 v PA, pak formule Proofτ (x, w) je ∆1 v PA.
(d) Když τ(z) je Σ v PA, pak Proofτ (x, w) a Prτ (x) jsou Σ1 v PA a Con(τ) je
Π1 v PA.
(e) Formule π(z) je ∆1 v PA. Tedy ProofQ(x, w) a Proofπ(x, w) jsou ∆1 v PA,
PrQ(x) a Prπ(x) jsou Σ1 v PA a Con(Q) a Con(π) jsou Π1 v PA.
Důkaz O formulích x | y, Prime(x) a Pair(z, t, w) jsme se již zmínili. Formule [Q](z)
je otevřená. Podívejme se na formuli RPrime(x, y):
Nechť x = 0 a nechť x | y · v. Dělme v se zbytkem (viz 4.1.4) číslem x:
v = x · u + v , v < x. Z x | y · (x · u + v ) plyne x | y · v dle 4.1.5(j).
312 4 Peanova a Robinsonova aritmetika
Věříme, že tento argument čtenář snadno doplní na důkaz, že formule RPrime(x, y)
je PA-ekvivalentní s formulí ∀v<x(x | y · v → v = 0), která je omezená v PA.
Formule x ∈ w začíná kvantiﬁkátory ∃z∃t. V PA můžeme říci, že splňují-li z a t podmínku
Pair(z, t, w), lze dle 4.2.2(b) místo ∃z∃t(. .) ekvivalentně psát ∃z≤w∃t≤w(. .).
V této situaci se říká, že kvantiﬁkátory se nám podařilo „omezit do w . Podobně
lze uvažovat u všech zbývajících formulí v (a): všechny v nich se vyskytující kvantiﬁkátory
lze omezit do w (nebo, v případě formulí Var(v) a UnivClo(z, y), do v či
do y).
Podívejme se nyní podrobně na formuli Term(x). Vraťme se k lemmatu 4.2.10(c).
V jeho důkazu jsme formuli Term(x) zapsali ve tvaru ∃w(α(x, w) & B(w, x, 1)).
Formuli α(x, w) jsme četli posloupnost w je počátečním úsekem charakteristické funkce
množiny všech aritmetických termů, jejíž délka je x + 1, nebo stručněji posloupnost w
je dosvědčující posloupností délky x + 1. Stejnou úvahou jako v předchozím odstavci
lze zdůvodnit, že α(x, w) je ∆0 v PA: všechny její kvantiﬁkátory lze omezit do w.
Tím je zdůvodněno, že formule Term(x) je Σ1 v PA. Podmínky (1) a (2) v důkazu
tvrzení 4.2.10(c) a tvrzení 4.2.6(a) dávají PA ∀x∃!wα(x, w). Z toho plyne, že
formule
∃w(α(x, w) & B(w, x, 1)) a ∀w(α(x, w) → B(w, x, 1))
jsou v PA ekvivalentní. Druhá z nich je Π1 v PA. Tím je dokončen důkaz, že
formule Term(x) je ∆1 v PA.
Podobně lze postupovat v případě formulí Fm, SubT, SubF, OccT, OccF a FreeSub.
Každou z nich lze ekvivalentně psát ve tvaru
∃w(β(v, z, t, y, w) & B(w, z, 1)) i ∀w(β(v, z, t, y, w) → B(w, z, 1)) (∗)
(s tím, že některé z proměnných y, v, t mohou chybět a z se v případě formule SubT
jmenuje x). Jediný rozdíl je v tom, že formule β může obsahovat již sestrojené
formule (například formuli Term), a lze o ní tedy tvrdit pouze, že je ∆1 v PA,
nikoliv, že je ∆0 v PA. I kdyby ale byla jen Σ1 v PA, z dvojího tvaru (∗) plyne, že
každá z formulí Fm, SubT atd. je ∆1 v PA.
Formule FmAt(z) a Numeral(x, y) jsou ekvivalentní s formulemi
∃x1 <z ∃x2 <z (Term(x1) & Term(x2) & (z = x1=x2 ∨
∨ z = x1<x2 ∨ z = x1≤x2 )),
Term(y) & (délka y je 3 · x + 1) & (y neobsahuje symboly + a ⋅).
Obě formule jsou ∆1(PA) podle 4.3.4(e). Stejně lze postupovat i v případě formulí
Sent(z), LogAx(z) a π(z). Je-li τ(z) ∈ ∆1(PA), pak také formule Proofτ (x, w) je
sestavena z ∆1-formulí jen pomocí logických spojek a omezených kvantiﬁkátorů
(přesněji kvantiﬁkátorů, které lze omezit do w), a je tedy ∆1 v PA.
Je-li τ jen Σ v PA, pak dle 4.3.4(f) je τ zároveň Σ1 v PA. Pak dále Proofτ je
Σ1 v PA podle 4.3.4(c) a Prτ je Σ1 v PA podle 4.3.4(d). V tom případě ano,
sentence Con(τ) je utvořena z formule Prτ (x) dosazením numerálu 0 = S(0) a negací,
a podle tvrzení 4.3.4(b) je to tedy Π1(PA)-formule. QED
4.3 Hierarchie aritmetických formulí 313
Umíme tedy klasiﬁkovat aritmetické formule podle jejich (aritmetické) složitosti,
známe nejzákladnější vlastnosti této klasiﬁkace a přesvědčili jsme se, že všechny
formule užité v minulém oddílu při aritmetizaci logické syntaxe mohou sice být
dlouhé, mají ale dost nízkou pozici v aritmetické hierarchii formulí. Vraťme se
nyní k otázce, jaké množiny jsou deﬁnovatelné ve struktuře N a jak složité jsou
formule, které je deﬁnují. Připomeňme, že aritmetická formule ϕ(x1, . . , xk) deﬁnuje
množinu A ⊆ Nk
, jestliže
A = { [n1, . . , nk] ; N |= ϕ(x)[n1, . . , nk] }.
Přitom podmínka N |= ϕ(x)[n1, . . , nk], jež říká, že ϕ je splněna ohodnocením proměnných,
které proměnným x1, . . , xk přiřazuje hodnoty n1, . . , nk, je ekvivalentní
s podmínkou N |= ϕ(n1, . . , nk), protože číslo ni je v N hodnotou termu ni.
Nechť Γ je množina formulí. Řekneme, že množina A ⊆ Nk
je Γ-deﬁnovatelná
v nějaké struktuře D, jestliže ji v D deﬁnuje některá formule z množiny Γ.
Věta 4.3.6 (a) Když A je ∆0-deﬁnovatelná v N, pak A je primitivně rekurzívní.
(b) Když A je Σ-deﬁnovatelná v N, pak A je rekurzívně spočetná.
Důkaz Nechť formule ϕ je například tvaru S(S(S(x · x))) ≤ x + y. Pak ϕ deﬁnuje
v N relaci {[n, m]; n2
+3 ≤ n+m}, která je PR. Toto je pravda o každé atomické
formuli. Každá totiž deﬁnuje v N množinu tvaru { [n1, . . , nk] ; f(n) R g(n) }, kde
R je rovnost, ostré uspořádání nebo neostré uspořádání a f a g jsou primitivně
rekurzívní funkce, protože jsou odvozeny ze sčítání, násobení a přičítání jedničky
pomocí operace substituce (skládání funkcí). Dále postupujeme indukcí podle počtu
kroků, kterými je ϕ utvořena z atomických formulí. Předpokládejme, že ϕ
je utvořena z jednodušší formule pomocí omezené kvantiﬁkace. Nechť například
ϕ(z, x1, . . , xr) je tvaru ∀v≤z ψ(v, z, x). Pak deﬁnuje-li ψ v N relaci B ⊆ Nr+2
,
formule ϕ deﬁnuje relaci { [m, n] ; ∀k≤mB(k, m, n) }. Ta je primitivně rekurzívní,
pokud B je primitivně rekurzívní, protože třída PR je uzavřena na (metamatematickou)
omezenou kvantiﬁkaci. Ostatní případy jsou také jasné, třída PR je uzavřena
i na booleovské operace.
V (b) postupujme indukcí podle počtu kroků, kterými je ϕ utvořena z ∆0-formulí.
Je-li tento počet nulový, pak formule ϕ deﬁnuje RS množinu vzhledem k (a) a inkluzi
PR ⊆ RS. Jinak je ϕ utvořena z nějaké Σ-formule ψ pomocí existenční nebo
omezené kvantiﬁkace, nebo je utvořena ze dvou Σ-formulí ψ1 a ψ2 pomocí konjunkce
nebo disjunkce. Pokud ψ či ψ1 a ψ2 deﬁnují rekurzívně spočetné podmínky
B resp. B1 a B2, pak ϕ deﬁnuje podmínku, která je z B resp. z B1 a B2 utvořena
pomocí existenční kvantiﬁkace (tj. projekce), omezené kvantiﬁkace, průniku nebo
sjednocení, což jsou operace, na které je třída RS uzavřena. QED
Zajímavá otázka — možná zajímavější, než by čtenář na první čtení řekl — zní,
zda tvrzení předchozí věty lze obrátit. Existují totiž celkem jednoduše deﬁnované
množiny, o kterých lze snadno dokázat, že jsou primitivně rekurzívní, ale dosud se
314 4 Peanova a Robinsonova aritmetika
nepodařilo zjistit, zda jsou ∆0-deﬁnovatelné v N. Příkladem takové množiny je
{ [n, m] ; prvočísel menších než n je m }.
Nicméně sama otázka, zda tvrzení (a) lze obrátit, není otevřeným problémem. Lze
dokázat, že odpověď je ne, existují PR množiny, které v N nejsou ∆0-deﬁnovatelné.
Naším bezprostředním cílem je dokázat, že v případě (b) platí ano, toto tvrzení lze
obrátit: každou RS množinu deﬁnuje v N nějaká Σ-formule. Důkaz rozdělíme do
několika kroků, z nichž hned první je podstatný.
Lemma 4.3.7 Graf každé primitivně rekurzívní funkce je Σ-deﬁnovatelný v N.
Důkaz Nechť je dána primitivně rekurzívní funkce f, která má r proměnných.
Tvrdíme, že k f existuje Σ-formule ϕ(x1, . . , xr, y), která deﬁnuje graf funkce f, tj.
splňuje podmínku
f(n1, . . , nr) = m ⇔ N |= ϕ(n1, . . , nr, m)
pro libovolnou (r + 1)-tici [n1, . . , nr, m]. Postupujme indukcí podle počtu kroků
v primitivně rekurzívním odvození funkce f. Je-li f jedna z funkcí s nebo z, volme
za ϕ(x, y) formuli S(x) = y resp. 0 = y. Je-li f projekce ir
j , volme za ϕ(x1, . . , xr, y)
formuli xj = y. Nechť f je odvozena z g a h primitivní rekurzí. Tedy pro všechna
n1, . . , nr a k jsou splněny podmínky
f(0, n1, . . , nr) = g(n), (1)
f(k + 1, n1, . . , nr) = h(f(k, n), k, n). (2)
Podle indukčního předpokladu k funkcím g a h existují Σ-formule ψ(x1, . . , xr, y)
a χ(z, v, x1, . . , xr, y), které v N deﬁnují jejich grafy:
g(n1, . . , nr) = m ⇔ N |= ψ(n, m), (3)
h(j, k, n1, . . , nr) = m ⇔ N |= χ(j, k, n, m). (4)
Zvolme za ϕ(v, x1, . . , xr, y) formuli
∃w(Seq(w) & Lh(w, v + 1) & B(w, v, y) &
& ∃t<w(B(w, 0, t) & ψ(x, t)) &
& ∀u<v∃z<w∃t<w(B(w, u, z) & B(w, u + 1, t) & χ(z, u, x, t))).
Z hlediska syntaktického je vše v pořádku: ϕ je sestavena ze Σ-formulí (a ∆0-formulí)
ψ, χ, Seq, Lh a B pomocí konjunkce, existenční kvantiﬁkace a omezené kvantiﬁkace.
Ověření, že ϕ deﬁnuje graf funkce f, je celkem přímočaré a asi by mohlo
být přenecháno čtenáři. Podstatnou část ale provedeme, a to hlavně proto, aby
bylo zřejmé, co z výsledků předchozího oddílu je k důkazu potřeba.
Máme ověřit, že pro každou volbu čísel m, k, n1, . . , nr platí
f(k, n1, . . , nr) = m ⇔ N |= ϕ(k, n, m). (5)
4.3 Hierarchie aritmetických formulí 315
Formule ϕ má tvar ∃wα(v, x, y, w). Předpokládejme, že N |= ϕ(k, n, m), tj. že
N |= ∃wα(k, n, m, w). Tedy N |= α(k, n, m, q) pro jisté číslo q ∈ N. Čísla m, k, n
a q tedy splňují podmínky
N |= Seq(q) & Lh(q, k + 1) & B(q, k, m), (6)
N |= ∃t<q(B(q, 0, t) & ψ(n, t)), (7)
N |= ∀u<k∃z<q∃t<q(B(q, u, z) & B(q, u + 1, t) & χ(z, u, n, t)). (8)
Z podmínky (6) díky lemmatu 4.2.7 plyne, že číslo q je (ve smyslu kódování z oddílu
4.2) kódem posloupnosti délky k + 1, jejímž k-tým členem je m. Označme
m0, . . , mk všechny členy posloupnosti q. Podmínku (7) lze přepsat na disjunkci
N |= j(B(q, 0, j) & ψ(n, j)). Přitom sentence B(q, 0, j) v N platí pro jediné j, a E
sice pro j = m0. Protože ψ deﬁnuje graf funkce g (viz (3)), sentence ψ(n, j) platí
v N rovněž pouze pro jediné j, a sice pro j = g(n). Tedy m0 = g(n). Podobně lze
z podmínky (8) a s užitím (4) usoudit, že pro každé i < k platí mi+1 = h(mi, i, n).
To vše dohromady a spolu s (1) a (2) znamená, že pro každé i ≤ k platí mi = f(i, n).
Pro i = k to spolu s mk = m dává m = f(k, n). Tím jsme ověřili implikaci ⇐ v (5).
Ověření implikace ⇒ je podobné, lemma 4.2.7 se použije opačným směrem. Všimněme
si také, že podobné úvahy jsme již prováděli v důkazech tvrzení 4.2.10(b)
a 4.2.11(a).
Poslední případ je ten, kdy f je odvozena z funkcí h, g1, . . , gk substitucí:
f(n1, . . , nr) = h(g1(n), . . , gk(n)).
Podle indukčního předpokladu existují Σ-formule χ(x1, . . , xk, y) a ψ1(x1, . . , xr, y)
až ψk(x1, . . , xr, y), které deﬁnují grafy funkcí h a g1, . . , gk v N. Vezměme za
ϕ(x1, . . , xr, y) formuli
∃v1 . . ∃vk(χ(v1, . . , vk, y) & ψ1(x, v1) & . . & ψk(x, vk)).
Je jasné, že ϕ je Σ-formule. Ověření, že ϕ deﬁnuje graf funkce f, přenecháváme
čtenáři. QED
Lemma 4.3.8 Každá primitivně rekurzívní množina je Σ-deﬁnovatelná v N.
Důkaz Nechť A ⊆ Nk
je PR. Podle předchozího lemmatu k charakteristické
funkci cA množiny A existuje Σ-formule ϕ(x1, . . , xk, y), která v N deﬁnuje její
graf:
∀m∀n1 . . ∀nk(cA(n1, . . , nk) = m ⇔ N |= ϕ(n1, . . , nk, m)).
Dosazení m := 1 dává
∀n1 . . ∀nk(cA(n1, . . , nk) = 1 ⇔ N |= ϕ(n1, . . , nk, 1)).
Tato ekvivalence znamená, že formule ϕ(x1, . . , xk, 1) deﬁnuje množinu A: platí
totiž cA(n1, . . , nk) = 1, právě když [n1, . . , nk] ∈ A. Formule ϕ(x1, . . , xk, 1) samozřejmě
je Σ-formulí. QED
316 4 Peanova a Robinsonova aritmetika
Věta 4.3.9 Nechť n ≥ 1. Pak
(a) Množina A ⊆ Nk
je Σn-množina (ve smyslu kapitoly 2), právě když A je
Σn-deﬁnovatelná v N.
(b) Množina A ⊆ Nk
je Πn-množina, právě když A je Πn-deﬁnovatelná v N.
(c) Množina A ⊆ Nk
je v některé třídě Σn nebo Πn, právě když je v N deﬁnovatelná
(libovolnou formulí).
Důkaz Nejprve dokažme, že (a) platí pro n = 1. Nechť A ⊆ Nk
a nechť A je
Σ1, tedy rekurzívně spočetná. Podle věty o projekci 2.2.25 existuje PR relace
B ⊆ Nk+1
taková, že A = { [n1, . . , nk] ; ∃mB(n1, . . , nk, m) }. K množině B podle
lemmatu 4.3.8 existuje Σ1-formule ψ(x1, . . , xk, z), která ji deﬁnuje v N. Pak ale formule
∃zψ(x1, . . , xk, z) je Σ-formule, která deﬁnuje množinu A v N. Podle 4.3.4(f)
formule ∃zψ(x1, . . , xk, z) je PA-ekvivalentní s jistou Σ1-formulí ϕ(x1, . . , xk). Je
jasné, že PA-ekvivalentní formule deﬁnují v N tutéž množinu. Množina A je tedy
Σ1-deﬁnovatelná v N.
Naopak, je-li A množina Σ1-deﬁnovatelná v N, pak A je rekurzívně spočetná podle
věty 4.3.6.
Předpokládejme, že Σn-množiny jsou právě ty, které jsou deﬁnovatelné Σn-formulemi.
Pak jejich komplementy, Πn-množiny, jsou právě ty, které jsou deﬁnovatelné
negacemi Σn-formulí. Ale negace Σn-formulí jsou PA-ekvivalentní s Πn-formulemi,
a tedy v N deﬁnují tytéž množiny jako Πn-formule. Tím je zdůvodněno, že tvrzení
(b) pro n plyne z tvrzení (a) pro totéž n.
Téměř stejně plyne tvrzení (a) pro n+1 z tvrzení (b) pro n, jen místo komplementu
a negaci se mluví o projekci a existenční kvantiﬁkaci.
Tvrzení (c) plyne z (a) a (b), dodat zbývá snad jen to, že dle (a)–(d) lemmatu 4.3.4
je každá aritmetická formule ekvivalentní s některou Σn-formulí a také s některou
Πn-formulí. QED
Označíme-li ΓN
množinu všech množin a relací deﬁnovatelných v N formulemi
z množiny formulí Γ, pak tvrzení (a) a (b) věty 4.3.9 můžeme přehledně zapsat
takto: ΣN
n = Σn, ΠN
n = Πn. Platí také ∆N
0 ⊆ PR ⊆ ΣN
= ΣN
1 = RS. Věta 4.3.9
má značný význam jak pro teoretickou informatiku, tak pro logiku. Význam pro
informatiku je v tom, že pojem rekurzívně spočetné množiny, a tím vlastně i pojem
algoritmu, má vzhledem k tvrzení (a) pro n = 1 také čistě logickou, „bezestrojovou
deﬁnici. To lze chápat jako argument pro názor, že pojem algoritmu je jedním
z absolutních pojmů, čili jako argument pro přijetí nebo přijatelnost Churchovy
teze. Důsledky věty 4.3.9 pro logiku se budeme zabývat za chvíli.
Máme-li obecnou větu o deﬁnovatelnosti rekurzívně spočetných množin, neznamená
to náhodou, že v oddílu 4.2 jsme se zbytečně dlouho zabývali jednotlivými
rekurzívně spočetnými (většinou primitivně rekurzívními) množinami a formulemi,
které ony množiny popisují? Snad ne. Na konci oddílu 4.2 jsme dosažené výsledky
rozdělili na tvrzení o platnosti numerických instancí a na tvrzení o dokazatelnosti
4.3 Hierarchie aritmetických formulí 317
obecných faktů v PA. Z výsledků o platnosti numerických instancí (tj. o deﬁnovatelnosti)
jsme k důkazu věty 4.3.9 potřebovali lemma 4.2.7, a tedy i řadu tvrzení
nutných k důkazu lemmatu 4.2.7 počínaje už tvrzením 4.1.5. Než jsme tedy
mohli dokázat obecné tvrzení, museli jsme dokázat přímo deﬁnovatelnost řady konkrétních
množin. Ostatní fakty o platnosti numerických instancí následující za
lemmatem 4.2.7 jsou do oddílu 4.2 zařazeny hlavně proto, abychom mohli dospět
k větě 4.2.13.
U tvrzení o dokazatelnosti obecných faktů v PA považujeme za užitečné zdůraznit,
že nijak neplynou z příslušných tvrzení o deﬁnovatelnosti. Co přesně máme na
mysli, ukažme na tvrzení množina všech prvočísel je nekonečná vyjádřeném sentencí
θ := ∀x∃y(x < y & Prime(y)). Víme-li, že formule Prime(y) deﬁnuje v N
množinu všech prvočísel, můžeme usoudit, že θ platí v N, a platí tedy i v každém
(nestandardním) modelu teorie Th(N). Je-li PA úplná, znamená to, že θ platí i
v každém modelu teorie PA. Už brzy ale uvidíme, že PA úplná není! Dokazatelnost
sentence θ v PA znamená, že θ platí v každém modelu M teorie PA bez ohledu na to,
zda M je zároveň modelem teorie Th(N). Stejně jako na sentenci θ je třeba se dívat
i na ostatní fakty o dokazatelnosti v PA, zejména na tvrzení z věty 4.2.14. V každém
modelu PA (tj. i v nestandardních a bez ohledu na mohutnost nosné množiny)
platí základní fakty o dokazatelnosti. V každém modelu teorie PA platí například
sentence ∀x∃y(x < y & π(y)), protože v PA víme, že PA je teorií s nekonečnou
množinou axiomů.
Všimněme si ještě, že z věty 4.3.9 plyne, že množina přirozených čísel je rekurzívní,
právě když je v N současně Σ1- i Π1-deﬁnovatelná. A dále si všimněme,
že ve větě 4.3.9 se nic netvrdí o případu n = 0, ani se tam nic netvrdí na téma,
jaké množiny deﬁnují v N formule, které jsou ∆n(PA). Je-li totiž nějaká množina
současně Σ1- i Π1-deﬁnovatelná, nemusí to ještě znamenat, že je deﬁnovatelná nějakou
∆1(PA)-formulí, neboť dvě formule deﬁnující tutéž množinu ještě nemusí být
PA-ekvivalentní.
Řekneme, že množina A ⊆ Nk
je aritmetická, je-li v N deﬁnovatelná (libovolnou
formulí). Věta 4.3.9(c) říká, že množina A je aritmetická, právě když A je v některé
z tříd Σn či Πn deﬁnovaných v kapitole 2. Tvrdit o nějaké množině, že není
aritmetická, tedy znamená tvrdit o ní mnohem víc, než že není rekurzívní nebo že
není rekurzívně spočetná.
Věta 4.3.10 Množina Th(N) není aritmetická.
Důkaz Předpokládejme, že Th(N) (tj. množina všech číselných kódů všech aritmetických
sentencí, které platí v N) je v některé z tříd Σn nebo Πn. Nechť
Th(N) ∈ Σn a n ≥ 1. Zvolme aritmetickou množinu A takovou, že A /∈ Σn.
Taková množina existuje podle tvrzení 2.2.39(c). Protože A je aritmetická, existuje
aritmetická formule ϕ(x), která množinu A deﬁnuje v N. Platí tedy
∀n(n ∈ A ⇔ N |= ϕ(n)). (1)
Označme f funkci n → ϕ(n), která z libovolného přirozeného čísla n vytvoří term n
a dosadí jej za x do ϕ. Funkce f zobrazuje množinu všech přirozených čísel do mno-
318 4 Peanova a Robinsonova aritmetika
žiny všech aritmetických sentencí. Protože formule ztotožňujeme s jejich číselnými
kódy, f je funkce z N do N. Několika způsoby lze zdůvodnit, že f je (primitivně)
rekurzívní funkce. Užitím funkce f můžeme podmínku (1) přepsat na
∀n(n ∈ A ⇔ f(n) ∈ Th(N)). (2)
Platí tedy A ≤m Th(N) via f. To je spor s 2.2.35(g) a s předpokladem, že množina
A není Σn.
Stručná rekapitulace důkazu zní takto: fakt, že každá Σn- i Πn-množina je deﬁnovatelná
v N, znamená, že každá aritmetická množina je m-převeditelná na Th(N).
Kdyby platilo Th(N) ∈ Σn, znamenalo by to kolaps aritmetické hierarchie. QED
Věta 4.3.11 Nechť T je rekurzívně axiomatizovatelná teorie s aritmetickým jazykem
a nechť N |= T. Pak T je neúplná.
Důkaz Množina Thm(T) všech sentencí dokazatelných v T je přinejhorším rekurzívně
spočetná (viz 3.6.6), tedy určitě aritmetická. Nemůže se tedy rovnat
množině Th(N), která aritmetická není. QED
Peanova aritmetika je rekurzívně axiomatizovatelná a platí N |= PA. Peanova
aritmetika je tedy neúplná. Věta 4.3.11 ale tvrdí víc: Peanovu aritmetiku
nelze zúplnit přidáním jednotlivých axiomů nebo schémat platných v N. Každým
takovým přidáním vznikne rekurzívně axiomatizovatelná, tedy neúplná teorie.
Větu 4.3.11 lze označit za jednu z variant První Gödelovy věty o neúplnosti. V dalších
oddílech dospějeme k dalším variantám a také zdůvodníme, že podobná tvrzení
platí i pro teorii množin a jiné teorie s dostatečně bohatým jazykem.
Na neúplnou teorii T jsme se dosud dívali nejspíš jako na polotovar, tj. jako na
úkol najít další vhodné axiomy, po jejichž přidání lze teorii T (možná) brát vážně.
První Gödelova věta nás nutí změnit pohled na neúplnost. Volíme-li teorii T,
kterou lze přijmout jako prostředí pro matematickou práci (svět matematiky), jsou
přirozené požadavky takové, aby T měla přehlednou množinu axiomů a aby měla
dostatečně bohatý jazyk. V tom případě je nutné hledat mezi neúplnými teoriemi.
Podíváme-li se znovu na otázky, které jsme položili v závěru oddílu 4.1, lze říci,
že věta 4.3.11 je zajímavou, možná překvapivou, ale pouze částečnou odpovědí na
první otázku. Peanova aritmetika není úplná a nelze ji zúplnit přidáním rekurzívní
množiny axiomů platných v N. Nevíme ale dosud, zda Peanovu aritmetiku nelze
zúplnit přidáním rekurzívní množiny nějakých axiomů. Také odpovědi na zbývající
otázky musíme ještě odložit.
Víme, že Peanova aritmetika je neúplná, nemáme ale po ruce žádný příklad
sentence nezávislé na PA. Tato situace by mohla svádět k prohlášení, že věta 4.3.11
je nekonstruktivní: tvrdí, že existuje jakýsi objekt, ale nepodává žádný návod
k jeho sestrojení. S takto kategorickou formulací ale nelze bezvýhradně souhlasit.
Podrobnější analýzou důkazu věty 4.3.11 by totiž bylo možné si nezávislou sentenci
opatřit. Opatrnější formulaci otázky po sentenci nezávislé na PA ale pokládáme za
oprávněnou:
4.3 Hierarchie aritmetických formulí 319
• Lze nezávislost na PA dokázat pro nějakou sentenci, která je zajímavá z matematického
hlediska?
To je řečeno trochu vágně, ale je asi jasné, co máme na mysli: ona sentence, kterou
bychom získali analýzou důkazu věty 4.3.11, by pravděpodobně byla dlouhá
a nenázorná. Kdežto sentence je matematicky zajímavá, pokud například vyjadřuje
tvrzení, kterým se již předtím někdo zabýval a pokoušel se je dokazovat nebo
vyvracet. Jiná, ale také oprávněná otázka zní:
• Pro které nejmenší n existuje Σn-sentence nezávislá na PA?
Nejmenší n takové, že v Σn existuje nezávislá sentence, je ovšem zároveň nejmenším
n takovým, že v Πn existuje nezávislá sentence, protože negace nezávislé Σn-sentence
je nezávislou Πn-sentencí a naopak. Následující věta dává částečnou odpověď
na předchozí otázku. V příštím oddílu zjistíme, že vlastně jde o úplnou odpověď,
neboť níže už jít nelze, ∆0-sentence nezávislé na Peanově aritmetice neexistují.
Věta 4.3.12 Nechť T je rekurzívně axiomatizovatelná teorie s aritmetickým jazykem
a nechť N |= T. Pak existují Σ1- a Π1-sentence nezávislé na T.
Důkaz Postupujme podobně jako v důkazu věty 4.3.11. Fakt, že každá Π1-množina
A je Π1-deﬁnovatelná, znamená, že A ≤m Π1 ∩ Th(N) pro každou A ∈ Π1.
Platí tedy Π1 ∩ Th(N) /∈ Σ1. Z předpokladu o rekurzívní axiomatizovatelnosti
teorie T plyne Π1 ∩ Thm(T) ∈ Σ1. Tedy Π1 ∩ Thm(T) = Π1 ∩ Th(N). Protože
ale N je model teorie T, platí alespoň inkluze ⊆. Můžeme tedy vzít Π1-sentenci θ
takovou, že θ ∈ Th(N) − Thm(T). Sentence θ je Π1-sentence nezávislá na T a její
negace ¬θ je T-ekvivalentní se Σ1-sentencí nezávislou na T. QED
Cvičení
1. Představte si modiﬁkaci deﬁnice omezené formule, ve které se připouštějí i kvantiﬁkátory
tvaru ∀v<t(x), ∀v≤t(x), ∃v<t(x), ∃v≤t(x), v nichž jako mez může
vystupovat libovolný aritmetický term t(x1, . . , xk) s podmínkou, že neobsahuje
kvantiﬁkovanou proměnnou (tj. v). Dokažte, že každá formule omezená v tomto
smyslu je ekvivalentní s nějakou omezenou formulí ve smyslu deﬁnice 4.3.1.
Návod. Například formule tvaru ∃v≤t(x) · s(x)ϕ je ekvivalentní s formulí
(t(x) = 0 & ϕv(0)) ∨ ∃v1 ≤s(x)∃v2 <t(x)ϕv(t(x) · v1 + v2), pokud proměnné
v1 a v2 zvolíme tak, aby se nevyskytovaly v termech t a s a ani se nevyskytovaly
volně ve ϕ.
2. Nechť T je teorie. Nechť ϕ(x) ∈ ∆n(T), kde n ≥ 1, a nechť ψ(x, y) je Σn(T)-formule
taková, že T ∀x∃!yψ(x, y). Dokažte, že formule ∃y(ψ(x, y) & ϕ(y)) je
∆n v T. Dokažte, že také formule ψ je ∆n v T.
Návod. Pište formuli ψ ve tvaru ∃vθ(x, y, v), kde θ ∈ Πn−1(T), a zdůvodněte,
že ψ je ekvivalentní s formulí ∀v∀y (θ(x, y , v) → y = y ).
320 4 Peanova a Robinsonova aritmetika
3. Věta 4.3.12 říká, že existuje ∆0-formule δ(v) taková, že sentence ∀vδ(v) platí
v N, ale není dokazatelná v PA. Zdůvodněte, že žádné dvě ze tří formulíE
Prime(x), Prime(x) & ∀v≤x¬δ(v), Prime(x) ∨ ∃v≤xδ(v)
nejsou PA-ekvivalentní, všechny tři ale deﬁnují v N tutéž množinu.
4. Teorie I∆0 má (stejně jako všechny ostatní teorie deﬁnované ve zbývajících
cvičeních tohoto oddílu) aritmetický jazyk, axiomy Q1–Q9 a ∀x(x < S(x)) a
dále všechny sentence tvaru Ind(ϕ), kde ϕ ∈ ∆0. Axiomatika teorie I∆0 je
tedy podobná axiomatice Peanovy aritmetiky; hlavní rozdíl je, že schéma indukce
je nahrazeno schématem omezené indukce. Dokažte, že všechny sentence
z věty 4.1.1 jsou dokazatelné v I∆0.
Návod. Při důkazu poslední sentence v (a) užijte omezenou indukci na formuli
∃u≤y(u + x = y) ∨ ∃u≤x(u + y = x). Ostatní důkazy projdou beze změny.
Poznamenejme, že teorie I∆0 je nebo v nedávné době byla předmětem intenzívního
výzkumu. Je například otevřeným problémem, zda v I∆0 lze dokázat,
že existuje nekonečně mnoho prvočísel. Není také známo, zda I∆0 je konečně
axiomatizovatelná.
5. Nechť B(ϕ) označuje instanci schématu kolekce utvořenou z formule ϕ, viz
lemma 4.3.3. Teorie BΓ, kde Γ je Σn nebo Πn, má aritmetický jazyk a jejími
axiomy jsou všechny axiomy teorie I∆0 a navíc všechny sentence B(ϕ),
kde ϕ ∈ Γ. Teorie BΓ má tedy kromě axiomů Q1–Q9 dvě axiomatická schémata,
schéma indukce pro omezené formule a schéma kolekce pro Γ-formule.
Analyzujte důkaz lemmatu 4.3.4 a dokažte následující tvrzení.
(a) Je-li m ≤ n + 1, pak každá formule utvořená ze Σm- nebo Πm-formule
omezenou kvantiﬁkací je BΠn-ekvivalentní se Σm- resp. s Πm-formulí. Jinými
slovy, množiny Σm(BΠn) i Πm(BΠn) jsou uzavřeny na omezenou kvantiﬁkaci.
(b) Je-li m ≤ n + 2, pak množiny Σm(BΠn) i Πm(BΠn) jsou uzavřeny na konjunkci
a disjunkci.
(c) Je-li 0 < m ≤ n + 2, pak množina Σm(BΠn) je uzavřena na existenční
kvantiﬁkaci a množina Πm(BΠn) je uzavřena na univerzální kvantiﬁkaci.
(d) BΠn a BΣn+1 jsou ekvivalentní teorie.
6. Teorie IΓ, kde Γ je Σn nebo Πn, má aritmetický jazyk, axiomy Q1–Q9 a schéma
indukce pro Γ-formule. Teorie IΣ0, IΠ0 a I∆0 jsou tedy totožné. Dokažte, že
pro každé n platí, že BΠn je podteorie teorie IΣn+1, tj. že v IΣn+1 lze dokázat
všechny instance schématu kolekce utvořené z Πn-formulí.
Návod. Uvažujte v IΣn+1 za předpokladu ∀u<x∃wϕ(u, v, y), kde ϕ ∈ Πn.
Označte ψ formuli z ≤ x → ∃w∀u<z ∃v<wϕ(u, v, y), zdůvodněte, že ψ je
v Σn+1(IΣn+1), a užijte indukci dle z.
7. Dokažte, že IΣn a IΠn jsou ekvivalentní teorie.
4.3 Hierarchie aritmetických formulí 321
Návod. Uvažujte za předpokladů ϕ(0, y), ∀v(ϕ(v, y) → ϕ(S(v), y)) a ¬ϕ(x, y).
Indukcí dle z dokažte ∀z¬ϕ(x ·− z, y) a pak zvolte z := x. Podrobněji, předpokládejte,
že ϕ ∈ Σn, kde n ≥ 2, a že usuzujete v IΠn. Označte ψ(z, x, y)
formuli ∀u(z+u = x → ¬ϕ(u, y)). Dokažte, že ψ je v Πn(IΠn). Přitom můžete
předpokládat IΣn−1, tedy BΠn−2, tudíž uzavřenost množiny Πn(IΠn) na univerzální
kvantiﬁkátory. Pak dokažte ∀zψ(z, x, y) indukcí dle z (tj. Πn-indukcí).
Je-li ϕ ∈ Πn a usuzujete-li v IΣn, užijte formuli ∃x(z + u = x & ¬ϕ(u, y)).
Domyslete i případy n < 2.
8. Dokažte, že pro každé n platí, že IΣn je podteorie teorie BΠn.
Návod. Indukcí podle k dokažte, že v BΠn lze dokázat schéma indukce pro
Σk-formule. Nechť 0 < k ≤ n a ϕ(u, z, y) ∈ Πn−1. Uvažujte v BΠn za předpokladů
∃zϕ(0, z, y), ∀v(∃zϕ(v, z, y) → ∃zϕ(S(v), z, y)) a ¬∃zϕ(x, z, y). Zvolte
za ψ formuli ϕ(u, v, y) ∨ (¬∃zϕ(u, z, y) & v = 0). Formule ψ je v Πn(BΠn) a
platí ∀u≤x∃vψ(u, v, y). Axiom B(ψ) dává ∃w∀u≤x∃v<wψ(u, v, y). Pak podmínky
∃zϕ(v, z, y) a ∃z<wϕ(v, z, y) jsou pro v ≤ x ekvivalentní. To znamená,
že formule ∃z<wϕ(v, z, y) porušuje Πk−1-indukci.
9. Teorie LΓ, kde Γ je Σn nebo Πn, je teorie s aritmetickým jazykem, jejíž axiomy
jsou Q1–Q9, ∀x(x < S(x)), a dále všechny instance schématu LNP utvořené
z Γ-formulí. Dokažte, že každá z teorií LΣn i LΠn je ekvivalentní s teorií IΣn.
Poznamenejme, že teoriím I(Γ), B(Γ) a L(Γ), kde Γ je Σn nebo Πn a n ≥ 1, se
obvykle říká silné fragmenty Peanovy aritmetiky. Za základní zdroj informace
o těchto teoriích lze považovat článek [64]. V tomto a v předchozích cvičeních
jsme zdůvodnili následující vztahy mezi silnými fragmenty Peanovy aritmetiky
a teoriemi I∆0, BΠ0 a PA:
I∆0 ⇐ . . . ⇐ IΣn ⇐ BΠn ⇐ IΣn+1 ⇐ . . . ⇐ PA
BΣn+1 IΠn+1
LΣn+1
LΠn+1.
10. Nechť M je model Peanovy aritmetiky. Neprázdná množina I ⊆ M je řez,
jestliže je uzavřená na funkci S a na relaci ≤, tj. jestliže ∀a(a ∈ I ⇒ S(a) ∈ I)
a ∀a∀b(a ≤ b & b ∈ I → a ∈ I). Řez I je segment, je-li navíc uzavřen na
sčítání a na násobení. Například množina všech standardních prvků modelu M
je segment. Rozmyslete si, že je-li a nestandardní prvek modelu M, pak množina
a + N, tj. množina I = { b ∈ M ; ∃n ∈ N(b ≤ a + n) }, je řez. Není to ale
segment, protože a ∈ I a a + a /∈ I. Deﬁnujte analogicky množiny a · N a aN
.
Zdůvodněte, že obě jsou řezy, první není segment, druhá je segment.
322 4 Peanova a Robinsonova aritmetika
11. Když M |= PA a I ⊆ M je segment, pak ∆0-formule jsou absolutní pro segment
I chápaný jako podstruktura struktury M. Jinými slovy, segment I je
∆0-elementární podstruktura struktury M. Dokažte.
12. Užijte předchozí cvičení k důkazu, že když M |= PA a I ⊆ M je segment,
pak I |= I∆0.
13. Dokažte, že za stejných předpokladů platí dokonce I |= BΠ0.
14. Nechť M |= PA, nechť b ∈ M je nestandardní prvek modelu M, nechť a ∈ M je
dělitelný všemi d ≤ b a nechť c ∈ M je dělitelný všemi prvky tvaru 1+(d+1)a,
kde d ≤ b. Zdůvodněte využitím cvičení 7 oddílu 4.2, že (v M) pro každé přirozené
n platí an
< c. Vyvoďte z toho, že c není prvek segmentu aN
. Zdůvodněte,
že sentence ∀x∀z∃t∀v≤x(1 + (v + 1) · z | t) a ∀x∃w∀v(v ∈ w ≡ v < x) nejsou
dokazatelné v teorii I∆0 (ani v teorii BΠ0).
4.4 Σ-úplnost Robinsonovy aritmetiky
V oddílu 4.1 jsme viděli, že Robinsonova aritmetika je slabou teorií, ve které nelze
dokázat ani některá dost běžná tvrzení o přirozených číslech. Příkladem takového
tvrzení je komutativita sčítání vyjádřená sentencí ∀x∀y(x + y = y + x).
Není-li jisté, že sčítání je komutativní, znamená to snad, že například 3 + 2
by pro Robinsonovu aritmetiku mohlo být něco jiného než 2 + 3? Uvidíme, že ne.
V modelech Robinsonovy aritmetiky, které se vyskytly v oddílu 4.1 (včetně cvičení),
vždy platilo 3 + 2 = 2 + 3. Ukážeme, že je to zákonité. Robinsonova aritmetika
ví, že 3 + 2 = 2 + 3, protože ví, že 3 + 2 i 2 + 3 je rovno číslu 5. Prvky, které
v nějakém modelu Robinsonovy aritmetiky porušují komutativitu sčítání, musí být
nestandardní. Dále v tomto oddílu uvidíme, že tvrzení o dokazatelnosti sentence
3 + 2 = 2 + 3 lze zobecnit: každá sentence platná v N je dokazatelná v Q za
předpokladu, že je syntakticky jednoduchá.
Při našich úvahách rozhodně neopouštíme Peanovu aritmetiku. U řady výsledků
bude důležité, že platí pro mnohé teorie (včetně Peanovy aritmetiky) vzniklé přidáním
axiomů k Robinsonově aritmetice. A u některých tvrzení, která dokážeme o
dokazatelnosti v Robinsonově aritmetice, bude také důležité, že jsou formalizovatelná
v Peanově aritmetice.
Věta 4.4.1 Sentence
(a) n = m, ¬(n ≤ m) a ¬(n < m)
jsou dokazatelné v Q za předpokladu, že platí v N, tj. za předpokladu, že n = m,
n > m resp. že n ≥ m. Sentence
(b) n + m = n + m, (d) ∀x(x ≤ n → x = 0 ∨ . . ∨ x = n),
(c) n · m = n · m, (e) ∀x(x ≤ n ∨ n ≤ x)
jsou v Q dokazatelné pro každou volbu čísel n a m.
4.4 Σ-úplnost Robinsonovy aritmetiky 323
Důkaz U všech sentencí uvedených ve znění věty je důležité si uvědomit, že pro
každou volbu čísel n a m máme právo napsat jiný důkaz v Q. Ukažme si důkaz
sentence v (b) například pro n = 4, m = 3:
Axiom Q5 dává 4 + S(3)
(0) = S(4 + S(S(0))). Ještě dvojnásobným užitím
axiomu Q5 dostaneme 4+S(3)
(0) = S(3)
(4+0). Podle Q4 platí 4+0 = 4, tedy
opravdu 4 + S(3)
(0) = S(3)
(4).
Nyní uvažme, že S(3)
(0) je jen jiné označení pro term 3 a S(3)
(4) je jen jiné označení
pro term 7. Podobný důkaz sentence n + m = n + m lze napsat pro každou dvojici
čísel n a m. Axiom Q5 se v něm použije m-krát. Mohli bychom také říci, že
existence důkazu se dokazuje metamatematickou indukcí podle m.
Existenci důkazu sentence v (d) dokažme rovněž indukcí podle n. Nechť důkaz
pro n je již sestrojen:
. . .
Tedy opravdu ∀x(x ≤ n → x = 0 ∨ . . ∨ x = n). (dn)
Jeho následujícím prodloužením dostaneme důkaz pro n + 1:
Nechť x je dáno, nechť x ≤ n + 1. Platí x = 0 nebo x = 0.
Když x = 0, jsme hotovi.
Jinak je dle Q3 x následníkem nějakého y: x = S(y). Předpoklad x ≤ n + 1
znamená existenci v takového, že v + x = n + 1. Tedy v + S(y) = n + 1. Dále
platí S(v + y) = n + 1 (dle Q5) a v + y = n (dle Q1). Tedy y ≤ n. Z již
dokázané formule (dn) plyne y = 0 ∨ . . ∨ y = n. Tedy pro x = S(y) platí
x = 1 ∨ . . ∨ x = n + 1.
Tedy opravdu ∀x(x ≤ n + 1 → x = 0 ∨ . . ∨ x = n + 1). (dn+1)
Podívejme se ještě na (e). Opět předpokládejme, že důkaz pro n je již sestrojen, a
napišme důkaz pro n + 1.
Nechť x je dáno. Dle již dokázané formule platí x ≤ n nebo n ≤ x.
Nechť x ≤ n. Podle (d) je x rovno jednomu z čísel 0, 1, . . , n. Každé z nich je
menší nebo rovno číslu n + 1. Tedy x ≤ n + 1.
Nechť naopak n ≤ x. Tedy u + n = x pro jisté u. Je-li u = 0, máme n = x
a x ≤ n + 1. Jinak u = S(v) pro jisté v. Pokud na rovnost S(v) + n = x
užijeme n-krát axiom Q5, pak dvakrát axiom Q2 a pak (n + 1)-krát axiom Q5
opačným směrem, dostaneme v + n + 1 = x. Tedy n + 1 ≤ x.
Důkaz formule v (d) a v (e) pro n = 0 a důkazy formulí v (a) a (c) přenecháváme
čtenáři. QED
Některé kroky v důkazu předchozí věty jsou dost závislé na přesné formulaci
axiomů Robinsonovy aritmetiky. Tvrzení (e) by se nepodařilo dokázat, kdybychom
v axiomech Q8 a Q9 zaměnili pořadí sčítanců.
324 4 Peanova a Robinsonova aritmetika
Věta 4.4.2 (Σ-úplnost Robinsonovy aritmetiky) Je-li σ ∈ Σ sentence taková,
že N |= σ, pak Q σ.
Mělo by být zřejmé, že oba předpoklady věty, tj. že σ ∈ Σ a σ je sentence,
jsou podstatné. Slovo „úplnost v označení věty je užito neformálně ve významu
podobném jako v obratu „úplnost kalkulu : v Q lze dokázat všechny Σ-sentence,
které mají být dokazatelné (protože jsou pravdivé). Důkaz věty 4.4.2 rozdělíme do
několika lemmat.
Lemma 4.4.3 Nechť t je uzavřený term a nechť m je jeho hodnota v N. Pak
Q t = m.
Důkaz indukcí podle složitosti termu t. Term t buď sestává z jediného symbolu 0,
nebo je utvořen z jednodušších termů pomocí některého ze symbolů +, · a S. Předpokládejme,
že t má tvar (t1 + t2). Pak t1 a t2 jsou opět uzavřené termy. Vezměme
jejich hodnoty m1 a m2 v N. Indukční předpoklad dává Q t1 = m1 a Q t2 = m2.
Dle Tarského podmínky T2, hodnotou termu t je číslo m1 +m2. Z toho a z 4.4.1(b)
plyne Q t1 + t2 = m1 + m2. Ostatní případy jsou podobné. QED
Lemma 4.4.4 Nechť σ je atomická sentence. Pokud N |= σ, pak Q σ, a pokud
N /|= σ, pak Q ¬σ.
Důkaz Sentence σ musí mít jeden z tvarů t1 = t2 nebo t1 < t2 nebo t1 ≤ t2, kde
t1 a t2 jsou uzavřené termy. Vezměme hodnoty m1 a m2 termů t1 a t2 v N. Platí
N |= t1 = m1 a N |= t2 = m2. Předpokládejme, že sentence σ má tvar t1 ≤ t2,
ostatní dva případy jsou podobné. Lemma 4.4.3 dává Q t1 = m1 a Q t2 = m2.
Když N |= t1 ≤ t2, pak N |= m1 ≤ m2, tedy m1 ≤ m2 a lze vzít k takové, že
k + m1 = m2. Z předpokladů t1 = m1, t2 = m2 a k + m1 = m2 (viz 4.4.1(b)) lze
v Q dokázat t1 ≤ t2 (viz Q8).
Když N /|= t1 ≤ t2, pak N /|= m1 ≤ m2, a tedy m1 > m2. Z předpokladů t1 = m1,
t2 = m2 a ¬(m1 ≤ m2) (viz tvrzení 4.4.1(a)) lze v Q dokázat ¬(t1 ≤ t2). QED
Lemma 4.4.5 Nechť ϕ(x1, . . , xr) je ∆0-formule a nechť n1, . . , nr jsou přirozená
čísla. Pokud N |= ϕ(n1, . . , nr), pak Q ϕ(n1, . . , nr), a pokud N /|= ϕ(n1, . . , nr),
pak Q ¬ϕ(n1, . . , nr).
Důkaz Dokazujeme indukcí podle počtu logických spojek a omezených kvantiﬁkátorů
ve formuli ϕ, že tvrzení platí pro každé dosazení numerálů za volné proměnné
formule ϕ.
Je-li ϕ(x1, . . , xr) atomická, pak ϕ(n1, . . , nr) je atomická sentence a tvrzení platí
díky lemmatu 4.4.4.
Nechť formule ϕ(x1, . . , xr) je tvaru ϕ1(x) & ϕ2(x). Označme ψ1 a ψ2 sentence
ϕ1(n1, . . , nr) a ϕ2(n1, . . , nr). Pak ϕ(n1, . . , nr) je ψ1 &ψ2. Když N |= ϕ(n1, . . , nr),
pak N |= ψ1 a N |= ψ2. Dle indukčního předpokladu platí Q ψ1 a Q ψ2. Pak
4.4 Σ-úplnost Robinsonovy aritmetiky 325
ovšem Q ψ1 & ψ2. Když N /|= ϕ(n1, . . , nr), pak N /|= ψ1 nebo N /|= ψ2. Dle
indukčního předpokladu platí Q ¬ψ1 nebo Q ¬ψ2. V obou případech máme
Q ¬(ψ1 & ψ2), protože obě sentence ¬ψ1 → ¬(ψ1 & ψ2) a ¬ψ2 → ¬(ψ1 & ψ2) jsou
tautologie, a jsou tedy dokazatelné v Q.
Nechť ϕ(x1, . . , xr) je tvaru ¬ϕ1(x1, . . , xr). Označme ψ sentenci ϕ1(n1, . . , nr).
Pak ϕ(n1, . . , nr) je ¬ψ. Když N |= ϕ(n1, . . , nr), pak N /|= ψ. Dle indukčního
předpokladu Q ¬ψ. Když N /|= ϕ(n1, . . , nr), pak N |= ψ, Q ψ a Q ¬¬ψ.
Přitom ¬¬ψ je ¬ϕ(n1, . . , nr).
Nechť ϕ(x1, . . , xr) je tvaru ∀v≤xj ϕ1(v, x1, . . , xr), kde 1 ≤ j ≤ k. Označme
ψ(v) formuli ϕ1(v, n1, . . , nr). Pak ϕ(n1, . . , nr) je sentence ∀v≤nj ψ(v). Pišme m
místo nj. Když N |= ϕ(n1, . . , nr), pak N |= ∀v≤mψ(v) a v N platí všechny sentence
ψ(0), . . , ψ(m). Indukční předpoklad pro ϕ1 říká, že každá sentence vzniklá
z ϕ1 dosazením numerálů je dokazatelná v Q, pokud ovšem platí v N. Všechny sentence
ψ(0), . . , ψ(m) jsou tedy dokazatelné v Q. Z předpokladů ψ(0), . . , ψ(m) lze
v Q dokázat ∀v≤mψ(v) díky 4.4.1(d). Úvaha týkající se případu N /|= ϕ(n1, . . , nr)
je podobná.
Úvahy týkající se ostatních omezených kvantiﬁkátorů a případů, kdy ϕ(x1, . . , xr)
je utvořena z jednodušších formulí pomocí disjunkce nebo implikace, jsou rovněž
analogické a přenecháváme je čtenáři. QED
Lemma 4.4.6 Nechť ϕ(x1, . . , xr) je Σ-formule a nechť n1, . . , nr jsou přirozená
čísla. Když N |= ϕ(n1, . . , nr), pak Q ϕ(n1, . . , nr).
Důkaz Podobně jako v 4.4.5 dokazujeme indukcí podle počtu kroků, kterými je
formule ϕ utvořena z ∆0-formulí, že tvrzení platí pro každé dosazení numerálů za
její proměnné x1, . . , xr. Je-li počet oněch kroků nulový, pak ϕ je ∆0-formule a
tvrzení pro ni platí díky lemmatu 4.4.5.
V důkazu lemmatu 4.4.5 je důležité si všimnout, že v kroku týkajícím se negace a
implikace (což jsou kroky, které nyní v úvahu nepřipadají) se při důkazu pozitivního
případu (když |=, pak ) použije indukční předpoklad pro negativní případ (když /|=,
pak ¬). Ale v krocích týkajících se konjunkce, disjunkce a omezené kvantiﬁkace
se při důkazu pozitivního případu vystačí s indukčním předpokladem rovněž pro
pozitivní případ. To znamená, že je-li ϕ utvořena z jednodušších Σ-formulí pomocí
konjunkce, disjunkce nebo omezené kvantiﬁkace, lze postupovat úplně stejně jako
v důkazu lemmatu 4.4.5.
Nechť ϕ(x1, . . , xr) je tvaru ∃vϕ1(v, x1, . . , xr) a nechť N |= ϕ(n1, . . , nr). Platí tedy
N |= ϕ1(m, n1, . . , nr) pro jisté m. Indukční předpoklad dává Q ϕ1(m, n1, . . , nr).
Z předpokladu ϕ1(m, n1, . . , nr) lze v Q dokázat ∃vϕ1(v, n1, . . , nr). QED
Tím je dokázána věta 4.4.2, tj. věta o Σ-úplnosti Robinsonovy aritmetiky: v lemmatu
4.4.6 stačí volit r = 0 a dostaneme tvrzení pro sentence.
V závěru důkazu lemmatu 4.4.6 stojí ještě za povšimnutí, že kvantiﬁkátory se
v nyní uvažovaném kontextu nechovají „duálně . Když některá instance ϕ(m) formule
ϕ(x) je dokazatelná, znamená to i dokazatelnost sentence ∃xϕ(x), jsou-li však
326 4 Peanova a Robinsonova aritmetika
všechny instance ϕ(m) formule ϕ(x) dokazatelné, nemusí to znamenat dokazatelnost
sentence ∀xϕ(x).
Na konci oddílu 4.2 jsme poznamenali, že tehdy dosažené výsledky o formulích,
jako je Sent(x) nebo LogAx(x), popisujících syntaktické pojmy, lze většinou
rozdělit na výsledky o dokazatelnosti obecných faktů v PA a na výsledky o platnosti
numerických instancí v N. Nyní víme více i o dokazatelnosti numerických
instancí. Je-li ϕ sentencí, pak podle 4.2.11(a) platí N |= Sent(ϕ). Σ-úplnost (plus
fakt, že Thm(Q) ⊆ Thm(PA)) dává PA Sent(ϕ), protože Sent(x) je Σ-formule,
viz 4.3.5. Ze stejného důvodu, je-li ϕ axiomem Peanovy aritmetiky, platí N |= π(ϕ)
a PA π(ϕ). Je-li m důkazem formule ϕ v PA, pak (viz 4.2.12) Q Proofπ(ϕ, m). A
je-li ϕ dokazatelná v Q nebo v PA, pak (viz 4.2.13) PA PrQ(ϕ) resp. PA Prπ(ϕ).
Formule Proofπ, PrQ a Prπ jsou totiž všechny v Σ. Ukažme si, že z toho v podstatě
plyne odpověď na jednu z otázek ze závěru oddílu 4.2. Nechť τ(z) deﬁnuje množinu
axiomů nějaké teorie T v N, a nechť navíc τ(z) ∈ Σ. Domluvme se, že tento případ
(kdy τ(z) ∈ Σ) nás zajímá především. Pak podmínky T ϕ a PA Prτ (ϕ) jsou
ekvivalentní: o implikaci ⇐ jsme se již zmínili v závěru oddílu 4.2, implikace ⇒
je 4.2.13, plus Thm(Q) ⊆ Thm(PA), plus Σ-úplnost. Peanova aritmetika může o
všech formulích ϕ dokazatelných v nějaké teorii T tvrdit, že jsou dokazatelné, pokud
jí množinu axiomů teorie T popíšeme nějakou Σ-formulí. A popsat množinu axiomů
teorie T nějakou Σ-formulí lze právě tehdy, je-li T rekurzívně axiomatizovatelná.
Věta o Σ-úplnosti nám umožňuje tvrdit něco i o dokazatelnosti negovaných
numerických instancí. Není-li ϕ například logickým axiomem, pak N |= ¬LogAx(ϕ)
podle 4.2.11(a). V tom případě platí PA ¬LogAx(ϕ), neboť formule ¬LogAx(x)
je Σ(PA)-formule, viz 4.3.5(b). Podobně není-li m důkazem formule ϕ v PA, pak
PA ¬Proofπ(ϕ, m) dle 4.3.5(e). To ale nedává odpověď na otázku, jaký je vztah
mezi podmínkami PA ϕ a PA ¬Prπ(ϕ). O formuli ¬Prπ(x) jsme totiž nikdy
netvrdili, že je v Σ(PA). Pomohla by nám „věta o Π1-úplnosti , viz 4.3.5(e), tu ale
nemáme, a z věty 4.3.12 víme, že určitě neplatí.
V následující větě 4.4.8 zobecníme větu 4.3.12 ve dvou směrech. Jednak Σ-úplnost
nám umožní dokázat nerozhodnutelnost příslušné teorie. A dále si uvědomíme,
že není nutné, aby teorie T měla aritmetický jazyk. Má-li alespoň aritmetický jazyk,
tj. má-li nějaký jazyk L, v němž je všech šest symbolů aritmetického jazyka, pak
každá aritmetická formule je zároveň formulí jazyka L, a o aritmetických sentencích
dokazatelných v T můžeme říkat totéž, co jsme říkali dosud.
Deﬁnice 4.4.7 Nechť T je teorie s alespoň aritmetickým jazykem. Řekneme, že
T je korektní, jestliže každá aritmetická sentence dokazatelná v T platí v N. Řekneme,
že T je Σ-korektní, jestliže každá aritmetická Σ-sentence dokazatelná v T
platí v N.
Je zřejmé, že PA obsahuje Q, teorie PA i Q jsou korektní, každá korektní teorie
je Σ-korektní a každá Σ-korektní teorie je bezesporná. Připomeňme, že teorie
T obsahuje teorii S, jestliže platí inkluze L(S) ⊆ L(T) pro jejich jazyky a
inkluze Thm(S) ⊆ Thm(T) pro množiny všech dokazatelných sentencí.
4.4 Σ-úplnost Robinsonovy aritmetiky 327
Věta 4.4.8 Nechť T je rekurzívně axiomatizovatelná teorie, která obsahuje Robinsonovu
aritmetiku a je Σ-korektní. Pak T je nerozhodnutelná a neúplná. Existují
dokonce Σ1- a Π1-sentence nezávislé na T.
Důkaz Postupujme podobně jako v důkazech vět 4.3.10 a 4.3.12. Nechť A ⊆ N
je rekurzívně spočetná množina. Díky tvrzení 4.3.9(a) existuje Σ1-formule ϕ(x),
která deﬁnuje množinu A v N:
∀n(n ∈ A ⇔ N |= ϕ(n)). (1)
Podmínka N |= ϕ(n) je ekvivalentní s T ϕ(n): jestliže N |= ϕ(n), pak Q ϕ(n)
vzhledem k Σ-úplnosti a T ϕ(n) díky předpokladu, že T obsahuje Q, a naopak
jestliže T ϕ(n), pak N |= ϕ(n) díky předpokladu, že T je Σ-korektní. Ekvivalenci
(1) tedy můžeme přepsat na
∀n(n ∈ A ⇔ T ϕ(n)). (2)
Podmínka (2) znamená A ≤m Thm(T) prostřednictvím funkce n → ϕ(n). Toto
platí pro každou rekurzívně spočetnou množinu A. Každá A ∈ RE je tedy převedi- E
telná na množinu Thm(T). Z věty 3.6.6 víme, že Thm(T) je rekurzívně spočetná.
Množina Thm(T) je tedy Σ1-kompletní, a tedy nerekurzívní. Teorie T je nerozhod-
nutelná.
Existence nezávislých Σ1- a Π1-sentencí plyne z (důkazu) věty 4.3.12. Ukažme
si ale ještě jiné zdůvodnění. Vraťme se k ekvivalenci (2) a mysleme si, že rekurzívně
spočetná množina A byla zvolena pevně a že je nerekurzívní. Označme Y
množinu { n ; T ¬ϕ(n) }. Z (2) plyne A ∩ Y = ∅, jinak by T byla sporná.
Množina Y je rekurzívně spočetná, a to například proto, že je prostřednictvím
funkce n → ¬ϕ(n) převeditelná na množinu Thm(T). Platí-li A ∪ Y = N, pak
podle Postovy věty 2.2.27 množiny A i Y jsou rekurzívní. To ale nejsou, o A předpokládáme,
že je nerekurzívní. Tedy A ∪ Y = N, takže můžeme zvolit n0 /∈ A ∪ Y .
Podmínka n0 /∈ Y znamená T ¬ϕ(n0) a podmínka n0 /∈ A znamená T ϕ(n0)
vzhledem k (2). Tedy ϕ(n0) je nezávislá Σ1-sentence a ¬ϕ(n0) je T-ekvivalentní
s nezávislou Π1-sentencí. QED
Nechť T je rekurzívně axiomatizovatelná teorie s aritmetickým jazykem a nechť
platí N |= T. Utvořme teorii (T + Q), tj. přidejme k T axiomy Robinsonovy aritmetiky.
Dostaneme teorii, která splňuje předpoklady věty 4.4.8, a je tedy neúplná.
Je-li (T +Q) neúplná, pak ovšem i T je neúplná. Tím je zdůvodněno, že věta 4.4.8 je
zesílením věty 4.3.12. Větu 4.4.8 také považujme za jednu z variant První Gödelovy
věty o neúplnosti.
Když θ je ∆0-sentence, pak θ i ¬θ jsou Σ-sentence a ta z nich, která platí v N,
je podle věty o Σ-úplnosti dokazatelná už v Q. Tato úvaha doplňuje naši dřívější
odpověď (danou větou 4.3.12) na otázku ze závěru oddílu 4.3, pro které nejmenší n
existují Σn-sentence nezávislé na PA. Nezávislé Σ1- a Π1-sentence existují, nezávislé
∆0-sentence neexistují. A Peanova aritmetika se v tomto ohledu nijak neliší od
Robinsonovy aritmetiky.
328 4 Peanova a Robinsonova aritmetika
Pozastavme se ještě u důkazu věty 4.4.8. Formule ϕ(x) je Σ1, lze ji tedy psát
ve tvaru ∃vλ(x, v), kde λ ∈ ∆0. Víme, že sentenci ∀v¬λ(n0, v) nelze dokázat v T.
Z ekvivalencí (1) a (2) plyne, že sentence ∀v¬λ(n0, v) platí v N (kdyby ne, byla by
sentence ∃vλ(n, v) protipříkladem na větu o Σ-úplnosti). V N tedy platí i všechny
sentence tvaru ¬λ(n0, k). Každá z těchto sentencí je ∆0, a je tedy dokazatelná
v T. Existuje tedy ∆0-formule θ(v) taková, že všechny instance tvaru θ(k) jsou
dokazatelné v T, ale ∀vθ(v) nikoliv. Pro Robinsonovu aritmetiku jsme to věděli,
tam stačilo za θ(v) volit například formuli 0 + v = v. Fakt, že taková ∆0-formule
existuje pro každou „rozumnou teorii T, se může zdát překvapivý. Domníváme se
ale, že je přirozený. Platí-li všechny instance θ(0), θ(1), θ(2), . . . ve struktuře N,
je správné usoudit, že v N platí i sentence ∀vθ(v). Ale máme-li nekonečně mnoho
různých důkazů, jeden pro každou sentenci θ(k), nemusí to znamenat, že z nich
lze utvořit jeden společný důkaz sentence ∀vθ(v). Podobná situace se vyskytuje
i v teoretické informatice: máme-li pro každé n program, který počítá nějakou
funkci gn : N → N, nemusí to znamenat existenci společného programu, který
počítá funkci [n, x] → gn(x).
Z věty 4.4.8 můžeme usoudit něco i o rozhodnutelnosti predikátové logiky.
Věta 4.4.9 Množina všech formulí v jazyce aritmetiky, které jsou logicky platné,
je algoritmicky nerozhodnutelná.
Důkaz Robinsonova aritmetika je podle věty 4.4.8 nerozhodnutelnou teorií. Odstraníme-li
z nerozhodnutelné teorie konečně mnoho axiomů, dostaneme opět nerozhodnutelnou
teorii, viz větu 3.6.10. Robinsonova aritmetika je konečně axiomatizovatelná,
můžeme tedy odstranit všechny. Formule v aritmetickém jazyce
dokazatelné v teorii bez vlastních axiomů jsou podle věty o úplnosti predikátového
kalkulu přesně ty, které jsou logicky platné. QED
O Peanově aritmetice víme, že existuje Π1-sentence ψ, kterou v PA nelze dokázat
ani vyvrátit. Tedy (PA + ψ) i (PA + ¬ψ) jsou bezesporné teorie. Jen jedna
z nich je korektní, a lze dokonce říci která. Kdyby totiž v N platila sentence ¬ψ,
musela by být dokazatelná, protože je to Σ(Q)-sentence, a ψ by tudíž nemohla být
nezávislá na PA. Takže (PA + ψ) je korektní teorie a podle věty 4.4.8 je neúplná
a nerozhodnutelná. Teorie (PA + ¬ψ) není Σ-korektní, a věta 4.4.8 se na ni tudíž
nevztahuje. Nyní uvidíme, že větu 4.4.8 lze zobecnit i na nekorektní teorie, a tím
deﬁnitivně odpovíme na první dvě otázky ze závěru oddílu 4.1. Žádné přidání rekurzívní
množiny axiomů k PA nebo ke Q nedá úplnou teorii, a to bez ohledu na
to, zda přidané axiomy platí v N. Žádné přidání rekurzívní množiny axiomů ke Q
nedá rozhodnutelnou teorii, ledaže bychom porušili bezespornost.
Lemma 4.4.10 Nechť A ⊆ N a B ⊆ N jsou disjunktní rekurzívně spočetné množiny.
Pak existuje formule ϕ(x) ∈ Σ1 taková, že Q ϕ(n), kdykoliv n ∈ A,
a Q ¬ϕ(n), kdykoliv n ∈ B.
4.4 Σ-úplnost Robinsonovy aritmetiky 329
Důkaz Dle tvrzení 4.3.9(a) množiny A a B jsou Σ1-deﬁnovatelné v N. Existují
tedy ∆0-formule θ(x, v) a λ(x, v) takové, že formule ∃vθ(x, v) deﬁnuje množinu A
a formule ∃vλ(x, v) deﬁnuje množinu B:
∀n(n ∈ A ⇔ N |= ∃vθ(n, v)), (1)
∀n(n ∈ B ⇔ N |= ∃vλ(n, v)). (2)
Označme ϕ(x) formuli ∃v(θ(x, v) & ∀u≤v¬λ(x, u)). Formule θ(x, v) a λ(x, v) lze
číst číslo v je svědek pro náležení čísla x do množiny A resp. do množiny B. V tom
případě formule ϕ(x) říká náležení čísla x do A se dosvědčí dříve než náležení do B.
Evidentně platí ϕ ∈ Σ1. Ověříme, že formule ϕ má i ostatní požadované vlastnosti.
Předpokládejme n ∈ A. Pak n /∈ B, protože A a B jsou disjunktní množiny. V tom
případě z podmínek (1) a (2) plyne N |= ϕ(n). Dále Σ-úplnost dává Q ϕ(n).
Zbývá dokázat implikaci n ∈ B ⇒ Q ¬ϕ(n). Nechť tedy n ∈ B. Díky podmínce
(2) existuje m takové, že N |= λ(n, m). Σ-úplnost dává
Q λ(n, m). (3)
Protože množiny A a B jsou disjunktní, máme n /∈ A, tedy N |= ∀v¬θ(n, v). Tudíž
pro každé k platí N |= ¬θ(n, k), a opětovné užití Σ-úplnosti dává
∀k(Q ¬θ(n, k)). (4)
Chceme v Q dokázat sentenci ¬ϕ(n), tj. sentenci ∀v(θ(n, v) → ∃u≤vλ(n, u)). Postupujme
takto:
Nechť v je dáno a nechť θ(n, v). Platí v ≤ m nebo m ≤ v, viz 4.4.1(e).
Případ v ≤ m je ale vyloučen. Když totiž v ≤ m, pak dle 4.4.1(d) je v jedno
z čísel 0, 1, . . , m a pro každé z těchto v platí ¬θ(n, v), viz (4).
Takže m ≤ v. V tom případě existuje číslo u ≤ v, totiž m, pro které platí
λ(n, u), viz (3).
QED
Připomeňme, že Ref(T) označuje množinu { ϕ ; ϕ je sentence a T ¬ϕ }, tj.
množinu všech sentencí vyvratitelných v T.
Věta 4.4.11 (Rosserova) Nechť T je rekurzívně axiomatizovatelná teorie, která
obsahuje Robinsonovu aritmetiku a je bezesporná. Pak existují Σ1- a Π1-sentence
nezávislé na T. Každá z množin Thm(T) a Ref(T) je Σ1-kompletní. Teorie T je
tedy neúplná a nerozhodnutelná.
Důkaz Díky větě 2.2.47 můžeme zvolit disjunktní rekurzívně spočetné množiny
A a B přirozených čísel takové, že každá rekurzívně spočetná nadmnožina jedné
z nich disjunktní s druhou je Σ1-kompletní. Podle lemmatu 4.4.10 k množinám
330 4 Peanova a Robinsonova aritmetika
A a B existuje Σ1-formule ϕ(x) taková, že Q ϕ(n) pro všechna n ∈ A a Q ¬ϕ(n)
pro všechna n ∈ B. Protože teorie T obsahuje Robinsonovu aritmetiku, máme
∀n(n ∈ A ⇒ T ϕ(n)), (1)
∀n(n ∈ B ⇒ T ¬ϕ(n)). (2)
Opačné implikace netvrdíme, k tomu bychom potřebovali Σ-korektnost. Položme
X = { n ; T ϕ(n) } a Y = { n ; T ¬ϕ(n) }. Jako v důkazu věty 4.4.8 rekurzívní
axiomatizovatelnost teorie T dává X ∈ RS a Y ∈ RS. Navíc množiny X a Y jsou
disjunktní, jinak by T byla sporná. Podmínky (1) a (2) dávají A ⊆ X a B ⊆ Y .
Kdyby platilo N = X ∪ Y , podle Postovy věty by množina X byla rekurzívní. To
není možné, rekurzívní nadmnožiny množiny A disjunktní s B neexistují. Platí
tedy N = X ∪ Y , takže existuje n0 /∈ X ∪ Y . Pak ϕ(n0) je nezávislá Σ1-sentence,
¬ϕ(n0) je nezávislá Π1(T)-sentence, a T je tedy neúplná.
Platí X ≤m Thm(T) via n → ϕ(n) a Y ≤m Ref(T) via n → ¬ϕ(n). Množiny
Thm(T) a Ref(T) jsou rekurzívně spočetné. Je jasné, že rekurzívně spočetná množina,
na kterou je převeditelná Σ1-kompletní množina, je také Σ1-kompletní (viz
poznámku za příkladem 2.2.32). Tedy Thm(T) a Ref(T) jsou Σ1-kompletní množiny.
QED
Větu 4.4.11 lze označit jako Rosserovu verzi První Gödelovy věty o neúplnosti.
Rosserovi se připisuje nápad, na kterém je založena konstrukce formule ϕ(x) v důkazu
věty 4.4.11: mluvit o tom, zda svědek pro náležení čísla x do množiny A je
menší nebo větší než svědek pro náležení x do množiny B, a nespoléhat se na fakt,
že obojí najednou dosvědčit nelze. Podmínka „A a B jsou disjunktní totiž není Σ
a jako taková je uvnitř teorie T nejistá, přestože ve skutečnosti platí. Rosserova metoda
„porovnávání svědků umožnila zobecnit První Gödelovu větu i na nekorektní
teorie.
Nerozhodnutelnost (některé aritmetiky nebo predikátové logiky) se někdy cituje
jako Churchova věta. Základními odkazy jsou [42] a [41]. Metoda důkazu věty 4.4.9,
přes větu 3.6.10, také patří Churchovi. Důkazy vět 4.4.8 a 4.4.11, které jsme uvedli,
jsou v podstatě převzaty z rukopisu C. Smory´nského [83].
Tvrzení věty 4.4.11 o nerozhodnutelnosti lze přeformulovat pomocí pojmu podstatně
nerozhodnutelná teorie.
Deﬁnice 4.4.12 Teorie T je podstatně nerozhodnutelná, jestliže T je bezesporná
a každá bezesporná teorie S obsahující T je nerozhodnutelná.
Věta 4.4.13 Robinsonova aritmetika Q je podstatně nerozhodnutelná.
Je-li f rekurzívní funkce jedné proměnné, pak její graf je rekurzívně spočetná
množina, a existuje tedy Σ1-formule ϕ(x, y), která jej deﬁnuje v N. Tedy v N
platí sentence ϕ(n, m), právě když m = f(n). Z toho plyne N |= ∀x∃!yϕ(x, y).
Díky Σ-úplnosti víme, že N |= ϕ(n, m), právě když Q ϕ(n, m). Takže je-li m
funkční hodnotou v bodě n, uvnitř Q víme, že m je funkční hodnotou v bodě n.
4.4 Σ-úplnost Robinsonovy aritmetiky 331
Uvnitř Q ale nevíme, že každé číslo má jednoznačně určenou funkční hodnotu,
protože ∀x∃!yϕ(x, y) není Σ-sentence. Ale formule ϕ(x, y) není funkcí f jednoznačně
určena. Je více způsobů, jak Robinsonově (nebo Peanově) aritmetice popsat
funkci f. V následující větě ukážeme, že popis funkce f aritmetickou Σ1-formulí
lze zvolit tak, aby uvnitř Q bylo jisté, že alespoň standardní čísla mají jednoznačně
určenou funkční hodnotu. Jinými slovy, formuli ϕ deﬁnující graf funkce f lze zvolit
tak, aby všechny sentence tvaru ∃!yϕ(n, y) byly dokazatelné. Dokazatelnost
sentence ∀x∃!yϕ(x, y) zaručit nelze, ale bez té se obejdeme.
Větu 4.4.14 uvádíme zde, protože důkaz je snazší, máme-li v paměti větu 4.4.1
a důkaz Rosserovy věty 4.4.11. Použijeme ji ale až v následujícím oddílu, v důkazu
věty o autoreferenci. V důkazu věty 4.4.14 se stejně jako v důkazu věty 4.4.11 a na
rozdíl od důkazů vět 4.4.2 a 4.4.8 uplatní tvrzení (e) věty 4.4.1.
Věta 4.4.14 (Reprezentovatelnost funkcí v Q) Pro každou obecně rekurzívní
funkci f existuje Σ1-formule ϕ(x, y) taková, že pro každé n platí
Q ∀y ϕ(n, y) ≡ y = f(n) . (∗)
Důkaz Graf funkce f je rekurzívně spočetná množina. Existuje tedy ∆0-formule
θ(x, y, v) taková, že formule ∃vθ(x, y, v) jej deﬁnuje v N. Tedy ekvivalence
m = f(n) ⇔ N |= ∃vθ(n, m, v) (1)
platí pro libovolnou dvojici čísel m a n. Formuli θ(x, y, v) lze číst číslo v svědčí pro
fakt, že y je funkční hodnota funkce f v bodě x. Na metamatematické úrovni má
každé n jednoznačně určenou funkční hodnotu f(n). Uvnitř Robinsonovy aritmetiky
ale není zaručeno, že ke každému x existuje y, pro které lze dosvědčit, že je
funkční hodnotou v bodě x, a není ani vyloučena existence vzájemně si protiřečících
svědků. Naším úkolem je nově deﬁnovat význam „svědectví tak, aby alespoň standardní
čísla 0, 1, 2, . . . měla jednoznačně určenou funkční hodnotu, a to stejnou
jako ve skutečnosti. To uděláme následovně. Označme ϕ(x, y) formuli
∃w(y ≤ w & ∃v≤wθ(x, y, v) & ∀z≤w∀v≤w(θ(x, z, v) → z = y)).
Číslu w ve formuli ϕ říkejme „svědek v novém smyslu . Číslo w svědčí pro y v novém
smyslu, jestliže mezi čísly nepřevyšujícími w jsou y i svědkové pro y ve starém
smyslu, ale nejsou tam vzájemně si protiřečící svědkové. Ověříme, že formule ϕ má
požadovanou vlastnost.
Nechť n0 je pevné. Označme m0 = f(n0) a zvolme pevně číslo k0, pro které platí
N |= θ(n0, m0, k0). To lze díky podmínce (1). Z toho a ze Σ-úplnosti plyne
Q θ(n0, m0, k0), (2)
Q ¬θ(n0, m, k), je-li m = m0 a k libovolné. (3)
Netvrdíme ovšem nic o dokazatelnosti sentence ∀v¬θ(n0, m, v), ta není Σ. Označme
r = max{m0, k0}. Platí Q m0 ≤ r a Q k0 ≤ r. Dále platí
Q ∀z≤r∀v≤r(θ(n0, z, v) → z = m0). (4)
332 4 Peanova a Robinsonova aritmetika
To plyne z (3), neboť uvnitř Q víme, že každé z ≤ r i v ≤ r je rovno některému
z čísel 0, 1, . . , r, viz 4.4.1(d). Uvažujme v Q:
Máme m0 ≤ r. Z (2) a z k0 ≤ r plyne ∃v≤rθ(n0, m0, v). To dohromady
s podmínkou (4) dává ϕ(n0, m0). Tím je ověřena implikace ← v podmínce ∗.
Nechť naopak y je takové, že ϕ(n0, y). Máme tedy w, které splňuje podmínky
(i) y ≤ w, (ii) ∃v≤wθ(n0, y, v) a (iii) ∀z≤w∀v≤w(θ(n0, z, v) → z = y).
Platí w ≤ r nebo r ≤ w.
Když w ≤ r, pak podmínka (ii) a podmínka (4) užitá na z := y dávají y = m0.
Přitom jsme implikaci t ≤ w ≤ r → t ≤ r, jejíž důkaz ponecháváme za cvičení,
použili na t := v a na t := y.
Když r ≤ w, pak podmínka (iii) užitá na z := m0 a v := k0 dávají m0 = y.
Přitom jsme implikaci t ≤ r ≤ w → t ≤ w, jejíž důkaz také ponecháváme za
cvičení, použili na t := m0 a na t := k0.
QED
Mělo by být jasné (cvičení), že splňuje-li formule ϕ(x, y) podmínku (∗), pak ϕ
deﬁnuje graf funkce f v N a všechny sentence tvaru ∃!yϕ(n0, y) jsou dokazatelné
v Q.
Vyslovme větu o Σ-úplnosti tak, abychom zakryli, že je v ní řeč o standardním
modelu Peanovy aritmetiky: když Σ-sentence σ (ve skutečnosti) platí, pak σ
je dokazatelná v Q. Tato formulace naznačuje, jak máme větu o Σ-úplnosti formalizovat
v aritmetickém jazyce: pomocí implikace σ → PrQ(σ). Platí-li Q σ,
pak sentence σ → PrQ(σ) je dokazatelná v PA (dokonce už v Q) díky tomu, že je
dokazatelný její závěr PrQ(σ). Platí-li Q ¬σ, pak sentence σ → PrQ(σ) je ovšem
také dokazatelná. Věta o formalizované Σ-úplnosti tvrdí, že implikace σ → PrQ(σ)
je v PA dokazatelná vždy, tj. i v případech, kdy σ je nezávislá Σ-sentence.
Důkaz věty o formalizované Σ-úplnosti lze získat „přeříkáním důkazu věty
o Σ-úplnosti, který jsme uvedli, uvnitř PA. A u toho bychom případně mohli
skončit. Ale neskončíme, důkazem se budeme dost podrobně zabývat. Chceme
totiž upozornit na některé potíže a na některé zajímavé aspekty. Naším cílem není
podat kompletní důkaz. To by opravdu znamenalo rozsáhlé části lemmat 4.4.3–4.4.6
pouze přepsat s užitím bezpatkového písma.
Věta o Σ-úplnosti tvrdí něco pro všechny Σ-sentence σ. V důkazu se postupuje
indukcí podle počtu logických spojek a kvantiﬁkátorů v sentenci σ. Potíž s tím,
že některé podformule sentencí nejsou sentence, jsme překonali tak, jak je vidět ve
znění lemmat 4.4.5 a 4.4.6: indukcí podle složitosti se pro každou formuli dokazuje
tvrzení o jejích numerických instancích.
Naprosto stejně postupujeme uvnitř PA při formalizaci důkazu věty o Σ-úplnosti.
V PA tedy budeme mluvit o formálních numerálech, tj. o číslech y splňujících
podmínku Numeral(x, y) vůči libovolnému číslu x. Číslo x je zde opět vhodné
představit si jako (standardní nebo nestandardní) prvek nějakého modelu Peanovy
aritmetiky.
4.4 Σ-úplnost Robinsonovy aritmetiky 333
Nechť ψ je nějaká aritmetická formule s jednou volnou proměnnou u. Prohlédněme
si následující formuli:
∃y∃z(Numeral(x, y) & SubF(u, ψ, y, z) & PrQ(z)). (∗)
Již jsme si zvykli, že formule ψ je jak syntaktický objekt, tak přirozené číslo, a nepřekvapuje
nás výskyt numerálu ψ v jakékoliv formuli. Σ-úplnost spolu s 4.2.11(a)
dávají PA Fm(ψ). Uvnitř PA tedy o čísle ψ víme, že je formulí. Také proměnná
u je syntaktický objekt, skládá se ze symbolu v následovaného zápisem přirozeného
čísla. Uvnitř PA tedy víme také Var(u), neboli víme, že číslo u je proměnná.
Uvnitř PA dále víme, že za u do ψ můžeme substituovat libovolný substituovatelný
term, například ono y, pro které platí Numeral(x, y). Výsledkem takové substituce
je sentence z, o které je řeč v (∗). Podmínku (∗) tedy čteme sentence vzniklá z ψ
dosazením x-tého numerálu je dokazatelná v Q a z metamatematického hlediska je
to formule s jednou volnou proměnnou x. Nic nebrání, aby proměnné x a u byly
totožné. Mysleme si tedy, že jediná volná proměnná formule ψ je x. Pak formule
∃y∃z(Numeral(x, y) & SubF(x, ψ, y, z) & PrQ(z)) (∗∗)
opět říká, že sentence vzniklá z ψ dosazením x-tého numerálu za jedinou volnou proměnnou
je dokazatelná v Q. Ve formuli (∗∗) hraje „x dvojí úlohu. Z metamatematického
hlediska je x proměnná volná ve formulích (∗∗) a ψ. Uvnitř PA je řeč
o libovolném (standardním nebo nestandardním) přirozeném čísle x (tomu odpovídají
volné výskyty proměnné x ve formuli (∗∗)) a dále o syntaktickém objektu x,
který se objeví při syntaktické analýze formule ψ.
Ztotožnění proměnných u a x značně zvyšuje nároky na představivost, ale umožňuje
také následující úmluvu. Místo (∗∗) pišme
PrQ( ψ( ˙x) ).
Volných proměnných ve formuli ψ může být i více. Zápis
PrQ( ϕ( ˙x1, . . , ˙xr) )
čteme sentence vzniklá dosazením x1-tého až xr-tého numerálu za volné proměnné
formule ϕ je dokazatelná v Q a rozumí se, že formule ϕ nemá jiné volné proměnné
než x1, . . , xr. Výraz ϕ( ˙x1, . . , ˙xr) s uvozujícími „růžky a s tečkami nad proměnnými
tedy v aritmetickém jazyce označuje formální sentenci (číslo, které může
být standardní nebo nestandardní), která vznikla z formule ϕ dosazením formálních
numerálů. Formální numerály lze ovšem dosadit do libovolné formule. Protože
ale vystačíme s dosazováním do skutečných (standardních) formulí, v zápisech
tvaru . . ϕ( ˙x) . . nepíšeme pruh nad formulí, do které se dosazuje. Také v zápisech
tvaru ¬(v10=S( ˙x)) , v nichž jsou jednotlivé symboly vyznačeny strojopisným
písmem, vynecháváme pruhy (a levé apostrofy); o tom jsme se domluvili již dříve.
Uvažujme o formalizaci jednotlivých tvrzení z věty 4.4.1. Označme α formuli
¬(0 = S(x)) a posuďme následující úvahu uvnitř PA:
334 4 Peanova a Robinsonova aritmetika
Číslo ∀xα je axiomem Robinsonovy aritmetiky. Číslo ∀xα#(∀xα→α(˙v))#α(˙v)
je tedy důkazem v Q, protože je kódem posloupnosti tvaru z1#z2#z3 , přičemž
platí [Q](z1), LogAx(z2) a formule z3 je ze z1 a z2 odvozena pravidlem MP.
Napsali jsme důkaz formule PrQ( ¬(0=S(˙v)) ). Tedy
PA ∀vPrQ( ¬(0=S(˙v)) ). (1)
Mezi mnoha „triviálními fakty o syntaktických objektech , o kterých je řeč ve
větě 4.2.11(b), by mohly být i
PA ∀x∀z(Numeral(v + 1, z) ≡ z = S(˙v) ), (2)
PA ∀z(Numeral(0, z) ≡ z = 0 ), (3)
neboť (v PA) je jasné, že (v + 1)-tý numerál je jediným způsobem utvořen z v-tého
pomocí dvou závorek a symbolu S, a je také jasné, co je nultý numerál. Pokračujme
v úvahách uvnitř PA:
Nechť y = 0. Vezměme v takové, že v + 1 = y. Z (2) víme, že S(˙v) je y-tý
numerál. Vzhledem k (1) je formule ¬(0= ˙y) dokazatelná v Q.
Tím jsme dospěli k mezivýsledku
PA ∀y(0 < y → PrQ( ¬(0= ˙y) )). (4)
Nechť tentokrát α(z, u) označuje formuli ¬(z = u) → ¬(S(z) = S(u)) a nechť
dále β(z) označuje formuli ∀uα(z, u) a γ označuje sentenci ∀zβ(z). Sentence γ je
dokazatelná v Q. Vezměme některý její důkaz a označme jej m. V PA ovšem víme,
že m je důkaz v Q sentence γ, tj. sentence ∀z∀uα(z, u). Uvažujme v PA dále, a to
za předpokladu ∀y(x < y → PrQ( ¬( ˙x= ˙y) )):
Nechť je dáno y takové, že x + 1 < y. Vezměme v takové, že v + 1 = y.
Platí x < v. Dle předpokladu existuje w, které je důkazem sentence ¬( ˙x=˙v) .
Vezměme posloupnosti m, (γ→β( ˙x)) , β( ˙x) , (β( ˙x)→α( ˙x, ˙v)) , α( ˙x, ˙v) , w
a ¬(S( ˙x)=S(˙v)) a spojme je do jedné užitím šesti znaků #. Dostaneme důkaz
v Q sentence ¬(S( ˙x)=S(˙v)) , tj. sentence ¬(S(x)= ˙y) .
Tím jsme provedli indukční krok. Podmínky (4) a (3) se týkají případu x = 0.
Výsledkem je PA ∀x∀y(x < y → PrQ( ¬( ˙x= ˙y) )). Z toho dále plyne
PA ∀x∀y(x = y → PrQ( ¬( ˙x= ˙y) )), (5)
a tím je řečeno, že první ze tří tvrzení v 4.4.1(a) je formalizovatelné v PA. Podobnými
úvahami lze dospět i k formalizaci zbývajících tvrzení v (a)–(e). Z formalizace
tvrzení (b) a (c) dále plyne
PA ∀x1 . . ∀xr∀y(t(x1, . . , xr) = y → PrQ( t( ˙x1, . . , ˙xr)= ˙y )) (6)
4.4 Σ-úplnost Robinsonovy aritmetiky 335
pro každý aritmetický term t(x1, . . , xr). Tím jsme se přesvědčili, že lemma 4.4.3
je formalizovatelné v PA.
V dosavadním textu se obvykle pohybujeme na dvou úrovních, dokazujeme,
že něco je nebo není dokazatelné. Nyní máme co dělat se třemi úrovněmi. Podmínka
(6) se dokazuje metamatematickou indukcí podle složitosti termu t. Přitom
se užije podmínka (5) a několik podobných podmínek. Podmínku (5) jsme dokázali
indukcí v PA podle x. A všechny formule, se kterými pracujeme, mluví o
dokazatelnosti v Q, kde žádnou indukci nemáme a nepoužíváme.
K dokončení důkazu věty o formalizované Σ-úplnosti se musíme ještě v PA
zabývat lemmaty 4.4.5 a 4.4.6 a postupně dokázat, že
PA ∀x1 . . ∀xr(ϕ(x1, . . , xr) → PrQ( ϕ( ˙x1, . . , ˙xr) )) (7)
platí pro každou ∆0-formuli ϕ resp. pro každou Σ-formuli ϕ. Zmíníme se již pouze
o univerzálním omezeném kvantiﬁkátoru; nejprve si ale rozmyslíme ještě jedno pomocné
tvrzení.
Označme γ(y) formuli ∀v(v ≤ S(y) → v ≤ y ∨ v = S(y)). Lze ověřit, že
Q γ(0), (8)
Q ∀y(γ(y) → γ(S(y))). (9)
Netvrdíme Q ∀yγ(y). Ukážeme ale, že (8) a (9) stačí k důkazu, že
PA ∀xPrQ( γ( ˙x) ). (10)
Označme α(y) formuli γ(y) → γ(S(y)) a zvolme m, které je důkazem sentence ∀yα
v Q. Jako v důkazu podmínky (5), v PA víme ProofQ(∀yα, m). Dokážeme podmínku
(10) indukcí podle x:
Pro x = 0 podmínka (10) platí vzhledem k (8), protože 0 je nultý numerál,
viz (3).
Nechť podmínka (10) platí pro x. Máme tedy číslo w, které je důkazem sentence
γ( ˙x) . Spojíme-li dohromady posloupnosti (∀yα→(γ( ˙x)→γ(S( ˙x)))) , m,
(γ( ˙x)→γ(S( ˙x))) , w a γ(S( ˙x)) užitím čtyř znaků #, dostaneme důkaz sentence
γ(S( ˙x)) .
Tím jsme připraveni k úvaze o omezeném kvantiﬁkátoru. Předpokládejme, že pro
formuli ψ jsme již příslušné tvrzení dokázali, a zabývejme se formulí ∀v≤xψ. Je-li
proměnná x mezi volnými proměnnými formule ψ, můžeme ji dočasně přejmenovat
na řekněme z a pak za z dosadit x. Z tohoto důvodu lze předpokládat, že x nemá
volné výskyty ve formuli ψ. Máme tedy formuli ψ(v, y1, . . , yr), pro kterou jsme již
dokázali
PA ∀v∀y(ψ(v, y) → PrQ( ψ(˙v, ˙y1, . . , ˙yr) )), (11)
a uvažujme formuli ∀v≤xψ(v, y). Podmínku
PA ∀x(∀v≤xψ(v, y) → PrQ( ∀v≤ ˙xψ(v, ˙y1, . . , ˙yr) )) (12)
dokážeme opět indukcí podle x. Indukční krok vypadá takto:
336 4 Peanova a Robinsonova aritmetika
Nechť ∀v≤S(x)ψ(v, y). Tedy ∀v≤xψ(v, y) a ψ(S(x), y). Vzhledem k indukčnímu
předpokladu existuje důkaz w1 sentence ∀v≤ ˙xψ(v, ˙y1, . . , ˙yr) . Vzhledem
k (11) máme důkaz w2 sentence ψ(S( ˙x), ˙y1, . . , ˙yr) . Z důkazů w1 a w2 a
z důkazu sentence ∀v(v≤S( ˙x)→v≤ ˙x∨v=S( ˙x)) , viz (10), lze sestavit důkaz sentence
∀v≤S( ˙x)ψ(v, ˙y1, . . , ˙yr) .
Tím máme podmínky (12) a (7), a tím všechno, za dokázané:
Věta 4.4.15 (formalizovaná Σ-úplnost) Implikace σ→PrQ(σ) je v PA dokazatelná
pro každou Σ-sentenci σ. Pro každou Σ-formuli σ(x1, . . , xr) lze v PA dokázat
sentenci ∀x(σ(x) → PrQ( σ( ˙x1, . . , ˙xr) )).
Věta 4.4.16 (podmínky pro dokazatelnost) Nechť T je rekurzívně axiomatizovatelná
teorie obsahující Robinsonovu aritmetiku a nechť τ(z) je Σ-deﬁnice množiny
axiomů teorie T v N. Pak pro libovolnou aritmetickou sentenci ϕ resp. pro
libovolné dvě aritmetické sentence ϕ a ψ platí
D1: když T ϕ, pak PA Prτ (ϕ),
D2: PA Prτ (ϕ) & Prτ (ϕ → ψ) → Prτ (ψ),
D3: PA Prτ (ϕ) → Prτ (Prτ (ϕ)).
Důkaz Nechť T ϕ. Podle 4.2.13(a) formule Prτ (x) deﬁnuje v N množinu všech
dokazatelných sentencí. Platí tedy N |= Prτ (ϕ). Podle 4.3.5 sentence Prτ (ϕ) je
Σ(PA)-sentence. Σ-úplnost dává Q Prτ (ϕ), tedy i PA Prτ (ϕ).
Podmínka D2 plyne z 4.2.14(b) pouhým dosazením.
Protože Prτ (ϕ) je Σ-sentence, platí PA Prτ (ϕ) → PrQ(Prτ (ϕ)) díky formalizované
Σ-úplnosti. Zbývá pouze zdůvodnit PA PrQ(Prτ (ϕ)) → Prτ (Prτ (ϕ)).
Podle 4.2.14(d) platí dokonce PA ∀x(PrQ(x) → Prτ (x)). Každá sentence Prτ (αi),
kde αi je některý z axiomů Robinsonovy aritmetiky, je totiž Σ-sentence platná v N.
QED
Z 4.2.14(b) víme, že v PA je známo, že množina všech dokazatelných formulí
je uzavřena na pravidlo MP. V některých aplikacích bude stačit vědět, že to platí
alespoň pro „skutečné sentence, tj. že platí podmínka D2. Je dobré si všimnout, že
ke zdůvodnění platnosti podmínky D2 jsme opravdu potřebovali tvrzení 4.2.14(d),E
nevystačili bychom s tvrzeními o deﬁnovatelnosti množin a podmínek uvedených
v 4.2.12 a 4.2.13. Podmínku D2 lze označit jako formalizované pravidlo modus
ponens. Podmínka D3 je vlastně formalizace podmínky D1. Když je něco dokazatelné,
pak je dokazatelné, že je to dokazatelné. Podmínka D1 konstatuje, že na
metamatematické úrovni to platí. Podmínka D3 tvrdí, že v PA je to známo také.
Podmínky D1–D3 použijeme v příštím oddílu, v důkazu Druhé Gödelovy věty
o neúplnosti. Setkáme se s nimi i v oddílu 5.3. Název podmínky pro dokazatelnost
(anglicky derivability conditions) je oprávněn tím, že jde o (minimální) podmínky
kladené na formuli Prτ (x) potřebné k tomu, aby se podařil (obvyklý) důkazy Druhé
4.4 Σ-úplnost Robinsonovy aritmetiky 337
Gödelovy věty. V literatuře se lze setkat s ekvivalentní formulací podmínky D2:
PA Prτ (ϕ → ψ) → (Prτ (ϕ) → Prτ (ψ)).
Poslední téma tohoto oddílu je formalizovatelnost (alespoň části) sémantiky
predikátové logiky v PA. Vezmeme-li do hry ještě gentzenovský kalkulus, podaří se
nám odpovědět na jednu z otázek ze závěru oddílu 4.2. Zbývající část tohoto oddílu
pravděpodobně nebude podstatná pro pochopení výsledků z následujících oddílů.
Úvahy o formalizované sémantice začněme prohlédnutím formule Val(z, e, a),
kterou čteme číslo a je hodnota termu z při ohodnocení proměnných e:
Term(z) & Seq(e) & ∃w(Seq(w) & Lh(w, z + 1) &
& ∀y≤z (¬Term(y) ∨
∨ (y = 0 & B(w, y, 0))
∨ (Var(y) & ∃t(Lh(e, t) & y < t & ∃v(B(e, y, v) & B(w, y, v))))
∨ (Var(y) & ∃t(Lh(e, t) & y ≥ t & B(w, y, 0)))
∨ ∃u1∃u2∃v1∃v2(y = (u1+u2) & B(w, u1, v1) & B(w, u2, v2) &
& B(w, y, v1 + v2))
∨ ( . . . podobně pro symboly „⋅ a „S . . . ))
& B(w, z, a)).
Stejně jako již několikrát simulujeme primitivní rekurzi pomocí posloupnosti w,
která kóduje počáteční úsek příslušné funkce. Posloupnost w kóduje výpočet, který
stanoví hodnotu termu z tak, že určí hodnotu všech termů menších nebo rovných z.
Přitom hodnota termu 0 je nula, hodnota termu vzniklého ze dvou jednodušších
termů pomocí znaménka + je součtem příslušných hodnot atd.
Jako ohodnocení e se ve formuli Val připouštějí všechny posloupnosti přirozených
čísel. To znamená, že se dopouštíme následujícího zjednodušení: nedeﬁnujeme
pojem struktury, v sémantice formalizované uvnitř PA uznáváme jen jedinou
strukturu, a sice univerzum všech (formálních) přirozených čísel. V pátém řádku
formule Val je vidět, jak jsme obešli potíž s tím, že ohodnocení proměnných má být
deﬁnováno pro všechny proměnné, ale uvnitř PA máme jen konečné posloupnosti.
Za hodnoty proměnných větších nebo rovných délce ohodnocení e pokládáme nuly.
Jako obvykle, v PA lze dokázat, že formule Val má očekávané vlastnosti.
Lemma 4.4.17 (a) Formule Val(z, e, a) je ∆1 v PA.
(b) V PA lze dokázat, že při každém ohodnocení e má každý term jednoznačně určenou
hodnotu a. Hodnota termu 0 je nula při jakémkoliv ohodnocení. Je-li term z
utvořen z jednodušších termů pomocí symbolu + nebo ⋅, pak je jeho hodnota při
ohodnocení e rovna součtu resp. součinu příslušných hodnot. A podobně, vznikne-li z
z jednoduššího termu pomocí symbolu S.
(c) Je-li s(v1, . . , vr) libovolný (skutečný) aritmetický term, jsou-li n1, . . , nr a m
přirozená čísla taková, že N |= m = s(n1, . . , nr), a je-li q kód posloupnosti, která
v bodech v1, . . , vr má hodnoty n1, . . , nr, pak PA ∀a(Val(s, q, a) ≡ a = m).
338 4 Peanova a Robinsonova aritmetika
Důkaz Formule Val(z, e, a) má tvar Term(z) & Seq(e) & ∃w((. .) & B(w, z, a)) a je
ekvivalentní s formulí Term(z) & Seq(e) & ∀w((. .) → B(w, z, a)). Všechny kvantiﬁkátory
ve formuli označené závorkou s tečkami lze psát jako omezené. Tím je
zdůvodněno tvrzení (a). Tvrzení (b) se dokáže jako obvykle. Tvrzení (c) plyne
z (b) indukcí podle počtu symbolů v termu s. QED
Podobně jako v důkazu věty formalizované Σ-úplnosti pracujeme uvnitř PA
s termy a formulemi, což jsou (formální) přirozená čísla. Opět je vhodné si je
představit jako prvky libovolného (nestandardního) modelu, které mohou být standardní
nebo nestandardní, skutečné nebo neskutečné. Tvrzení (c) říká, že o každém
(skutečném, metamatematickém) termu PA ví, že má při každém skutečném ohodnocení
jedinou hodnotu, a sice tu skutečnou.
Dále chceme v aritmetickém jazyce simulovat Tarského deﬁnici, tj. deﬁnovat,
kdy je formule splněna ohodnocením proměnných. Nebudeme se pokoušet udělat
to najednou pro všechny formule. Pro začátek se spokojíme s deﬁnicí pro atomické
formule a pro ∆0-formule. Formuli
∃z1∃z2∃a1∃a2(Val(z1, e, a1) & Val(z2, e, a2) & ((x = z1=z2 & a1 = a2) ∨
∨ (x = z1<z2 & a1 < a2) ∨ (x = z1≤z2 & a1 ≤ a2)))
označme SatAt(x, e) a čtěme číslo x je atomická formule a číslo e je ohodnocení
proměnných, které ji splňuje. V zápisu Tarského deﬁnice pro ∆0-formule použijeme
formuli FmAt(x) z oddílu 4.2 a dále formuli FmBdd(x), která je ∆1(PA) a která
říká, že číslo x je omezená formule. Její konstrukci neuvádíme, není v ní žádná
potíž. Teď můžeme naznačit konstrukci formule SatBdd(x, e) vyjadřující, že číslo x
je ∆0-formule a e je ohodnocení proměnných, které ji splňuje:
FmBdd(x) & Seq(e) & ∃w((w je posloupnost délky x + 1, jejíž všechny členy
jsou posloupnosti nul a jedniček téže délky t dostatečné vzhledem k x a e) &
& ∀y≤x∀d≤w(¬Fm(y) ∨
∨ (d není posloupnost přípustná vzhledem k x a e)
∨ (FmAt(y) & (B(w, (y, d), 1) ≡ SatAt(y, d)))
∨ ∃u∃y ∃z∃a(y = ∀u<zy & B(d, z, a) &
& (B(w, (y, d), 1) ≡ ∀b<a∀d (když d vznikla z d změnou
hodnoty v u z a na b, pak B(w, (y , d ), 1))))
∨ ( . . . podobně pro ostatní omezené kvantiﬁkátory . . . )
∨ ∃y1∃y2(y = (y1→y2) & (B(w, (y1, d), 0) ∨ B(w, (y2, d), 1)))
∨ ( . . . podobně pro ostatní logické spojky . . . ))
& B(w, (x, e), 1)).
Tento semiformální zápis je pokusem o kompromis mezi přesností a přehledností.
Číslo w je posloupnost posloupností a je užitečné představit si je jako tabulku nul
4.4 Σ-úplnost Robinsonovy aritmetiky 339
a jedniček s x + 1 řádky a t sloupci. Řádky odpovídají formulím nepřevyšujícím x
a sloupce ohodnocením proměnných menším než t. Zápis B(w, (y, d), 1) je zkratka
pro ∃v(B(w, y, v) & B(v, d, 1)) nebo pro ∀v(B(w, y, v) → B(v, d, 1)) a lze jej číst hodnota
v řádku y a sloupci d tabulky w je ANO. Závorky ve výrazu (y, d) tedy tentokrát
neoznačují párovací funkci. Dále posloupnost d je posloupnost vzniklá z d změnou
hodnoty v u z a na b, jestliže členy posloupnosti d s indexy menšími než min{l, u}, kde
l je délka posloupnosti d, se shodují s členy posloupnosti d, pak následuje u−l nulových
členů v případě, kdy u ≥ l, pak člen b a nakonec l − u − 1 posledních členů posloupnosti
d v případě, kdy l > u. Lze ověřit, že právě zapsaná podmínka začínající slovy
„členy s indexy. . . je ∆1 v PA.
Jako obvykle je posloupnost w ve formuli SatBdd(x, e) záznamem výpočtu, který
určí pravdivostní hodnotu formule x při ohodnocení e. Vedlejším produktem výpočtu
je určení pravdivostních hodnot všech formulí y ≤ x při všech ohodnoceních
proměnných d přípustných vzhledem k x a e. Je-li formule y sestavena z jednodušších
formulí y1 a y2 pomocí některé logické spojky, výpočet se odvolává na
pravdivostní hodnoty formulí y1 a y2 při tomtéž ohodnocení, a ty jsou umístěny
v tomtéž sloupci tabulky w v dřívějších řádcích příslušných k y1 a y2. Složitější
situace nastane, je-li y utvořena z jednodušší formule y pomocí omezené kvantiﬁkace.
V tom případě se výpočet odvolává na pravdivostní hodnoty formule y
při ohodnoceních d , o kterých byla řeč v předchozím odstavci. Tyto pravdivostní
hodnoty jsou umístěny v dřívějším řádku příslušném k formuli y .
Tím jsme se dostali k vysvětlení obratu posloupnost d je vzhledem k x a e přípustná
a obratu číslo t je dostatečně velké vzhledem k x a e. Posloupnost d pokládejme
za přípustnou vzhledem k x a e, jestliže e má nenulovou délku, délka posloupnosti d
je nejvýše max{x+1, délka e} a žádný její člen nepřevyšuje maximální člen posloupnosti
e. Předpokládejme, že d je posloupnost přípustná vzhledem k x a e a dále že
y ≤ x je formule tvaru ∀u<zy a d má v bodě z hodnotu a. Změníme-li v posloupnosti
d hodnotu v bodě u na novou hodnotu b, kde b < a, dostaneme posloupnost,
jejíž délka je nejvýše max{u + 1, délka d} ≤ max{x + 1, délka e} (neboť pro čísla
u a y platí u < y) a jejíž členy nepřevyšují maximální člen posloupnosti d, tj. ani
maximální člen posloupnosti e. Jinými slovy, utvoříme-li z posloupnosti d přípustné
vzhledem k x a e posloupnost d tak, jak je řečeno ve formuli SatBdd, dostaneme
opět posloupnost přípustnou vzhledem k x a e. Číslo t je dostatečně velké vzhledem
k x a e, jestliže je větší než všechny posloupnosti přípustné vzhledem k x a e.
Pro jistotu dodejme, že netvrdíme, že všechny posloupnosti d menší než t jsou přípustné:
nějaká posloupnost s malým číselným kódem může mít nepřípustně velké
členy nebo i délku.
Formuli SatBdd říkejme deﬁnice pravdy pro ∆0-formule. Mohli bychom nyní
vyslovit její vlastnosti. Místo toho nejprve zkonstruujeme deﬁnice pravdy pro další
třídy formulí. Vlastnosti pak vyslovíme najednou.
Nechť Γ je množina aritmetických formulí. Označme ∆0(Γ) množinu všech
formulí utvořených z formulí v Γ pomocí logických spojek a omezených kvantiﬁkátorů.
Označme ∃Γ množinu všech formulí utvořených z formulí v Γ pomocí jednoho
existenčního kvantiﬁkátoru. Analogicky ∀Γ je množina všech formulí tvaru ∀vϕ,
340 4 Peanova a Robinsonova aritmetika
kde ϕ ∈ Γ. Označuje-li FmAt (jako v oddílu 3.6) množinu všech atomických aritmetických
formulí, pak Γ ⊆ ∆0(Γ), ∆0(FmAt) = ∆0(∆0) = ∆0 a ∃∆0 = Σ1. Dále
deﬁnujme modiﬁkace Σ+
n a Π+
n množin Σn a Πn:
Σ+
0 = Π+
0 = FmAt,
Σ+
n+1 = ∆0(Σ+
n ∪ Π+
n ) ∪ ∃∆0(Σ+
n ∪ Π+
n ),
Π+
n+1 = ∆0(Σ+
n ∪ Π+
n ) ∪ ∀∆0(Σ+
n ∪ Π+
n ).
Tedy Σ+
n+1-formule (Π+
n+1-formule) jsou všechny formule, které jsou ze Σ+
n - a
Π+
n -formulí utvořeny pomocí logických spojek a omezených kvantiﬁkátorů plus případně
jednoho existenčního (resp. univerzálního) kvantiﬁkátoru.
Příklad 4.4.18 Nechť α(x, y) a β(v) jsou ∆0-formule. Pak formule ∀x∀yα(x, y)
a ∀x∀yα(x, y) → ∃vβ(v) nejsou v žádné z množin Σn ani Πn (protože formule v Σn
i v Πn musí začínat střídajícími se neomezenými kvantiﬁkátory). První z nich je
v Π+
2 , druhá je v ∆0(Π+
2 ).
Pro n ≥ 1 platí Σn ⊆ Σ+
n ⊆ Σn(PA) a Πn ⊆ Π+
n ⊆ Πn(PA). Každá aritmetická
formule patří do některé z množin Σ+
n či Π+
n , a to je důvod, proč množiny Σ+
n a Π+
n
zavádíme.
Všechny právě deﬁnované množiny formulí lze deﬁnovat i uvnitř PA. Formuli
FmAt jsme již použili. Nechť FmBddn(x) je aritmetická formule, která vyjadřuje,
že číslo x je formule v ∆0(Σ+
n ∪ Π+
n ), a nechť Fmn(x) vyjadřuje, že číslo x je
formule v Σ+
n . Předpokládáme, že čtenář si dovede konstrukci formulí FmBddn(x)
a Fmn(x) představit a dovede také vyslovit jejich vlastnosti. Všechny jsou ∆1 v PA.
Formule FmBdd0 je totožná s dříve užívanou formulí FmBdd. Bez formalizované
deﬁnice Π+
n -formulí se obejdeme.
Dále deﬁnujme pro každé n formuli SatBddn(x, e), která je deﬁnicí pravdy pro
formule v ∆0(Σ+
n ∪ Π+
n ). Postupujme rekurzí podle n. SatBdd0 je formule SatBdd.
SatBddn+1 je formule, která vznikne z formule SatBddn(x, e) nahrazením podformule
FmBddn v prvním řádku formulí FmBddn+1 a dále nahrazením pátého řádku,
začínajícího „ ∨ (FmAt(y) , následujícími třemi novými řádky:
∨ (FmBddn(y) & (B(w, (y, d), 1) ≡ SatBddn(y, d))),
∨ ∃u(y = ∃uy & (B(w, (y, d), 1) ≡ ∃bSatBddn(y , d(u/b)))),
∨ ∃u(y = ∀uy & (B(w, (y, d), 1) ≡ ∀bSatBddn(y , d(u/b)))).
Formule SatBddn+1 je utvořena z formule SatBddn zhruba stejně, jako byla formule
SatBdd utvořena z formule SatAt. Formuli SatBddn+1(x, e) si můžeme představit
jako „program , který pracuje následovně. Nejprve zjistí syntaktickou složitost
vstupu x a ověří, že je to formule v ∆0(Σ+
n+1 ∪ Π+
n+1). Pokud ano, stanoví
číslo t dostatečně velké vzhledem k x a e a připraví si tabulku w s x + 1 řádky a
t sloupci. V této tabulce nejprve vyplní pravdivostní hodnoty v řádcích, které příslušejí
k formulím tvaru y , ∃uy a ∀uy , kde y ∈ Σ+
n ∪ Π+
n , a to tak, jak popsáno
4.4 Σ-úplnost Robinsonovy aritmetiky 341
v nových třech řádcích, s pomocí dříve sestrojeného „podprogramu SatBddn. Pak
vyplní ostatní řádky příslušné k formulím vzniklým z formulí v Σ+
n+1 ∪Π+
n+1 pomocí
logických spojek a omezené kvantiﬁkace.
V zápisu formule SatBddn jsme si dovolili další zkrácený zápis: d(u/b) označuje
ono ohodnocení, o kterém byla řeč v komentáři ke konstrukci formule SatBdd a které
vzniklo z d změnou hodnoty v u na b. V následujícím lemmatu navíc e(z) označuje
hodnotu, kterou ohodnocení d přiřazuje proměnné z.
Lemma 4.4.19 (a) Formule SatBddn je v ∆n+1(PA).
(b) PA ∀x∀e(FmBddm(x) → (SatBddm(x, e) ≡ SatBddn(x, e))) pro každou dvojici
čísel m a n takových, že m ≤ n.
(c) V PA lze dokázat sentence
∀x∀y1∀y2∀e(FmBddn(x) & x = (y1&y2) → (SatBddn(x, e) ≡
≡ SatBddn(y1, e) & SatBddn(y2, e))),
∀x∀y∀e(FmBddn(x) & x = ¬y → (SatBddn(x, e) ≡ ¬SatBddn(y, e))),
∀x∀y∀u∀e(FmBddn(x) & x = ∃uy → (SatBddn(x, e) ≡ ∃bSatBddn(y, e(u/b)))),
∀x∀y∀z∀u∀e(FmBddn(x) & x = ∀u≤zy → (SatBddn(x, e) ≡
≡ ∀b≤e(z)SatBddn(y, e(u/b)))),
a také analogické sentence týkající se ostatních spojek a ostatních kvantiﬁkátorů.
(d) PA ∀x∀y∀u(FmBddn(x) & x = ∀uy & ∀eSatBddn(y, e) →
→ ∀eSatBddn(x, e)).
(e) PA ∀x∀e∀d(FmBddn(x) & ∀v(OccF(u, x) → d(v) = e(v)) →
→ (SatBddn(x, d) ≡ SatBddn(x, e))).
(f) PA ∀x∀e(FmBddn(x) & LogAx(x) → SatBddn(x, e)).
Důkaz Všechna tvrzení se dokazují metamatematickou indukcí podle n. Číslu w,
o kterém je řeč ve formuli SatBddn(x, e) a které je posloupností délky x + 1, jejíž
všechny členy jsou posloupnosti délky t dostatečné vzhledem k x a e, říkejme
pravdivostní relace pro x, e a t (a pro formule splňující FmBddn(x), tj. pro formule
v ∆0(Σ+
n ∪Π+
n )). V PA lze dokázat, že je-li t dostatečně velké vzhledem k x a e, pak
pro x, e a t existuje pravdivostní relace. A navíc, její hodnoty pro dvojice (y, d),
kde FmBddn(y) a d je ohodnocení přípustné vzhledem k x a e, jsou jednoznačně
určeny. V důkazu tvrzení (b)–(d) lze pokračovat ve stejném duchu, jako jsme to
udělali již vícekrát, celkem podrobně například v důkazu tvrzení 4.2.10 (c) a (d).
V důkazech tvrzení (e) a (f) se v PA postupuje stejně jako ve skutečnosti. Tvrzení
(e) je formalizací důkazu lemmatu 3.1.11. V (f) je nejsložitější ten případ, kdy
x je axiom tvaru B1 nebo B2. Postupuje se stejně jako v lemmatech 3.1.14 a 3.1.20.
Podívejme se ještě na tvrzení (a). Je-li SatBddn v ∆n+1(PA), pak podformule
formule SatBddn+1, které začínají kvantiﬁkátory „∃b a „∀b , jsou v Σn+1(PA)
342 4 Peanova a Robinsonova aritmetika
resp. v Πn+1(PA). Obě podformule jsou tedy v ∆n+2(PA). Celá formule SatBddn+1
je z těchto podformulí utvořena pomocí logických spojek, kvantiﬁkátorů, které lze
omezit, a pomocí kvantiﬁkátoru „∃w , o kterém bylo před chvílí zdůrazněno, že je
„obojetný : celá formule SatBddn+1(x, e) by se dala ekvivalentně psát ve tvaru
FmBddn+1(x) & Seq(e) & ∀w(když t je dostatečně velké vzhledem k x a e
a když w je pravdivostní relace pro x, e a t, pak B(w, (x, e), 1)).
Tím je ověřeno, že formule SatBddn+1 je ∆n+2 v PA za předpokladu, že formule
SatBddn je ∆n+1 v PA. Formule SatBdd0 je utvořena z ∆1(PA)-formulí pomocí
logických spojek, kvantiﬁkátorů, které lze omezit, a jednoho obojetného kvantiﬁkátoru,
a je tedy ∆1 v PA. QED
Z deﬁnice pravdy pro ∆0(Σ+
n ∪ Π+
n )-formule nyní utvoříme formuli Satn(x, e),
která je deﬁnicí pravdy pro Σ+
n -formule. Formuli Satn budeme v další práci upřednostňovat
před formulí SatBddn. Množinu Σ+
n totiž považujeme za přirozenější
než množinu ∆0(Σ+
n ∪ Π+
n ). Líbí se nám také to, že syntaktická složitost formule
Satn(x, e) pro n ≥ 1 vyjde jen Σn(PA). Pravdivostí Π+
n -formulí se nezabýváme,
protože to není třeba. Šlo by to ale snadno a také by to dopadlo příznivě:
Π+
n -formule mají deﬁnici pravdy, která je Πn(PA). Deﬁnujme tedy formule
Satn(x, e) a Trn(x) pro n ≥ 1:
Satn(x, e) ≡ SatBddn−1(x, e) ∨ ∃y∃u(x = ∃uy & ∃bSatBddn−1(y, e(u/b))),
Trn(x) ≡ Sentn(x) & ∃eSatn(x, e).
Formule Trn(x) říká číslo x je pravdivá Σ+
n -sentence. Formule Sentn(x) je ovšem
deﬁnována jako konjunkce Sent(x) & Fmn(x). Víme ze 4.4.19, že sentence je
splněna některým ohodnocením, právě když je splněna každým ohodnocením. Je
tedy jedno, zda ve formuli Trn(x) stojí „∃e nebo „∀e . Kvantiﬁkátoru „∃e jsme
dali přednost proto, abychom nezvyšovali složitost formule.
Lemma 4.4.20 (a) Pro n ≥ 1, formule Satn a Trn jsou Σn v PA.
(b)–(f) Všechna tvrzení (b)–(f) lemmatu 4.4.19 platí pro n ≥ 1, nahradíme-li v nich
formuli SatBddn formulí Satn.
(g) Nechť n ≥ 1, nechť ϕ(x1, . . , xr) je Σ+
n -formule, k1, . . , kr jsou přirozená čísla
a nechť q je posloupnost, jejíž hodnoty v x1, . . , xr jsou k1, . . , kr. Pak v PA lze
dokázat sentenci ϕ(k1, . . , kr) ≡ Satn(ϕ, q).
(h) Je-li ϕ ∈ Σ+
n a ϕ je sentence, pak PA ϕ ≡ Trn(ϕ).
Důkaz Formule Satn je utvořena z formule SatBddn−1, která je ∆n v PA, tedy Σn
v PA, a to pomocí konjunkce, disjunkce a existenční kvantiﬁkace. Z tvrzení (c) a (d)
lemmatu 4.3.4 plyne (a).
Všechna tvrzení (b)–(f) plynou z deﬁnice formulí Satn a z příslušných tvrzení lemmatu
4.4.19. Tvrzení (c) lze dokázat indukcí podle složitosti formule ϕ. Je-li ϕ
4.4 Σ-úplnost Robinsonovy aritmetiky 343
atomická, uplatní se 4.4.17(c). V ostatních případech se použijí tvrzení o logických
spojkách a kvantiﬁkátorech uvedená v (b). Tvrzení (h) plyne okamžitě z (g)
volbou r = 0. QED
Tvrzení (h) (případně též tvrzení (g)) se někdy nazývá dekvotační schéma (anglicky
dequotation scheme). Mnozí je také znají a citují jako „lemma sněží-sněží ,
protože vyjadřuje tento fakt: sentence „sněží je pravdivá, právě když sněží. Na
dekvotačním schématu je důležité, že podobně jako věta o formalizované Σ-úplnosti
platí pro všechny sentence bez ohledu na to, jsou-li dokazatelné, vyvratitelné nebo
nezávislé.
Deﬁnujme v PA důkazy omezené složitosti. Nechť τ(z) je formule a nechť m je
přirozené číslo. Deﬁnujme formule Proofm,τ (x, w) a Prm,τ (x):
Proofm,τ (x, w) ≡ Proofτ (x, w) & ∀w1∀z(Beg(w1, w) & Ends(w1, z) → Fmm(z)),
Prm,τ (x) ≡ ∃wProofm,τ (x, w).
Formule Prm,τ (x) tedy říká, že formuli x lze dokázat důkazem, v němž všechny formule
jsou v Σ+
m. Je-li x dokazatelná takovým důkazem, pak ovšem x sama musí být v Σ+
m,
tj. musí o ní platit Fmm(x). Je-li τ v ∆1(PA), pak formule Proofm,τ je v ∆1(PA),
protože kvantiﬁkátory „∀w1∀z lze psát jako omezené. Je-li τ v Σ1(PA), pak formule
Proofm,τ a Prm,τ jsou v Σ1(PA).
Od oddílu 4.2 pracujeme s formalizovanou deﬁnicí důkazu, pro kterou jsme si
vybrali hilbertovský kalkulus HK. Stejně dobře lze ale v PA formalizovat i gentzenovský
kalkulus GK. Znamená to k seznamu symbolů potřebných k zapisování
důkazů přidat tři symboly „ , „ a „⇒ pro zapisování sekventů. Řekněme, že
tam, kde bychom chtěli zdůraznit, že jde o symboly, zejména ve výrazech tvaru (. .) ,
bychom užívali jejich strojopisné verze [, ] a =>. Všechna tvrzení kapitoly 3 o gentzenovském
kalkulu GK, která mají ryze syntaktický důkaz, lze formalizovat v PA.
Budeme potřebovat větu o eliminovatelnosti řezů, tvrzení o vzájemné simulovatelnosti
kalkulů HK a GK a větu 3.3.4.
Věta 4.4.21 Nechť F je konečná množina aritmetických sentencí, nechť ϕ je aritmetická
sentence. Pak existuje číslo m takové, že PA PrF (ϕ) → Prm,F (ϕ).
Důkaz Máme množinu sentencí F a sentenci ϕ. Vezměme číslo m0 tak velké, že
ϕ i všechny sentence v F jsou v Σ+
m0
. Protože pracujeme s aritmetickým jazykem,
množina axiomů rovnosti má osm prvků (axiomy E1–E3, tři instance axiomu E4 a
dvě instance axiomu E5). Označme tuto množinu E. Lze ověřit, že všechny prvky
množiny E jsou sentence v Π+
4 , tedy v Σ+
5 . Označme S sekvent F, E ⇒ ϕ .
Všechny formule sekventu S jsou v Σ+
max{5,m0}. Položme m1 = max{5, m0}. Tvrdíme,
že číslo m = 1 + m1 vyhovuje, protože:
Nechť sentence ϕ je v kalkulu HK dokazatelná z množiny předpokladů F. Pak
sekvent S je dokazatelný v kalkulu GK. Podle věty 3.3.13 o eliminovatelnosti
řezů má sekvent S i bezřezový důkaz w1. Podle věty 3.3.4 každá formule v důkazu
w1 je s-podformulí některé formule sekventu S. Je jasné, že je-li formule z
344 4 Peanova a Robinsonova aritmetika
s-podformulí formule y a je-li Fmm1 (y), pak Fmm1 (z). Z toho plyne, že pro
každou formuli z v důkazu w1 platí Fmm1 (z). Podle věty o simulovatelnosti
kalkulu GK kalkulem HK, viz 3.3.2, má sentence ϕ důkaz w2 z množiny předpokladů
F ∪ E v kalkulu HK, tj. důkaz w2 z množiny předpokladů F v kalkulu HKe.
Prohlédnutím konstrukce důkazu w2 v důkazu věty 3.3.2 lze ověřit, že důkaz w2
obsahuje pouze formule utvořené z formulí v důkazu w1 pomocí logických spojek.
Všechny takové formule z splňují podmínku Fmm(z).
QED
Věta 4.4.22 (a) Nechť F je konečná množina aritmetických sentencí. Pak implikace
F → Con(F) je dokazatelná v PA.
(b) Nechť F je konečná množina axiomů Peanovy aritmetiky. Pak PA Con(F).
Důkaz Nechť F = {ψ1, . . , ψk} je dána. Vzpomeňme si, jak je sentence Con(F)
deﬁnována pomocí formule PrF , a užijme předchozí větu na množinu F a na sentenci
ϕ := (0 = S(0)): pro jisté m platí PA ¬Con(F) → Prm,F (0 = S(0)). Zbývá
zdůvodnit PA F → ¬Prm,F (0 = S(0)):
Dokazujme sporem. Nechť ψ1, ψ2, . . a ψk. Nechť zároveň existuje číslo w
tvaru x1#x2# . . #xt takové, že pro každé l, kde 1 ≤ l ≤ t, platí Fmm(xl), a w
je důkaz sentence 0 = S(0) z množiny předpokladů F. Ověříme indukcí podle l,
že ∀eSatm(xl, e). Je-li xl jeden z předpokladů, tj. jedna ze sentencí ψ1, . . , ψk,
pak ∃eSatm(xl, e) dle 4.4.20(h), a také ∀eSatm(xl, e) dle 4.4.20(e). Je-li xl logický
axiom, uplatní se 4.4.20(f). A je-li xl odvozena z předchozích členů pomocí
pravidel generalizace nebo pomocí pravidla MP, uplatní se tvrzení z 4.4.20(b)
týkající se kvantiﬁkátorů a implikace.
Tím jsme dospěli ke sporu. Sentence 0 = S(0) je jednou z formulí xl, a platí o ní
tedy ∀eSatm(0 = S(0), e). Díky 4.4.20(h) o ní platí také ¬∀eSatm(0 = S(0), e).
Tvrzení (b) plyne bezprostředně z (a): obsahuje-li F pouze axiomy Peanovy aritmetiky,
pak PA F. QED
Věta 4.4.22 dává odpověď na jednu z otázek ze závěru oddílu 4.2. Jedna z konečných
množin F axiomů Peanovy aritmetiky je Q, a platí tedy PA Con(Q).
Tomu, abychom mohli tvrdit PA Con(π), brání rozdíl mezi obraty „pro každou
F, která je konečná, PA ví, že . . . a „PA ví, že pro každou konečnou F . . . .
Kdybychom měli (jeden) důkaz tvrzení, že každá konečná část množiny { z ; π(z) }
je bezesporná, znamenalo by to i důkaz bezespornosti celé množiny { z ; π(z) }.
Takový důkaz ale (zatím?) nemáme. Máme pouze nekonečně mnoho různých důkazů
různých formulí tvaru Con(F) a není zřejmé, jak z nich utvořit společný důkaz
tvrzení, že každá konečná část množiny { z ; π(z) } je bezesporná.
Pomohlo by, kdybychom místo dílčích deﬁnicí pravdy Satn mohli sestrojit jednu
společnou (uniformní) deﬁnici pravdy pro všechny aritmetické formule najednou.
Fakt, že aritmetická klasiﬁkace formulí Satn (na rozdíl od formulí Fmn) vzrůstá se
vzrůstajícím n, ale naznačuje, že to možná nepůjde.
4.4 Σ-úplnost Robinsonovy aritmetiky 345
Konstatujme, že sentence Con(π), přes dílčí úspěchy v dokazování bezespornosti,
zůstává kandidátem na konkrétní tvrzení, které je nezávislé na PA.
Cvičení
1. Dokažte v Q sentence ∀x∀y(x ≤ y ≤ n → x ≤ n), ∀x∀y(x ≤ n ≤ y → x ≤ y)
a ∀x(S(x) + n = x + n + 1).
2. Dokažte, že sentence ∀x(S(x) + 0 = x + 1) a ∀x∃v(0 + v = x) nejsou v Q
dokazatelné. To znamená, že tvrzení (e) věty 4.4.1 by neplatilo, kdybychom
v axiomu Q8 zaměnili pořadí sčítanců.
3. Dokažte, že (a)–(d) ve větě 4.4.1 by bylo možno dokázat i v případě, kdybychom
v axiomech Q8 a Q9 zaměnili pořadí sčítanců.
4. Dokažte, že každá Σ-korektní teorie je bezesporná.
5. Rozhodněte, zda platí
(a) Jsou-li ϕ a ψ aritmetické sentence takové, že PA ϕ ∨ ψ, pak platí PA ϕ
nebo PA ψ.
(b) Jsou-li ϕ a ψ aritmetické Σ-sentence takové, že PA ϕ∨ψ, pak platí PA ϕ
nebo PA ψ.
Návod k (b). Použijte Σ-korektnost na disjunkci ϕ ∨ ψ a Σ-úplnost zvlášť na ϕ
a na ψ.
6. Rozhodněte, zda platí
(a) Je-li ∃xϕ(x) aritmetická sentence taková, že PA ∃xϕ(x), pak existuje
číslo n takové, že PA ϕ(n).
(b) Je-li ∃xϕ(x) aritmetická sentence taková, že ϕ je omezená a PA ∃xϕ(x),
pak existuje číslo n takové, že PA ϕ(n).
Návod. V případě (a) vezměte omezenou formuli ψ(y) splňující podmínky
N |= ∀yψ(y) a PA ∀yψ(y). Existenci takové sentence zaručuje věta 4.3.12.
Dále uvažujte sentenci ∃x∀y(ψ(y) ∨ ¬ψ(x)).
7. Dokažte, že množina všech logicky platných formulí v jazyce aritmetiky je
Σ1-kompletní.
8. Dokažte, že splňuje-li Σ1-formule ϕ(x, y) podmínku (∗) z věty 4.4.14, pak ϕ
deﬁnuje v N graf funkce f a všechny sentence tvaru ∃yϕ(n, y) jsou v Q doka-
zatelné.
9. Vyvoďte z lemmatu 4.4.10, že ke každé rekurzívní množině A ⊆ N existuje
formule ϕ(x) ∈ Σ1 taková, že Q ϕ(n) pro všechna n ∈ A a Q ¬ϕ(n) pro
všechna n /∈ A.
10. Vyvoďte totéž tvrzení z věty 4.4.14.
346 4 Peanova a Robinsonova aritmetika
11. Dokažte, že splňuje-li teorie T předpoklady Rosserovy věty 4.4.11, pak každá
z množin Σ1 ∩ Thm(T) i Π1 ∩ Thm(T) je Σ1-kompletní.
12. Zdůvodněte, že relace { [ϕ, e] ; ϕ ∈ ∆0 & N |= ϕ[e] } je PR. Z toho plyne,
že i relace { [ϕ(x), n] ; ϕ(x) ∈ ∆0 & N |= ϕ(n) } je PR. Jinými slovy, úloha
rozhodnout, zda daná formule je ∆0-formulí s jednou volnou proměnnou, která
je v N splněna daným číslem n, je primitivně rekurzívní. Zdůvodněte dále,
že množina { ϕ(x) ; ϕ(x) ∈ ∆0 & N /|= ϕ(ϕ) } je příklad množiny, která je
primitivně rekurzívní, není ale ∆0-deﬁnovatelná.
Návod. Analyzujte konstrukci formule SatBdd a důkaz lemmatu 4.4.19. Podmínka
„ϕ je ∆0-formule a e je ohodnocení proměnných takové, že (některá nebo
každá) pravdivostní relace m pro ϕ, e a k, kde k je dost velké vzhledem k ϕ a e,
přiřazuje dvojici [ϕ, e] hodnotu 1 je primitivně rekurzívní, neboť velikost pravdivostní
relace lze odhadnout primitivně rekurzívní funkcí ve ϕ a e.
13. Nechť M je struktura pro aritmetický jazyk a A je její podstruktura. Řekneme,
že A splňuje Tarského-Vaughtovu podmínku pro Γ-formule, jestliže pro každou
formuli ϕ(x, y) ∈ Γ a pro každou r-tici b1, . . , br prvků množiny A platí implikace
M |= (∃xϕ)[b] ⇒ ∃a ∈ A(M |= ϕ[a, b]). Řekneme, že struktura A je Γ-elementární,
jestliže všechny Γ-formule jsou absolutní pro podstrukturu A. Dokažte,
že když A splňuje Tarského-Vaughtovu podmínku pro Πm-formule, pak A je
Σm+1-elementární.
14. Dokažte, že když A je Σm+1-elementární podstruktura struktury M a M |= PA,
pak A |= IΣm.
Návod. Dokažte indukcí dle k, že A |= IΣk pro každé k ≤ m. Zdůvodněte
úvahami podobnými jako v cvičení 5 oddílu 4.2, že máte-li Σk−1-indukci a je-li
ϕ(x, y) ∈ Σk, pak formule ϕ(0, y) & ∀x(ϕ(x, y) → ϕ(S(x), y)) je ekvivalentní
s Πk+1-formulí, a je tedy absolutní pro podstrukturu A vzhledem k předpokladu,
že A je Σm+1-elementární.
15. Nechť M |= PA. Řekneme, že prvek a modelu M je Γ-deﬁnovatelný, jestliže
existuje formule ψ(x) ∈ Γ, která jej v M deﬁnuje. Zdůvodněte využitím
věty 4.3.12, že existuje model Peanovy aritmetiky, který má nestandardní
∆0-deﬁnovatelné prvky.
16. Nechť M |= PA a nechť Dn označuje množinu všech Σn+1-deﬁnovatelných prvků
modelu M. Zdůvodněte, že množina Dn je podstruktura modelu M, tj. že
obsahuje nulu a je uzavřená na sčítání, násobení a přičítání jedničky.
17. Nechť Dn a M jsou jako v předchozím cvičení. Dokažte užitím cvičení 13 a 14,
že Dn je Σn+1-elementární podstruktura modelu M, která je modelem teorie
IΣn.
4.4 Σ-úplnost Robinsonovy aritmetiky 347
18. Nechť α(x, y) označuje formuli
číslo x je formule s jednou volnou proměnnou, platí Fmn+1(x) a přitom
pro (některé nebo každé) ohodnocení e přiřazující číslo y oné jediné volné
proměnné formule x platí Satn+1(x, e).
Stručněji řečeno, formule α(x, y) říká číslo x je Σ+
n+1-formule s jedinou volnou
proměnnou, která je (n+1)-splněná číslem y. Zdůvodněte, že formule α
je Σn+1(PA). Nechť dále β(x, y) je formule α(x, y) & ∀v(α(x, v) → v = y).
Zdůvodněte, že jsou-li Dn a M jako v předchozích cvičeních, pak formule β je
absolutní pro podstrukturu Dn. Vysvětlete, jak se přitom uplatní vědomost,
že Dn |= IΣn. Zdůvodněte, že ∀b ∈ Dn∃m ∈ N(M |= β(m, y)[b]). Nakonec
dokažte, že formule ∀y∃x<tβ(x, y) je v Dn splněna právě těmi ohodnoceními,
která proměnné t přiřazují nestandardní prvek. Z toho plyne, že obsahuje-li Dn
nějaké nestandardní prvky, pak Dn /|= PA.
19. Dokažte užitím předchozího cvičení (a cvičení 15), že žádná z teorií IΣn není
ekvivalentní s PA. Z toho plyne, že Peanova aritmetika není konečně axioma-
tizovatelná.
20. Formulujte schémata podobná tvrzením 4.4.17(c) a 4.4.20(g), ve kterých by se
jako hodnoty proměnných připouštěla libovolná (formální) přirozená čísla, ne
jen (standardní) numerály. Naznačte důkaz a zdůvodněte, že k důkazu všech
instancí obou schémat v PA stačí jen konečně mnoho axiomů.
21. Zdůvodněte, že existuje n0 ≥ 1 takové, že každá teorie IΣn pro n ≥ n0 je
konečně axiomatizovatelná.
Návod. Užitím dílčí deﬁnice pravdy Satn a předchozího cvičení lze indukci pro
všechny Σn-formule formulovat pomocí jediné formule. Číslo n0 zvolte tak, že
všechny axiomy PA nutné v předchozím cvičení jsou v Σn0 .
4.5 Autoreference, Druhá Gödelova věta
Uvažujme aritmetickou formuli ψ(x) s jednou volnou proměnnou x. Formule ψ(x)
může být libovolná, ale představujme si ji nějak jako Trn(x) nebo ¬PrQ(x), tj.
jako formuli, která vyjadřuje nějakou vlastnost formálních formulí x. Položme si
otázku, zda za proměnnou x lze do formule ψ(x) dosadit nějaký numerál tvaru ϕ,
kde ϕ je sentence, tak, aby výsledná sentence ψ(ϕ) byla (dokazatelně například
v PA) ekvivalentní se sentencí ϕ. Tutéž otázku lze také vyjádřit v terminologii
řešení rovnic: má každá rovnice tvaru PA ϕ ≡ ψ(ϕ) nebo Q ϕ ≡ ψ(ϕ) pro
neznámou sentenci ϕ řešení? Na první pohled to možná vypadá, že sotva, a navíc,
že odpověď může záviset na tom, jak přesně bylo zvoleno kódování (konečných
množin a posloupností), tj. přiřazení přirozených čísel formulím. Uvidíme, že tomu
tak není. Rovnice Q ϕ ≡ ψ(ϕ) (a tedy i rovnice PA ϕ ≡ ψ(ϕ)) má vždy řešení a
důkaz nevyužívá žádné zvláštní vlastnosti kódování.
348 4 Peanova a Robinsonova aritmetika
Ekvivalenci ϕ ≡ ψ(ϕ) lze číst sentence ϕ tvrdí, že ϕ má vlastnost ψ. Lze také
říci, že ϕ tvrdí o sobě já mám vlastnost ψ. Z tohoto důvodu se věta, která zaručuje
existenci řešení rovnic tvaru T ϕ ≡ ψ(ϕ), kde T je vhodná teorie, nazývá věta o
autoreferenci. Věta o autoreferenci umožňuje psát výroky „v první osobě .
Věta 4.5.1 (o autoreferenci) Ke každé aritmetické formuli ψ(x) existuje aritmetická
sentence ϕ taková, že Q ϕ ≡ ψ(ϕ).
Důkaz obsahuje také určitý „samovztažný motiv. Budeme se totiž zabývat situací,
kdy do nějaké formule α(x) je za její jedinou volnou proměnnou dosazen její
vlastní číselný kód, tj. numerál α. Deﬁnujme aritmetickou funkci f tímto předpi-
sem:
f(α) =
α(α) když α(x) je formule s jednou volnou proměnnou
0 jinak.
Funkce f je (primitivně) rekurzívní. Podle věty 4.4.14 k funkci f existuje Σ1-formule
γ(x, y), která ji reprezentuje v Q. To znamená, že podmínka
Q ∀y γ(α, y) ≡ y = α(α) (1)
platí pro každou formuli α(x) s jednou volnou proměnnou. Nechť aritmetická formule
ψ(x) je dána. Označme χ(x) formuli ∃y(γ(x, y) & ψ(y)) a označme ϕ sentenci
χ(χ). Vztáhneme-li (1) na formuli χ(x), dostaneme
Q ∀y(γ(χ, y) ≡ y = ϕ). (2)
Ověřme dokazatelnost ekvivalence ϕ ≡ ψ(ϕ) v Q:
Nechť ψ(ϕ). Z implikace ← v (2) máme γ(χ, ϕ). Existuje tedy číslo y, totiž ϕ,
takové, že γ(χ, y) a zároveň ψ(y). Tedy χ(χ).
Nechť naopak χ(χ). Existuje tedy y splňující současně podmínky γ(χ, y) a ψ(y).
Implikace → v (2) ale říká, že první z těchto podmínek splňuje jediné y, totiž ϕ.
Tedy ψ(ϕ).
QED
Větu o autoreferenci není ani tak těžké dokázat. Spíš je těžké ji netriviálním
způsobem použít, čili zvolit formuli ψ(x) tak, aby rovnice ϕ ≡ ψ(ϕ) neměla
žádná nezajímavá řešení typu 0 = 0 nebo 0 = 1. Autoři netriviálních užití věty o
autoreferenci jsou zpravidla známi a sentence ϕ splňující nějakou zajímavou rovnici
se citují jako něčí autoreferenční formule.
V tomto oddílu si postupně ukážeme několik příkladů na užití věty o autoreferenci.
Začněme nápadem, který se připisuje Alfredu Tarskému: co dostaneme,
pokusíme-li se v aritmetice reprodukovat paradox lháře, tj. napsat sentenci já jsem
nepravdivá?
Věta 4.5.2 Pro žádnou bezespornou teorii T obsahující Q neexistuje aritmetická
formule Tr(x) taková, že pro každou aritmetickou sentenci ϕ platí T ϕ ≡ Tr(ϕ).
4.5 Autoreference, Druhá Gödelova věta 349
Důkaz Nechť taková formule Tr(x) existuje. Podle věty o autoreferenci k formuli
¬Tr(x) existuje sentence ω taková, že Q ω ≡ ¬Tr(ω). Protože T obsahuje Q,
máme T ω ≡ ¬Tr(ω). Protože pro formuli Tr(x) platí dekvotační schéma, máme
T ω ≡ Tr(ω). Z ekvivalencí ω ≡ ¬Tr(ω) a ω ≡ Tr(ω) lze v T dokázat ω → ¬ω
i ¬ω → ω. V T tedy lze dokázat ω i ¬ω. To je spor s předpokladem, že T je
bezesporná. QED
V předchozím oddílu jsme pro každé n sestrojili formuli Trn(x), která je dílčí
deﬁnicí pravdy pro Σ+
n -formule. V závěru jsme poznamenali, že k tomu, abychom
dokázali sentenci Con(π) vyjadřující bezespornost Peanovy aritmetiky, by pomohla
uniformní deﬁnice pravdy, tj. jedna deﬁnice pravdy pro všechny aritmetické formule
najednou. Z věty 4.5.2 je jasné, že tento plán je neproveditelný: uniformní deﬁnice
pravdy neexistuje.
Ve větě 4.5.2 se nepředpokládá, že T je rekurzívně axiomatizovatelná. Můžeme
tedy volit T := Th(N): neexistuje formule Tr(x) taková, že N |= ϕ ≡ Tr(ϕ) pro
každou sentenci ϕ. To dále znamená, že neexistuje formule Tr(x) taková, že pro
každou sentenci ϕ platí ekvivalence N |= ϕ ⇔ N |= Tr(ϕ). Tím jsme ověřili, že
věta 4.5.2 poskytuje alternativní důkaz věty 4.3.10, tj. tvrzení, že množina Th(N)
není v N deﬁnovatelná. Obě věty 4.3.10 a 4.5.2 se citují jako Tarského věta o
nedeﬁnovatelnosti pravdy.
V důkazu věty 4.5.2 jsme větu o autoreferenci použili na formuli ψ(x), která
neexistuje, a výsledkem byl důkaz, že opravdu neexistuje. Větu o autoreferenci
lze ale samozřejmě použít i na takovou formuli ψ(x), o které víme, že existuje,
protože jsme ji dříve sestrojili. V následujících větách 4.5.3 a 4.5.6 pracujeme se
sentencemi, které říkají něco o vlastních důkazech nebo o vlastní dokazatelnosti.
Gödelova sentence říká já jsem nedokazatelná, Rosserova sentence říká před každým
mým důkazem existuje menší důkaz mé negace.
V několika následujících tvrzeních předpokládáme, že T je teorie obsahující Peanovu
aritmetiku a že τ(x) je Σ-formule, která deﬁnuje v N množinu T. Z věty 4.4.16
víme, že pro formuli Prτ (x) platí podmínky D1–D3, tj. podmínky pro dokazatelnost.
Dále víme z věty 4.2.13, že formule Prτ (x) deﬁnuje v N množinu Thm(T).
Tento fakt formulujme explicitně a označme si jej: ekvivalence
Def: T ϕ ⇔ N |= Prτ (ϕ)
platí pro každou sentenci v jazyce teorie T. Užitečná bude také vědomost, že Prτ (x)
je Σ-formule, viz 4.3.5. Ještě poznamenejme, že Σ-formule, která deﬁnuje v N
množinu T, existuje k teorii T právě tehdy, když T je rekurzívně axiomatizovatelná. E
Věta 4.5.3 (První Gödelova o neúplnosti) Nechť T je Σ-korektní teorie obsahující
Peanovu aritmetiku a nechť τ(z) je Σ-formule, která deﬁnuje v N množinu
T. Platí-li PA ν ≡ ¬Prτ (ν), pak ν je sentence nezávislá na T.
Důkaz Postupujme sporem. Nechť T ν. Podmínka D1 dává T Prτ (ν). Z předpokladu
PA ν ≡ ¬Prτ (ν) plyne T ¬Prτ (ν). Tedy T je sporná. To ale není,
protože je Σ-korektní.
350 4 Peanova a Robinsonova aritmetika
Víme už tedy T ν. Podmínka Def dává N /|= Prτ (ν). Dále postupujme opět
sporem. Nechť T ¬ν. Z předpokladu PA ν ≡ ¬Prτ (ν) plyne T Prτ (ν). Fakt,
že T je Σ-korektní, dává N |= Prτ (ν). QED
Předchozím důkazem jsme vlastně nezískali žádnou novou vědomost, ve větách
4.3.11, 4.3.12, 4.4.8 a 4.4.11 jsme už tvrdili víc. Jeho význam je jednak v tom, že jde
o původní (klasický) důkaz První Gödelovy věty, a dále v tom, že jeho prodloužením
získáme důkaz Druhé Gödelovy věty. Nejprve si ale rozmysleme jedno pomocné
tvrzení.
Lemma 4.5.4 Nechť T je teorie obsahující Peanovu aritmetiku a nechť τ(z) je
Σ-formule, která deﬁnuje v N množinu T. Pak Prτ (ϕ) → (Prτ (¬ϕ) → ¬Con(τ)) je
sentence dokazatelná v PA pro každou volbu sentence ϕ.
Důkaz Protože sentence ϕ → (¬ϕ → 0 = S(0)) je tautologie, víme
1: PA ϕ → (¬ϕ → 0 = S(0)).
Dále platí
2: PA Prτ (ϕ → (¬ϕ → 0 = S(0))) ; 1, D1
3: PA Prτ (ϕ) → Prτ (¬ϕ → 0 = S(0)) ; 2, D2
4: PA Prτ (ϕ) → (Prτ (¬ϕ) → Prτ (0 = S(0))) ; 3, D2.
Nyní si stačí připomenout, že sentence Con(τ) je deﬁnována jako ¬Prτ (0 = S(0)).
QED
Vraťme se ještě k důkazu První Gödelovy věty. Podmínku Def, ve které je řeč o
struktuře N, a Σ-korektnost, v jejíž deﬁnici je také řeč o struktuře N, jsme použili
pouze v druhé části důkazu, kde jsme ověřili, že sentence ν je v T nevyvratitelná.
V první části jsme Σ-korektnost použili pouze k tomu, abychom tvrdili, že teorie T
je bezesporná. V první části důkazu jsem vlastně ověřili, že sentence ν je v T nedo-E
kazatelná, je-li T bezesporná, což je fakt, který za chvíli, v důkazu Druhé Gödelovy
věty, ještě použijeme. Podstatnou částí důkazu Druhé Gödelovy věty bude formalizace
první části důkazu První Gödelovy věty, tj. důkaz sentence Prτ (ν) → ¬Con(τ)
v Peanově aritmetice.
Věta 4.5.5 (Druhá Gödelova o neúplnosti) Nechť T je bezesporná teorie obsahující
Peanovu aritmetiku a nechť τ(z) je Σ-formule, která deﬁnuje v N množinu
T. Pak T Con(τ).
Důkaz Vezměme sentenci ν, která splňuje podmínku
1: PA ν ≡ ¬Prτ (ν).
Jak jsme před chvílí poznamenali, předpoklad o bezespornosti teorie T stačí k tvrzení,
že sentence ν je nedokazatelná v T:
2: T ν.
4.5 Autoreference, Druhá Gödelova věta 351
Vezměme z ekvivalence (1) jen jednu implikaci a uvažujme, co lze dále v PA, a tedy
i v T, dokázat o sentenci ν a o případném důkazu sporu:
3: PA Prτ (ν → ¬Prτ (ν)) ; 1, D1
4: PA Prτ (ν) → Prτ (¬Prτ (ν)) ; 3, D2
5: PA Prτ (ν) → Prτ (Prτ (ν)) ; D3
6: PA Prτ (Prτ (ν)) → (Prτ (¬Prτ (ν)) → ¬Con(τ)) ; Lemma 4.5.4
7: PA Prτ (ν) → ¬Con(τ) ; 4, 5, 6
8: PA Con(τ) → ν ; 7, 1
9: T Con(τ) ; 8, 2.
QED
Z předchozího výkladu je jasné, že deﬁnují-li dvě formule v N tutéž množinu,
nemusí to znamenat, že v dané teorii T lze dokázat jejich ekvivalenci. Explicitně to
bylo řečeno ve cvičení 3 oddílu 4.3. Tento fakt naznačuje, že formule tvaru Prτ (x)
a sentence tvaru Con(τ) utvořené z různých formulí τ(z) mohou být v dané teorii T
neekvivalentní, přestože ony různé formule τ(z) deﬁnují v N tutéž množinu T.
Ve cvičení 6 je zdůvodněno, že toto se opravdu děje: existují formule τ1(z) a τ2(z)
takové, že obě deﬁnují v N množinu PA (tj. každá z nich je Σ-deﬁnicí množiny všech
axiomů Peanovy aritmetiky), ale v PA nelze dokázat sentenci Con(τ1) ≡ Con(τ2).
Tím vším chceme říci, že dané teorii T lze více způsoby popsat její vlastní množinu
axiomů a v dané teorii lze také více způsoby vyjádřit její vlastní bezespornost.
Věta 4.5.5 tvrdí, že sentence Con(τ) vyjadřující bezespornost teorie T je v T vždy
nedokazatelná, pokud ovšem dodržíme podmínku, že τ je Σ-deﬁnicí množiny T.
Pro jistotu znovu připomeňme, že Σ-deﬁnice množiny T existuje právě tehdy, je-li
T rekurzívně axiomatizovatelná.
Druhou Gödelovu větu lze stručně formulovat takto: v žádné dostatečně silné
rekurzívně axiomatizovatelné teorii nelze dokázat její vlastní bezespornost. Přitom
„dostatečně silná pro náš text znamená „obsahující Peanovu aritmetiku . Je
známo, že Druhou Gödelovu větu lze v tomto ohledu značně zobecnit. Například
pouhým prověřením příslušných partií této kapitoly lze zjistit, že věta 4.5.5 platí
pro všechny teorie T obsahující teorii IΣ1, o které jsme mluvili ve cvičeních oddílů
4.3 a 4.4. Zájemce o zobecnění Druhé Gödelovy věty odkazujeme na tytéž zdroje,
o kterých jsme se už zmínili na konci oddílu 4.2, tj. na články Pudláka, Wilkieho a
Parise, případně na Hájkovu a Pudlákovu monograﬁi [31].
Mezi více Σ-formulemi, které deﬁnují v N množinu všech axiomů Peanovy aritmetiky,
je i formule π(z), která axiomy Peanovy aritmetiky popisuje jako devět
axiomů Robinsonovy aritmetiky plus všechny instance schématu indukce a které
můžeme říkat přirozená deﬁnice množiny všech axiomů Peanovy aritmetiky. Na
formuli π(z) se ovšem věta 4.5.5 vztahuje také. Platí tedy PA Con(π). To
je odpověď na otázku, kterou jsme od konce oddílu 4.2 opakovaně připomínali.
Věta 4.5.2 vylučuje možnost dokázat sentenci Con(π) pomocí uniformní deﬁnice
352 4 Peanova a Robinsonova aritmetika
pravdy. Věta 4.5.5 tuto možnost vylučuje absolutně, tj. bez ohledu na to, jaké
prostředky bychom v důkazu snad použili.
Z věty 4.2.13 víme, že sentence ¬Con(π) není dokazatelná v PA. Věta 4.5.5 tedy
poskytuje odpověď na otázku, kterou jsme v závěru oddílu 4.3 formulovali trochu
jinak a která zní: je-li Peanova aritmetika neúplná, kde je tedy nějaký zajímavý
příklad nezávislé sentence? Teorie, jejímiž axiomy jsou Q1–Q9 a všechny instance
schématu indukce, je bezesporná, je příkladem takové sentence.
Lze namítnout, že ještě zajímavější než sentence o důkazech sporu by byla nezávislá
sentence o přirozených číslech. Podrobněji lze tuto námitku formulovat
následovně. Přirozená čísla jsou pro logiky zajímavá nikoliv jako čísla, nýbrž především
jako kódy syntaktických objektů. Logikové vlastně přirozená čísla tak trochu
zneužívají. Lze nezávislost na Peanově aritmetice dokázat pro nějakou sentenci,
která je zajímavá i pro nelogiky? Odpověď zní ano. V kapitole [63] knihy [4] je
nezávislost na Peanově aritmetice dokázána pro kombinatorické tvrzení, které je
zobecněním Ramseyovy věty. Termín „matematický v názvu práce [63] je myšlen
jako protiklad k „logický . Později vznikla celá řada výsledků tohoto druhu.
Některé jsou reprodukovány v knihách [47] a [31], tam lze nalézt i další odkazy.
Obzvláště zajímavé příklady tvrzení nezávislých na PA, jejichž obsah (nikoliv ale
důkaz nezávislosti) lze snadno vysvětlit a pochopit, se studují v článku [48]. Jeden
z těchto příkladů je také vyložen v knize [85].
Vzpomeňme si, že věty o neúplnosti jsme nejprve (viz 4.3.11 a 4.3.12) formulovali
pro teorii T s aritmetickým jazykem splňující předpoklad N |= T. Později jsme
předpoklad N |= T nahradili Σ-korektností nebo bezesporností a uvědomili jsme si,
že nevadí, obsahuje-li jazyk L teorie T kromě šesti symbolů aritmetického jazyka
ještě další symboly. V tom případě můžeme totiž deﬁnovat aritmetické formule
jazyka L jako formule jazyka L neobsahující žádný z těchto dalších symbolů. K důkazu
neúplnosti teorie T pak stačí ukázat nezávislou aritmetickou sentenci, v deﬁnici
Σ-korektnosti (a vlastně i bezespornosti) stačí mluvit jen o aritmetických sentencích
a v úvahách o m-převeditelnosti lze také vystačit s funkcemi, jejichž všechny
hodnoty jsou aritmetické sentence. Nejdůležitější věty (zejména 4.4.11 a 4.5.5) se
pak vztahují na teorie, které jsou dostatečně silnými (ve smyslu „bohatství jazyka
a „síla axiomů ) teoriemi univerza přirozených čísel.
Věty 4.4.11 a 4.5.5 lze snadno zobecnit ještě dále. Stejně jako nevadí, jsou-li
v jazyce teorie T nějaké další symboly, nevadí ani, jsou-li v jejím univerzu kromě
přirozených čísel ještě další objekty. Stačí, máme-li v jazyce L teorie T formuli δ(x),
kterou můžeme číst objekt x je přirozené číslo, neboli můžeme-li ze všech objektů
teorie T přirozená čísla vyčlenit pomocí vhodné formule δ(x). Aritmetické formule
pak můžeme deﬁnovat jako formule jazyka L, které s užitím pouze aritmetických
symbolů mluví pouze o objektech splňujících podmínku δ(x). Jinak řečeno, s užitím
terminologie z oddílu 3.6, máme-li formuli δ(x) a překlad symbolů z aritmetického
jazyka do jazyka L, můžeme aritmetické formule jazyka L deﬁnovat jako všechny
formule tvaru ϕ∗
, kde ∗ je příslušný překlad formulí. Tím jsme zdůvodnili, že
Rosserova věta a všechny naše varianty První Gödelovy věty platí pro všechny
teorie T, ve kterých je interpretovatelná Robinsonova aritmetika, kdežto Druhá
4.5 Autoreference, Druhá Gödelova věta 353
Gödelova věta platí pro všechny teorie T, ve kterých je interpretovatelná Peanova
aritmetika.
Protože v ZF nebo v GB lze z univerza všech množin resp. tříd vyčlenit přirozená
čísla formulí množina (resp. třída) x je ordinální číslo menší než první limitní
číslo a operace a relace aritmetického jazyka lze interpretovat jako ordinální operace
a relace na takto vyčleněných objektech, vztahují se Rosserova věta i Gödelovy
věty i na teorie ZF a GB a také na další varianty teorie množin. Tyto teorie jsou
tedy podstatně nerozhodnutelné a nezúplnitelné pomocí rekurzívní množiny dodatečných
axiomů. Z nerozhodnutelnosti a konečné axiomatizovatelnosti teorie GB
plyne postupem stejným jako v důkazu věty 4.4.9, že množina všech logicky platných
formulí v jazyce {∈} je algoritmicky nerozhodnutelná. Platí GB Con(GB);
deﬁnujeme-li přirozenou deﬁnici zf(z) teorie ZF jako formuli, která axiomy teorie ZF
popisuje jako několik jednotlivých axiomů a všechny instance schématu vydělení a
schématu nahrazení, platí také ZF Con(zf). Z toho a z (důkazu) věty 3.6.19 je
jasné, že PA Con(GB) a PA Con(zf). Na druhé straně, uvnitř ZF i GB víme,
že každá teorie, která má model, je bezesporná, a také že struktura sestávající ze
všech ordinálních čísel menších než první limitní ordinální číslo splňuje axiomy Q1–Q9 a
všechny instance schématu indukce. To znamená, že sentence Con(π) vyjadřující bezespornost
Peanovy aritmetiky je dokazatelná v ZF i v GB. Bez důkazu uveďme, že
Gödelova-Bernaysova teorie množin je vůči aritmetickým (i vůči množinovým) sentencím
konzervativní nad Zermelovou-Fraenkelovou teorií množin a že existují důkazy
tohoto faktu, které lze formalizovat v PA. Platí tedy PA Con(zf)→Con(GB).
Všimněme si, že ordinální čísla menší než první limitní číslo hrála v předchozím
odstavci dvojí úlohu. Jednak tvořila obor interpretace (díky níž jsme mohli tvrdit,
že každá sentence dokazatelná v PA je dokazatelná i v ZF či v GB) a dále tvořila
nosnou množinu modelu (formalizované) teorie {z ; π(z)} (díky němuž jsme uvnitř
teorie množin mohli tvrdit, že formalizovaná Peanova aritmetika popsaná formulí π
je bezesporná).
V oddílu 3.2 jsme v souvislosti s tzv. Skolemovým paradoxem poznamenali, že
není známa žádná přímá konstrukce modelu teorie množin. Druhá Gödelova věta
(spolu s faktem, že věta o silné úplnosti je formalizovatelná v teorii množin) vysvětluje,
proč tomu tak je: pokud „přímá znamená „formalizovatelná v teorii množin ,
pak taková konstrukce určitě neexistuje, neboť by znamenala důkaz bezespornosti
teorie množin uvnitř teorie množin.
Ještě se zmiňme o tom, jak Druhá Gödelova věta souvisí s Hilbertovým programem.
Následující odstavce jsou založeny hlavně na úvodní části kapitoly [78]
a na článku [81]. Čtenáři s hlubším zájmem o Hilbertův program a historii logiky
článek [81] vřele doporučujeme; je psán velmi čtivě a jsou v něm uvedeny další
užitečné odkazy.
Některé z mnoha pěkných důkazů, které objevil D. Hilbert, byly ve své době kritizovány
jako takzvaně neﬁnitní či nekonstruktivní. O Hilbertově řešení Gordanova
problému v teorii invariantů Gordan sám prohlásil, že je to teologie, což pravděpodobně
myslel pejorativně. Hilberta tato kritika mrzela a snažil se (úspěšně)
napadené důkazy nahradit (většinou pracnějšími) ﬁnitními. Protože ale myslel dál
354 4 Peanova a Robinsonova aritmetika
než jen na jednotlivé případy a také proto, že aktivity svých kritiků pravděpodobně
(viz [81]) pokládal za nebezpečí pro matematiku, kterému je třeba čelit, uvažoval o
možnosti dokázat, že takové nahrazení nekonstruktivního důkazu důkazem ﬁnitním
je vždy možné. Podrobněji řečeno, v matematice lze rozlišit tvrzení reálná či ﬁnitní
od tvrzení ideálních (která například mluví o nekonečných mohutnostech nebo obsahují
střídající se kvantiﬁkátory). Hilbert soudil, že ideální tvrzení představují
zbytečné, avšak zpravidla pohodlné a účinné okliky. Podobně jako nemůžeme počítáním
s komplexními čísly odvodit žádnou novou rovnost týkající se reálných čísel,
nemůžeme ani pomocí ideálních tvrzení dokázat žádná nová ﬁnitní tvrzení. Transﬁnitní
matematika, tj. matematika, v níž máme co dělat s ideálními tvrzeními, je
konzervativním rozšířením ﬁnitní matematiky.
První verze Hilbertova programu byla formulována v Hilbertově přednáškovém
cyklu v Hamburku v červenci 1921 a zněla dokázat bezespornost aritmetiky ﬁnitními
prostředky. Aritmetikou se přitom mínila veškerá tehdejší matematika zahrnující
i teorii množin („aritmetika tedy rozhodně neznamenalo „Peanova aritmetika ),
kdežto ﬁnitní prostředky zahrnovaly indukci a můžeme si je dnes představit jako
Peanovu aritmetiku nebo některý její fragment. Hilbertův program tedy můžeme
chápat jako plán dokázat bezespornost teorie množin v Peanově aritmetice. Za
součást Hilbertova programu lze pokládat i zpřesnění pojmu důkazu tak, aby se
dosáhlo kontrolovatelnosti výsledků matematických úvah, čili aby se pojem důkazu
stal ﬁnitním pojmem. Hilbert sám nazýval svůj plán teorie důkazů.
Není úplně jasné, proč konzervativnost transﬁnitní matematiky nad ﬁnitní matematikou
byla ve formulaci Hilbertova programu nahrazena pouhou bezesporností
(aritmetiky neboli) transﬁnitní matematiky. Jedno možné vysvětlení je takové, že
Hilbert přikládal důkazům bezespornosti velký význam, neboť byl přesvědčen, že
důkaz bezespornosti nějaké teorie T je zároveň důkazem, že objekty popsané axiomy
teorie T existují. Bezespornost pokládal za kritérium existence. Druhý možný
důvod naznačuje cvičení 9: pokud se rozhodneme, že ﬁnitní tvrzení jsou přesně ta,
která lze vyjádřit aritmetickými Π1-sentencemi, pak důkaz v PA, že nějaké rozšíření
T Peanovy aritmetiky je bezesporné, je zároveň důkazem, že teorie T je nad PA
konzervativní vůči ﬁnitním tvrzením. Toto cvičení má ovšem smysl pouze v situaci,
kdy ještě nevíme o platnosti Druhé Gödelovy věty, jinak je triviální.
Hilbertův program pozitivně ovlivnil rozvoj logiky a o té jeho části, která požadovala
zpřesnění a formalizaci pojmu důkazu, lze říci, že se úspěšně podařila.
Teorie důkazů (v [94] se říká strukturální teorie důkazů) je dnes uznávanou logickou
disciplínou. Na druhé straně, pokud Hilbertův program chápeme tak, jak bylo
vysvětleno, čili jako plán dokázat v Peanově aritmetice bezespornost teorie množin,
pak Druhá Gödelova věta znamená, že Hilbertův program je neproveditelný.
Nejenže v PA nelze dokázat bezespornost teorie množin, nelze v ní dokázat dokonce
ani bezespornost samotné Peanovy aritmetiky. Nejenže v PA nelze dokázat
bezespornost teorie množin, ale ani veškerý aparát teorie množin nestačí k důkazu
bezespornosti teorie množin. Teorie množin není konzervativním rozšířením Peanovy
aritmetiky, neboť sentence Con(π) je dokazatelná v teorii množin, ale nikoliv
v Peanově aritmetice (a přitom navíc vyjadřuje ﬁnitní tvrzení). Druhá Gödelova
4.5 Autoreference, Druhá Gödelova věta 355
věta ale znamená více než neproveditelnost Hilbertova programu. Domníváme se,
že Druhá Gödelova věta také ruší či alespoň velmi problematizuje pojem ﬁnitního
tvrzení a ﬁnitního důkazu. Ať bychom ﬁnitní důkazy deﬁnovali jakkoliv, pravděpodobně
by je bylo možné ztotožnit s důkazy formalizovatelnými v nějaké (představujme
si slabé) axiomatické teorii. Když ale taková teorie T splňuje známé a
nepříliš náročné podmínky, je podezřelá z toho, že je sporná. Jinak řečeno, pokud
obrat „ﬁnitní důkazové prostředky má znamenat něco, co je ne zcela triviální a
přitom nezpochybnitelné čili jistě bezesporné, pak nic takového neexistuje. Snad
kdybychom klasickou logiku nahradili nějakou jinou . . . Vraťme se ale raději na
zem, logika — ani klasická — nekončí Druhou Gödelovou větou.
Aplikujme větu 4.4.14 na funkci α → ¬α: existuje Σ1-formule γ(x, y) taková,
že
Q ∀y γ(α, y) ≡ y = ¬α (∗)
pro každou aritmetickou formuli α. Nechť jako obvykle τ(z) je Σ-deﬁnice nějakého
rozšíření Peanovy aritmetiky. Vezměme za ψ(x) formuli
∀z(Proofτ (x, z) → ∃v≤z ∃y(γ(x, y) & Proofτ (y, v)))
a užijme na ni větu o autoreferenci: existuje sentence ρ taková, že
Q ρ ≡ ∀z(Proofτ (ρ, z) → ∃v≤z ∃y(γ(ρ, y) & Proofτ (y, v))). (∗∗)
Z podmínek (∗) a (∗∗) plyne
Q ρ ≡ ∀z(Proofτ (ρ, z) → ∃v≤z Proofτ (¬ρ, v)).
Platí ρ ∈ Π1(PA). Sentenci ρ říkejme Rosserova sentence příslušná k formuli τ(z)
resp. k teorii T. Než vyslovíme vlastnosti sentence ρ, všimněme si ještě, že předchozí
úvaha o funkci α → ¬α a formuli γ znamená, že větu o autoreferenci lze trochu
zobecnit. Nejenže každá rovnice tvaru Q ϕ≡ψ(ϕ) má řešení, ale i všechny rovnice
tvaru Q ϕ ≡ ψ(ϕ, ¬ϕ) či Q ϕ ≡ ψ(¬ϕ) mají řešení pro každou volbu formule ψ.
Věta 4.5.6 (Rosserova) Nechť T je bezesporná teorie obsahující Peanovu aritmetiku
a nechť τ(z) je Σ-formule, která deﬁnuje v N množinu T. Nechť ρ je
sentence splňující podmínku Q ρ ≡ ∀z(Proofτ (ρ, z) → ∃v≤z Proofτ (¬ρ, v)). Pak
ρ je nezávislá na T. Navíc platí PA Con(τ) → ¬Prτ (ρ) & ¬Prτ (¬ρ).
Důkaz Nechť T je bezesporná, a přitom některá ze sentencí ρ a ¬ρ je v T dokazatelná.
Vezměme nejmenší číslo m, které je důkazem kterékoliv ze sentencí ρ a ¬ρ.
Je-li m důkazem sentence ρ, platí
N |= ∃z(Proofτ (ρ, z) & ∀v≤z ¬Proofτ (¬ρ, v)), (1)
v opačném případě platí naopak
N |= ∃v(Proofτ (¬ρ, v) & ∀z<v¬Proofτ (ρ, z)). (2)
356 4 Peanova a Robinsonova aritmetika
Sentence v (1) je sentence ¬ρ. Sentenci v (2) označme σ. Obě sentence ¬ρ i σ jsou
Σ-sentence. Platí-li (1), čili při probírání přirozených čísel jedno po druhém je dřív
nalezen důkaz sentence ρ než důkaz sentence ¬ρ (přičemž druhý z nich možná ani
neexistuje), pak T ρ. Na druhé straně Σ-úplnost užitá na (1) dává T ¬ρ. Dále
si všimněme, že platí
PA σ → ρ. (3)
Platí-li (2), pak T ¬ρ, ale Σ-úplnost užitá na (2) a podmínka (3) dávají T ρ.
Alternativa „(1) nebo (2) , tj. předpoklad, že některá ze sentencí ρ a ¬ρ je v T
dokazatelná, je tedy ve sporu s předpokladem, že teorie T je bezesporná. Tím je
dokončen důkaz první části věty. Důkaz druhé části je formalizací důkazu první
části. Použijeme podmínky
PA ¬ρ → Prτ (¬ρ), PA σ → Prτ (σ) a PA Prτ (σ → ρ). (4)
Přitom první dvě podmínky platí díky větě o formalizované Σ-úplnosti, přesněji
řečeno díky podobné úvaze, jako když jsme v důkazu věty 4.4.16 dokazovali platnost
podmínky D3, třetí plyne z (3) užitím podmínky D1. Uvažujme v PA:
Nechť Prτ (ρ) nebo Prτ (¬ρ), tj. některá ze sentencí ρ a ¬ρ má důkaz. Je-li některý
důkaz sentence ρ menší než jakýkoliv důkaz sentence ¬ρ, pak ¬ρ. Z ¬ρ na
jedné straně plyne Prτ (ρ), na druhé straně první podmínka v (4) dává Prτ (¬ρ).
Tedy ¬Con(τ). Je-li naopak některý důkaz sentence ¬ρ menší než jakýkoliv
důkaz sentence ρ, pak σ. Ze σ na jedné straně plyne Prτ (¬ρ), na druhé straně
zbývající dvě podmínky v (4) a podmínka D2 dávají Prτ (ρ). Tedy opět ¬Con(τ).
QED
Rosserova věta stejně jako První Gödelova věta poskytuje konstrukci nezávislé
sentence. Přitom jde o konstrukci, která funguje i pro nekorektní teorie, a navíc
důkazy obou faktů T ρ a T ¬ρ lze formalizovat v PA. Vzpomeňme si, že
v případě Gödelovy sentence ν to bylo trochu jinak. Tam jsme formalizovali důkaz
faktu, že T ν, a tím jsme vlastně dokázali Druhou Gödelovu větu. Důkaz faktu
„když T je Σ-korektní, pak T ¬ν jsme se formalizovat nepokusili. Avšak ve
cvičení 16 je alespoň ukázáno, jak lze předpoklad o Σ-korektnosti vyslovit v aritmetickém
jazyce.
Věta 4.5.7 Peanova aritmetika není konečně axiomatizovatelná.
Důkaz Nechť F ⊆ PA je konečná množina sentencí a přitom F a PA jsou ekvivalentní
teorie. Pak formule [F](z) a teorie F splňují předpoklady Druhé Gödelovy
věty. Tedy F Con(F). Protože F a PA jsou ekvivalentní, máme PA Con(F).
To je ale ve sporu s tvrzením 4.4.22. QED
Větu 4.5.7 dokázal Ryll-Nardzewski. Připomeňme, že ve cvičeních oddílu 4.4
jsme uvedli jiný důkaz tohoto tvrzení. Důkaz, který jsme uvedli nyní, ukazuje, že
Druhá Gödelova věta je nejen „ﬁnálním produktem , tj. poučným a nečekaným
4.5 Autoreference, Druhá Gödelova věta 357
výsledkem, který zajímá i nelogiky, ale také užitečným technickým prostředkem,
který lze použít v některých důkazech. Tohoto aspektu se ještě chvíli přidržme.
Následující věta je uvedena v článku [20].
Věta 4.5.8 (a) Nechť T a S jsou rekurzívně axiomatizovatelné teorie obsahující
Peanovu aritmetiku a nechť T je interpretovatelná v S. Pak ke každé Σ-deﬁnici σ
teorie S existuje Σ-deﬁnice τ teorie T taková, že PA Con(σ) → Con(τ).
(b) Nechť T je bezesporná teorie obsahující Peanovu aritmetiku a nechť τ je její
Σ-deﬁnice. Pak teorie (T + Con(τ)) není interpretovatelná v T.
Důkaz Budeme v PA formalizovat důkaz věty 3.6.19. Nechť σ(z) je daná Σ-deﬁnice
teorie S. Nechť je dána interpretace teorie T v teorii S a nechť ∗ je příslušný
překlad formulí. Nechť γ(y, x) je Σ-formule, která reprezentuje funkci ϕ → ϕ∗
:
PA ∀x γ(ϕ, x) ≡ x = ϕ∗ (1)
pro každou formuli ϕ v jazyce teorie T. Stejným právem jako v 4.2.11(c) můžeme
předpokládat, že formule γ navíc splňuje podmínku
PA ∀y∃!xγ(y, x). (2)
Stejně jako v důkazu věty 3.6.19 (tj. přeříkáním uvnitř PA) lze ověřit, že
PA ∀z∀y∀x(LogAx(z) & UnivClo(z, y) & γ(y, x) → Prσ(x)). (3)
Uvnitř PA tedy víme, že univerzální uzávěry všech logických axiomů se překladem ∗
přeloží na formule dokazatelné v teorii σ. Totéž bychom chtěli tvrdit o vlastních
axiomech teorie T. S vlastními axiomy teorie T ale máme tuto potíž: fakt, že
všechny axiomy teorie T se překladem ∗ přeloží na formule dokazatelné v teorii
S, je dán podmínkou věty a nemáme k němu žádný důkaz, který bychom
mohli formalizovat uvnitř PA. To je mimochodem také důvod, proč netvrdíme
PA Con(σ) → Con(τ) pro libovolnou Σ-deﬁnici τ teorie T, tvrdíme pouze, že existuje
taková Σ-deﬁnice τ. Protože teorie T je rekurzívně axiomatizovatelná, můžeme
zvolit její Σ-deﬁnici τ0(z). Formuli τ(z) deﬁnujme takto:
τ0(z) & ∃x∃y(UnivClo(z, y) & γ(y, x) & Prσ(x)).
To je evidentně Σ-formule. Když ϕ je axiom teorie T, pak platí N |= UnivClo(ϕ, ϕ),
a také N |= γ(ϕ, ϕ∗). Navíc z předpokladu S ϕ∗
plyne N |= Prσ(ϕ∗). To znamená,
že formule τ(z) stejně jako formule τ0(z) deﬁnuje v N množinu T. Uvnitř PA
jsme se tedy rozhodli, že připustíme pouze takové axiomy, jejichž překlad je dokazatelný
z množiny předpokladů {z ; Sent(z)&σ(z)}. Tím jsme sice možná vyloučili
některé z prvků množiny { z ; Sent(z) & τ0(z) }, nikoliv ale sentence ϕ takové,
že ϕ ∈ T. Z tvrzení 4.2.11(c) týkajícího se formule UnivClo a z podmínky (2) plyne
PA ∀z∀y∀x(Sent(z) & τ(z) & UnivClo(z, y) & γ(y, x) → Prσ(x)). (4)
Podmínky (3) a (4) říkají, že univerzální uzávěry všech logických axiomů i všech
vlastních axiomů teorie τ se přeloží na formule dokazatelné v teorii σ. V PA lze
358 4 Peanova a Robinsonova aritmetika
dále snadno ověřit, že množina všech formulí, jejichž univerzální uzávěry se přeloží na
formule dokazatelné v teorii σ, je uzavřená na odvozovací pravidla. To vše znamená,
že univerzální uzávěry všech formulí dokazatelných v teorii τ se přeloží na formule
dokazatelné v teorii σ a také že případný spor v teorii τ se přeloží na spor v teorii σ.
Opravdu tedy platí, že je-li τ sporná, pak i σ je sporná.
V (b) postupujme sporem. Nechť τ je Σ-deﬁnice teorie T obsahující PA a nechť
teorie (T + Con(τ)) je interpretovatelná v teorii T. Dle již dokázaného tvrzení (a)
k formuli τ existuje formule θ(z), která je Σ-deﬁnicí teorie (T +Con(τ)) a pro kterou
platí PA Con(τ) → Con(θ), tedy (T + Con(τ)) Con(θ). Je-li teorie (T + Con(τ))
bezesporná, máme spor s Druhou Gödelovou větou pro teorii (T + Con(τ)) a formuli
θ. Je-li sporná, máme spornou teorii, která je interpretovatelná v bezesporné,
čili spor s větou 3.6.19. QED
Tvrzení (b) předchozí věty lze chápat jako zesílení Druhé Gödelovy věty. Nejen
že sentence teorie T je bezesporná je v teorii T nedokazatelná. Přidáme-li ji k T
jako nový axiom, dostaneme teorii, která je o dost silnější než původní teorie T
v tom smyslu, že pomocí interpretace nelze dokázat její relativní bezespornost vůči
teorii T.
Nechť M je struktura pro libovolný jazyk L. Řekneme, že množina A ⊆ M je
parametricky deﬁnovatelná ve struktuře M, jestliže existuje formule ϕ(x, y1, . . , yr)
v L a prvky b1, . . , br struktury M takové, že A = { a ∈ M ; M |= ϕ[a, b] }. Protože
tato deﬁnice připouští i případ r = 0, je jasné, že každá množina deﬁnovatelná
v M je současně také parametricky deﬁnovatelná v M. Snadno lze ověřit (cvičení),
že pro strukturu N (a obecně pro každou strukturu M, jejíž každý prvek
je v M deﬁnovatelný) naopak platí, že každá množina, která je v ní parametricky
deﬁnovatelná, je v ní i deﬁnovatelná.
Nechť M je model Peanovy aritmetiky. Řekneme, že množina A ⊆ N je
standardní množinou modelu M, jestliže existuje aritmetická formule ϕ(x, y) a
prvky b1, . . , br modelu M takové, že A = { n ; M |= ϕ(n, y)[b] }. Jinými slovy,
množina A je standardní množinou modelu M, je-li průnikem nějaké množiny parametricky
deﬁnovatelné v M se standardní částí modelu M. Množinu všech standardních
množin modelu M značíme SSy(M). Množině SSy(M) se říká standardní
systém modelu M nebo také Scottova množina modelu M. Je zřejmé, že standardní
množiny struktury N jsou přesně ty, které jsou v N (parametricky nebo
neparametricky) deﬁnovatelné, čili přesně ty, které jsou aritmetické. Více nás ale
budou zajímat standardní množiny nestandardních modelů Peanovy aritmetiky.
V kapitole 2 jsme pracovali s posloupností p všech prvočísel. Nyní budeme potřebovat
formalizovanou posloupnost všech prvočísel, čili Σ-formuli, která říká číslo y
je x-té prvočíslo a která má vlastnost, že utvoříme-li s její pomocí a s pomocí formule
Prime(x) sentence číslo 2 je 0-tým prvočíslem a pro každé x je (x+1)-ní prvočíslo
nejmenším prvočíslem větším než x-té prvočíslo, obě tyto sentence jsou dokazatelné
v PA. Pišme p(x) pro x-té (formální) prvočíslo. V PA je jasné, že funkce p souhlasí
s funkcí p na standardních argumentech, což lze schematicky vyjádřit podmínkou
∀n(PA p(n) = p(n)). Schematicky proto, že v aritmetickém jazyce nemáme
4.5 Autoreference, Druhá Gödelova věta 359
term p(x). Takto jsme ale už postupovali mnohokrát, viz komentář za větou 4.2.5.
Následující lemma tvrdí mimo jiné, že v deﬁnici standardní množiny lze vystačit
s počtem parametrů r rovným jedné, a dokonce lze vystačit s jedinou formulí ϕ(x, y)
společnou pro všechny standardní množiny, totiž s formulí když u je x-té prvočíslo,
pak u | y, kterou schematicky zapisujeme p(x) | y.
Lemma 4.5.9 Nechť M je nestandardní model Peanovy aritmetiky. Pak
(a) Pro každou množinu A ∈ SSy(M) existuje formule ϕ(x, y) a prvek b ∈ M
takové, že A = { n ; M |= ϕ(n, y)[b] }.
(b) Množina SSy(M) je uzavřena na sjednocení, průnik a komplement.
(c) Když A ∈ SSy(M), pak existuje b ∈ M takový, že A = {n; M |= (p(n) | y)[b]}.
(d) Množina SSy(M) obsahuje i (nějaké) nerekurzívní množiny.
Důkaz Platí-li A = { n ; M |= ϕ(n, y)[b1, . . , br] }, pak místo formule ϕ lze vzít
formuli ∃v1 . . ∃vr(y = v1, . . , vr & ϕ(x, v)) s volnými proměnnými x a y a místo
r parametrů b1, . . , br lze vzít jeden parametr b = b1, . . , br . Lomené závorky
v obou případech odkazují k formalizovanému kódování posloupností. Tím je dokázáno
tvrzení (a).
V (c) předpokládejme, že standardní množina A = { n ; M |= ϕ(n, z)[b1] } je dána
formulí ϕ(x, z) a ohodnocením b1 proměnné z. Indukcí podle t lze ověřit, že
M |= ∀t∃y∀x(p(x) | y ≡ ϕ(x, z) & x < t)[b1].
To znamená, že pro každé ohodnocení a proměnné t existuje ohodnocení b2 proměnné
y tak, že
M |= ∀x(p(x) | y ≡ ϕ(x, z) & x < t)[a, b1, b2].
Zvolíme-li a nestandardní, čili větší než všechna x tvaru n, a zvolíme-li k němu
příslušné b2, máme
∀n(M |= (p(n) | y ≡ ϕ(n, z))[b1, b2]),
a také
∀n(M |= (p(n) | y)[b2] ⇔ M |= ϕ(n, z)[b1]).
Opravdu tedy platí A = { n ; M |= (p(n) | y)[b2] } pro vhodné ohodnocení b2 proměnné
y.
V (d) postupujme podobně jako v důkazu věty 4.4.11. Vezměme dvě disjunktní rekurzívně
spočetné množiny A a B takové, že každá rekurzívně spočetná nadmnožina
jedné z nich disjunktní s druhou je Σ1-kompletní. Stejně jako v důkazu věty 4.4.11
k množinám A a B existuje formule θ(x) taková, že PA θ(n) pro všechna n ∈ A
a PA ¬θ(n) pro všechna n ∈ B. Pak množina { n ; M |= θ(n) } je standardní
množina modelu M, která je nadmnožinou množiny A disjunktní s množinou B.
Netvrdíme o ní, že je rekurzívně spočetná. Určitě je ale nerekurzívní. QED
360 4 Peanova a Robinsonova aritmetika
V následující větě uvažujeme o tom, zda operace +M
a ·M
nějakého nestandardního
modelu M Peanovy aritmetiky mohou být rekurzívní. Protože otázka po
rekurzívnosti má smysl pouze pro množiny přirozených čísel a relace na přirozených
číslech, uvažujeme o nestandardních modelech, jejichž nosná množina je množina N
všech přirozených čísel. Množina N tedy ve větě 4.5.10 hraje dvojí roli: jednak je
nosnou množinou modelu M, jednak ji lze homomorﬁsmem n → nM
izomorfně
zobrazit na podstrukturu (standardní část) modelu M. Je-li N nosnou množinou
modelu M, pak operace +M
a ·M
nemusí mít nic společného s obvyklými operacemi
+ a · na přirozených číslech, tj. s operacemi +N
a ·N
struktury N. V důkazu
věty 4.5.10 budeme kromě formalizované posloupnosti všech prvočísel potřebovat
ještě jednu formalizovanou funkci, totiž mocninu. Pišme exp(y, x) tam, kde bychom
ve skutečnosti (na metamatematické úrovni) psali yx
. Z vlastností funkce exp budeme
potřebovat zejména tuto: PA ∀x1∀x2∀y(exp(y, x1 ·x2) = exp(exp(y, x1), x2).
Věta 4.5.10 (Tennenbaumova) Nechť M = N, +M
, ·M
, 0M
, SM
, ≤M
, <M
je
nestandardní model Peanovy aritmetiky. Pak každá z operací +M
a ·M
je nerekur-
zívní.
Důkaz Předpokládejme, že +M
je rekurzívní. Zdůvodníme, že v tom případě
každá množina A ∈ SSy(M) je rekurzívně spočetná. Vzhledem k uzavřenosti množiny
SSy(M) na komplement (viz 4.5.9(b)) a Postově větě to znamená, že každá
množina A ∈ SSy(M) je rekurzívní. To je ale spor s tvrzením 4.5.9(d). Nechť
tedy A ∈ SSy(M) je dána. Podle tvrzení 4.5.9(c) existuje prvek b modelu M takový,
že A = { n ; M |= (p(n) | y)[b] }. Protože funkce p souhlasí na standardních
argumentech se skutečnou posloupností p všech prvočísel, máme
n ∈ A ⇔ M |= (p(n) | y)[b]
⇔ ∃d(p(n)
M
·M
d = b)
⇔ ∃d(d +M
d +M
. . +M
d
p(n) sčítanců
= b).
(∗)
Je-li funkce +M
rekurzívní, pak podmínka uvedená v závorce v posledním řádku
ekvivalencí (∗) je rekurzívní, a množina A je tedy rekurzívně spočetná vzhledem
k implikaci ⇐ ve větě 2.2.25.
Uvažujme o násobení ·M
modelu M. Nemůžeme jednoduše říci, že je-li ·M
rekurzívní,
pak podmínka uvedená v závorce v prostředním řádku ekvivalencí (∗) je
rekurzívní. K tomu bychom potřebovali vědět, že funkce n → p(n)M
je rekurzívní.
Postupujme tedy trochu jinak. Vezměme c ∈ N takové, že c = expM
(2, b). Platí
n ∈ A ⇔ ∃d(expM
(2, p(n)
M
·M
d) = c)
⇔ ∃d(expM
(expM
(2, d), p(n)
M
) = c)
⇔ ∃d(expM
(d, p(n)
M
) = c)
⇔ ∃d(d ·M
d ·M
. . ·M
d
p(n) činitelů
= c).
4.5 Autoreference, Druhá Gödelova věta 361
Přitom za zmínku stojí implikace ⇐ ve třetím řádku. Ta platí vzhledem k faktu,
který v modelu M nemůže být popřen: každý dělitel mocniny dvojky je opět mocnina
dvojky. Je-li násobení ·M
modelu M rekurzívní, opět jsme dospěli k závěru, že
množina A je rekurzívně spočetná. QED
Tennenbaumovu větu lze vyslovit také takto: je-li M spočetný model Peanovy
aritmetiky a zobrazíme-li jej na množinu N všech přirozených čísel nějakou vzájemně
jednoznačnou funkcí, pak ať to uděláme jakkoliv, operace +M
a ·M
modelu
M se zobrazí na nerekurzívní množiny. Tennenbaumova věta dává odpověď
na otázku uvedenou v závěru oddílu 4.1. Nestandardní model Peanovy aritmetiky
nelze sestrojit tak jednoduše, jako jsme sestrojili model Robinsonovy aritmetiky
z obrázku 4.1.1 na str. 284. Tento model má totiž rekurzívní sčítání i násobení.
Následující věta je věta o autoreferenci v množném čísle. Budeme ji potřebovat
v oddílu 5.3. Tvrzení 4.5.11(b) lze označit jako autoreferenci v čísle množném
konečném, nebo také jako větu o řešitelnosti n rovnic pro n neznámých sentencí.
Tvrzení (a) je autoreference v čísle množném nekonečném, neboť numerál ϕ ve
formuli ψ reprezentuje nekonečně mnoho neznámých sentencí ϕ(0), ϕ(1), ϕ(2), . . .
Věta 4.5.11 (a) Ke každé aritmetické formuli ψ(x, z) existuje aritmetická formule
ϕ(z) taková, že ∀k(Q ϕ(k) ≡ ψ(ϕ, k)).
(a) Ke každé n-tici aritmetických formulí ψ1(x1, . . , xn), . . , ψn(x1, . . , xn) existují E
aritmetické sentence λ1, . . , λn takové, že ekvivalence
λ1 ≡ ψ1(λ1, . . , λn), λ2 ≡ ψ2(λ1, . . , λn), . . , λn ≡ ψn(λ1, . . , λn)
jsou dokazatelné v Q.
Důkaz K důkazu tvrzení (a) stačí projít důkaz věty 4.5.1 a zkontrolovat, že volná
proměnná z nijak nevadí: vezmeme funkci α(x, z) → α(α, z) a formuli γ(x, y) která
ji reprezentuje, označíme χ(x, z) formuli ∃y(γ(x, y) & ψ(y, z)) a za ϕ(z) vezmeme
formuli χ(χ, z). Platí Q ∀z(ϕ(z) ≡ ψ(ϕ, z)), tedy také ∀k(Q ϕ(k) ≡ ψ(ϕ, k)).
Tvrzení (b) převedeme na tvrzení (a). Nechť formule ψ1(x), . . , ψn(x) jsou dány.
Deﬁnujme funkce fk pro 1 ≤ k ≤ n:
fk(α) =
α(k) když α(x) je formule s jednou volnou proměnnou
0 jinak,
a vezměme formule γ1(x, y), . . , γn(x, y), které reprezentují funkce f1, . . , fn. To
znamená, že pro každou formuli α(x) s jednou volnou proměnnou a pro 1 ≤ k ≤ n
platí
Q ∀y γk(α, y) ≡ y = α(k) .
Dále označme ψ(x, z) formuli
∃y1 . . ∃yn(γ1(x, y1) & . . & γn(x, yn) &
& ((z = 1 & ψ1(y)) ∨ . . ∨ (z = n & ψn(y)))).
362 4 Peanova a Robinsonova aritmetika
Dle tvrzení (a) k formuli ψ(x, z) existuje formule ϕ(z) taková, že
∀k(Q ϕ(k) ≡ ψ(ϕ, k)).
Snadno lze ověřit, že sentence ϕ(k) ≡ ψk(ϕ(1), . . , ϕ(n)) je pro 1 ≤ k ≤ n dokazatelná
v Q. Za hledané sentence λ1, . . , λn lze tedy vzít sentence ϕ(1), . . , ϕ(n).
QED
Cvičení
1. Nechť Γ je rekurzívní množina aritmetických sentencí, která obsahuje všechny
Σ1- i Π1-sentence dokazatelné v Q a která je bezesporná v tom smyslu, že
nemá žádnou podmnožinu tvaru {α, ¬α}. Pak existuje Σ1-sentence ϕ taková,
že ϕ /∈ Γ a ¬ϕ /∈ Γ. Dokažte.
Návod. Vezměte formuli ψ(x), která množinu Γ reprezentuje ve smyslu cvičení 9
z oddílu 4.4. Zdůvodněte, že sentence ϕ, která je řešením rovnice ϕ ≡ ¬ψ(ϕ),
má požadované vlastnosti.
2. Zdůvodněte převedením na předchozí cvičení, že pro každou rekurzívně axiomatizovatelnou
a bezespornou teorii T obsahující Q existují Σ1- a Π1-sentence
nezávislé na T.
Návod. Nechť ne. Pak lze využitím Postovy věty zdůvodnit, že množina
Γ = (Σ1 ∪ Π1) ∩ Thm(T) je rekurzívní. Na množinu Γ lze pak užít tvrzení
z předchozího cvičení.
3. Nechť T je (ne nutně bezesporná či Σ-korektní) teorie s alespoň aritmetickým
jazykem, která obsahuje Peanovu aritmetiku, a nechť τ(z) je Σ-formule, která
deﬁnuje v N množinu T. Zdůvodněte, že implikace ⇒ v podmínce Def plyne
z podmínky D1. Zdůvodněte užitím podmínky Def, že pro každou sentenci ϕ
platí implikace PA Prτ (ϕ) ⇒ T ϕ.
4. Přidáním ještě několika kroků k důkazu Druhé Gödelovy věty zdůvodněte, že
v PA lze dokázat sentence ν → Con(τ) a Con(τ) ≡ ¬Prτ (Con(τ)).
5. Vyvoďte z Druhé Gödelovy věty pro teorii (PA + Con(π)) a z tvrzení 4.2.14(h),
že v PA nelze dokázat implikaci Con(π) → ¬Prπ(¬Con(π)).
6. Nechť τ(z) je formule π(z) ∨ ∃y≤z Proofπ(¬Con(π), y). Zdůvodněte, že formule
τ(z) je Σ-deﬁnice Peanovy aritmetiky. Formule τ(z) popisuje axiomy
Peanovy aritmetiky jako axiomy Robinsonovy aritmetiky a všechny instance schématu
indukce, plus všechny sentence větší než první důkaz sentence ¬Con(π),
pokud nějaké takové důkazy existují. Dokažte sentenci Prπ(¬Con(π)) → ¬Con(τ)
v PA. Vyvoďte z toho a z předchozího cvičení, že PA Con(π) → Con(τ).
7. Nechť τ y, kde τ(z) je aritmetická formule, označuje formuli τ(z) & z ≤ y.
Dokažte pomocí věty 4.4.22, že všechny sentence tvaru Con(π n) jsou v PA
dokazatelné.
4.5 Autoreference, Druhá Gödelova věta 363
8. Nechť π∗
(z) je formule π(z)&Con(π z). Zdůvodněte, že formule π∗
(z) deﬁnuje
v N množinu PA a že platí PA Con(π∗
). Vysvětlete, proč tento fakt není ve
sporu s Druhou Gödelovou větou.
9. Zapomeňte na chvíli na Druhou Gödelovu větu a dokažte, že když τ je Σ-deﬁnice
teorie T, která je rozšířením Peanovy aritmetiky, a platí PA Con(τ), pak
každá Π1-sentence dokazatelná v T je dokazatelná už v PA.
Návod. Nechť η ∈ Π1 a T η. Užijte podmínku D1 na sentenci η a formalizovanou
Σ-úplnost na sentenci ¬η.
10. Řekneme, že sentence ϕ je Γ-konzervativní nad teorií T, kde Γ je některá z množin
Σn či Πn, jestliže každá sentence η ∈ Γ dokazatelná v (T + ϕ) je dokazatelná
už v T. Zdůvodněte, že sentence ϕ dokazatelná v T je Γ-konzervativní
pro každou třídu Γ. Dále zdůvodněte, že když ϕ je Γ-konzervativní nad T,
pak ϕ /∈ Γ(T).
11. Dokažte, že když T je Σ-korektní teorie, která obsahuje Robinsonovu aritmetiku,
pak každá Π1-sentence bezesporná s T (tj. nevyvratitelná v T) je Σ1-konzervativní
nad T.
12. Nechť ρ je Rosserova sentence příslušná k přirozené deﬁnici π Peanovy aritmetiky.
Zdůvodněte, že sentence ρ a Con(π) jsou Σ1-konzervativní nad PA. Dále
zdůvodněte, že sentence ¬ρ není Π1-konzervativní nad PA.
13. Dokažte, že sentence ¬Con(π) je Π1-konzervativní nad PA.
Návod. Nechť (PA + ¬Con(π)) η a η ∈ Π1. Pomocí formalizované Σ-úplnosti
užité na sentenci ¬η a pomocí ekvivalence ze cvičení 4 dokažte v PA implikaci
Con(π) → η. Tedy PA η.
14. Dokažte, že rekurzívně axiomatizovatelná teorie T obsahující Robinsonovu aritmetiku
je Σ-korektní, právě když neexistuje ∆1(T)-sentence nezávislá na T.
Návod. Nechť teorie T není Σ-korektní. Vezměte Σ-deﬁnici τ teorie T a formuli
δ(v) ∈ ∆0 takovou, že T ∃vδ(v), ale N /|= ∃vδ(v). Dále pracujte se
sentencí ϕ, která splňuje podmínku T ϕ ≡ ∀z(Proofτ (ϕ, z) → ∃v≤z δ(v)).
15. Nechť π je přirozená deﬁnice PA a nechť sentence Conn
(π) jsou pro n ≥ 0
deﬁnovány rekurzí: Con0
(π) je sentence 0 = 0, a dále Conn+1
(π) je sentence
¬Prπ(¬Conn
(π)). Zdůvodněte, že všechny sentence Conn
(π) platí v N
a že sentence Con1
(π) a Con(π) jsou ekvivalentní. Jaké implikace mezi sentencemi
Conn
(π) lze dokázat v PA? Pro které dvojice čísel n a m je teorie
(PA + Conn
(π)) intepretovatelná v teorii (PA + Conm
(π))?
16. Označme 1Con(π) sentenci ∀z(Fm1(z) & Prπ(z) → Tr1(z)). Zdůvodněte, že sentence
1Con(π) je v Π2(PA). Dokažte, že je-li η libovolná Π1-sentence taková,
že PA 1Con(π)→η, pak platí i PA 1Con(π)→Con(π+η). Vyvoďte z toho, že
364 4 Peanova a Robinsonova aritmetika
sentence 1Con(π) není v Π1(PA) a že z předpokladu 1Con(π) lze v PA dokázat
všechny sentence Conn
(π) z předchozího cvičení.
Návod. Užijte implikaci ¬σ → ¬Tr1(σ) na sentenci σ ekvivalentní s ¬η.
17. Dokažte, že Peanova aritmetika není interpretovatelná v žádné své konečné
podteorii.
18. Dokažte využitím cvičení 1, že je-li M |= Q, pak (Σ1 ∪Π1)∩Th(M) je nerekurzívní
množina. Také každá z množin Σ1 ∩Th(M) a Π1 ∩Th(M) je nerekurzívní.
19. Dokažte využitím cvičení 9 z oddílu 4.4, že je-li M |= PA nestandardní, pak
SSy(M) obsahuje všechny rekurzívní množiny.
20. Vyvoďte z cvičení 18 a z tvrzení 4.4.20(h), že je-li M |= PA nestandardní, pak
formule Tr1(x) kóduje v M nerekurzívní množinu. Neplatí tedy SSy(M) ⊆ OR
(to jsme už tvrdili v 4.5.9(d)).
21. Je-li M |= Th(N) nestandardní, pak SSy(M) obsahuje všechny aritmetické
množiny. Dokažte. Vyvoďte z toho, že každá z operací +M
a ·M
je v tom
případě nearitmetická množina.
22. Užijte větu 3.6.9 k důkazu, že existuje model M |= PA nestandardní takový,
že SSy(M) ⊆ Σ2 ∪ Π2.
23. Dokažte, že rovnice Q ϕ(z) ≡ ψ( ϕ( ˙z) , z) pro neznámou formuli ϕ(z) má
řešení pro libovolnou aritmetickou formuli ψ(x, z). Vyvoďte z toho, že také
rovnice Q ϕ(n) ≡ ψ(ϕ(n), n) pro neznámou formuli ϕ(z) má vždy řešení.
5
Některé neklasické logiky
Comparison between Reﬂexion and Löb’s Principle seems a potent antidote to the
misguided impression that (. . . ) Gödel Theorem means that Human Mental Powers
exceed what formal systems can do, the Myth of the Mental Muscles.
(A. Visser, [96])
V dosavadním textu jsme se zabývali výhradně klasickou logikou. Její sémantika
je ve výrokové logice založena na představě dvou pravdivostních hodnot, v predikátové
logice máme Tarského deﬁnici, která dvouhodnotovou sémantiku zobecňuje
na predikátové formule. Existuje ale celá řada logik, kterým se říká neklasické a
které jsou založeny na jiných východiscích. Neklasické logiky často nacházejí různé
aplikace, a to i v oblastech mimo logiku. A některé z nich skutečně aspirují na roli
nové metody usuzování, alternativní vůči klasické logice. Tři z neklasických logik se
čtenáři pokusíme přiblížit v této kapitole. Uznáváme, že jejich výběr je do značné
míry subjektivní. Nicméně doufáme, že mnohé z úvah a metod zde uvedených jsou
pro neklasické logiky typické.
5.1 Intuicionistická logika
Předpokládejme, že máme sentenci ϕ a predikátovou formuli ψ(x) s jednou volnou
proměnnou x, a uvažujme formuli
(ϕ → ∃xψ(x)) → ∃x(ϕ → ψ(x)). (∗)
To je logicky platná formule; setkali jsme se s ní například v souvislosti s prenexními
operacemi. Zdůvodnění, že formule (∗) opravdu je logicky platnou formulí, je lehké;
doporučujeme čtenáři, aby si je před další četbou uvědomil nebo i napsal. Konstatujme
rovnou, že toto zdůvodnění není z hlediska intuicionistické logiky korektní,
a pokusme se vysvětlit, proč není.
Pro „klasickou matematiku jsou matematické objekty něčím, co je dáno a co
někde a nějak existuje bez ohledu na lidskou aktivitu. Tady parafrázujeme vysvětlení
v [45]. Každé tvrzení o matematických objektech je platné, nebo neplatné
a úkolem matematika je zjistit, který z obou případů je pravdivý. Naproti tomu
z hlediska intuicionismu neexistují matematické objekty a priori, nezávisle na lidské
366 5 Některé neklasické logiky
aktivitě, nýbrž nové a nové objekty jsou vytvářeny pomocí konstrukcí. A o vlastnostech
zkonstruovaných objektů se přesvědčujeme pomocí konstruktivních důkazů.
Konstrukce a konstruktivní důkaz jsou pro intuicionismus1
klíčové pojmy; od nich
je totiž odvozeno intuicionistické chápání logických symbolů. Přesný význam logických
spojek a kvantiﬁkátorů v intuicionistické matematice je dán následujícími
podmínkami:
• konstruktivní důkaz konjunkce ϕ & ψ sestává z konstruktivního důkazu tvrzení
ϕ a dále z konstruktivního důkazu tvrzení ψ,
• konstruktivní důkaz disjunkce ϕ∨ψ sestává z ukazatele na jedno z tvrzení ϕ, ψ
a z konstruktivního důkazu tohoto tvrzení,
• konstruktivní důkaz implikace ϕ → ψ sestává z konstrukce, která každý konstruktivní
důkaz tvrzení ϕ převede na konstruktivní důkaz tvrzení ψ,
• ⊥ (spor) nemá žádný konstruktivní důkaz,
• negace ¬ϕ je chápána jako implikace ϕ → ⊥; konstruktivní důkaz tvrzení ¬ϕ
je tedy konstrukce, která každý důkaz tvrzení ϕ převede na důkaz sporu,
• konstruktivní důkaz tvrzení ∃xϕ(x) sestává z konstrukce, která nalezne objekt
a a konstruktivní důkaz faktu, že a má vlastnost ϕ,
• konstruktivní důkaz tvrzení ∀xϕ je konstrukce, která ke každému objektu a
nalezne důkaz tvrzení, že a má vlastnost ϕ.
Těmto podmínkám se říká podmínky BHK (anglicky BHK-explanation). BHK je
zkratka jmen Brouwer, Heyting, Kolmogorov. Lze najít i zdroje (např. [95]), které
interpretují „K jako Kreisel.
Vraťme se nyní k formuli (ϕ → ∃xψ(x)) → ∃x(ϕ → ψ(x)) a analyzujme ji využitím
podmínek BHK. Platnost implikace ϕ→∃xψ(x) znamená, že máme proceduru,
která každý konstruktivní důkaz tvrzení ϕ přepracuje na konstruktivní důkaz tvrzení
∃xψ(x). Konstruktivní důkaz tvrzení ∃xψ(x) znamená konstrukci, která nalezne
objekt s vlastností ψ. Dohromady tedy máme konstrukci, která z každého
konstruktivního důkazu tvrzení ϕ vytvoří objekt a s vlastností ψ. To ale neznamená,
že máme a priori konstrukci objektu a s nějakou vlastností, byť bychom se
spokojili se slabší vlastností vyjádřenou implikací ϕ → ψ(x).
Tím jsme zdůvodnili, proč formule (∗) není intuicionisticky logicky platnou formulí.
Na druhé straně ale lze snadno postupně zdůvodnit, že následující tři formule
jsou intuicionisticky logicky platnými formulemi:
¬ϕ → (ϕ → ψ(x)),
¬ϕ → ∃x(ϕ → ψ(x)),
(ϕ → ∃xψ(x)) → (ϕ ∨ ¬ϕ → ∃x(ϕ → ψ(x))).
1Ve stejném nebo podobném smyslu jako intuicionismus se užívá také termín konstruktivismus,
někdy spíš ve spojitosti s ruskou matematickou školou.
5.1 Intuicionistická logika 367
Nemá-li přesto formule (ϕ → ∃xψ(x)) → ∃x(ϕ → ψ(x)) být intuicionisticky logicky
platnou formulí, znamená to, že ani ϕ ∨ ¬ϕ nemůže být intuicionisticky logicky
platnou formulí. To ostatně je v souladu s BHK-podmínkou pro disjunkci: ϕ ∨ ¬ϕ
můžeme tvrdit až poté, kdy jsme konstruktivně dokázali ϕ nebo jsme konstruktivně
dokázali ¬ϕ. Tertium non datur, princip vyloučeného třetího, není intuicionisticky
přijatelným logickým principem.
Fakt, že princip vyloučeného třetího není intuicionisticky korektní, by ale neměl
být chápán tak, že v intuicionistické logice jsou možné více než dvě logické hodnoty.
Brzy uvidíme, že každý předpoklad tvaru ¬(ϕ ∨ ¬ϕ) vede v intuicionistické logice
ke sporu. Z toho, že nějaké tvrzení, v našem případě ϕ ∨ ¬ϕ, není intuicionisticky
logicky platné, nelze usoudit, že za nějakých okolností by mohl platit jeho opak.
Podmínky BHK nepovažujeme za závaznou deﬁnici, ale spíše za heuristiku, důležitou
pro intuicionismus jako ﬁlozoﬁcké stanovisko. Vzhledem k tomuto přístupu
nemusíme diskutovat fakt, že podmínka pro symbol ⊥ má možná trochu jiný charakter
než podmínky pro ostatní logické symboly. Neuvažujeme ani o tom, zda
s užitím podmínek BHK lze zdůvodnit intuicionistickou logickou platnost principu
ex falso, ze sporu plyne cokoliv, vyjádřeného schématem ⊥→ψ nebo ϕ→(¬ϕ→ψ).
Spokojme se s prohlášením, že ano, princip ex falso je intuicionistickou tradicí přijímán
jako korektní. Jsou ale myslitelné logiky ještě slabší než intuicionistická, ve
kterých se tento princip nepovažuje za automaticky korektní. O tom si lze přečíst
například v [94]. Několik zmínek spolu s úvahami o modiﬁkacích podmínek BHK
je také v [14]. Van Dalenovu kapitolu [14] doporučujeme jako úvodní četbu o intuicionistické
logice a její historii.
K pojmu konstruktivního důkazu je nutno poznamenat, že se jím nemá rozumět
důkaz v logickém smyslu, tj. formální posloupnost symbolů. Konstruktivní důkaz
je mentální operací, která je korektní, pokud je v souladu s lidskou intuicí. Někde
tady je třeba hledat původ termínu intuicionismus.
Vznik intuicionismu je spjat s pracemi L. E. J. Brouwera z počátku 20. století.
Brouwer formuloval intuicionistickou ﬁlozoﬁi matematiky, nikoliv ale logický systém.
O otázky jazyka se prý (viz [45]) Brouwer vůbec nezajímal. Později vznikla
rozsáhlá intuicionistická literatura; různé oblasti matematiky byly revidovány a
znovu vystavěny na intuicionistických základech.
V našem textu nepůjde o revizi matematiky ani o intuicionismus jako ﬁlozoﬁcké
stanovisko. Půjde nám o vlastnosti intuicionistické logiky jako jednoho z formálně
logických systémů, o její vztah ke klasické logice a případně o její aplikace. Nepokoušíme
se zavádět intuicionistickou logiku na metamatematickou úroveň. Na
přímou otázku bychom odpověděli, že v úvahách o kalkulech a sémantice intuicionistické
logiky užíváme logiku klasickou.
Intuicionistickou logiku jako formální systém formuloval A. Heyting, který tím
zpřístupnil Brouwerovy práce širšímu okruhu zájemců. Čitelné a dosud čtené pojednání
o kalkulech pro intuicionistickou logiku je v Kleeneho knize [49] z r. 1952.
My začneme výklad od sémantiky, kterou vytvořil S. Kripke v r. 1965. Užití kripkovské
sémantiky se neomezuje jen na intuicionistickou logiku. Je v neklasických
logikách široce aplikovatelná a v oddílu 5.3 této kapitoly se s ní také setkáme.
368 5 Některé neklasické logiky
5.1.1 Sémantika intuicionistické výrokové logiky
Formule intuicionistické výrokové logiky jsou sestaveny z výrokových atomů pomocí
čtyř logických spojek &, ∨, →, ¬. Jsou to tedy tytéž formule jako v klasické výrokové
logice. Důležitý rozdíl je v tom, že nelze například implikaci ekvivalentně vyjádřit
pomocí disjunkce a negace. Žádnou ze spojek nelze vyjádřit pomocí ostatních,
a přítomnost všech čtyř je tedy nutná. Ekvivalenci ≡ nepovažujeme za základní
spojku, nýbrž stejně jako v klasické výrokové logice za konjunkci dvou implikací.
Deﬁnice 5.1.1 O trojici W, ≤, − , kde ≤ je uspořádání na neprázdné množině
W a relace − je podmnožinou kartézského součinu množiny W s množinou
všech výrokových formulí, řekneme, že je kripkovským modelem pro intuicionistickou
logiku, jestliže pro libovolné prvky x a y množiny W, pro libovolné formule
A a B a pro libovolný výrokový atom p platí:
◦ když x ≤ y a x − p, pak y − p,
◦ x − A & B, právě když x − A a x − B,
◦ x − A ∨ B, právě když x − A nebo x − B,
◦ x − A → B, právě když ∀y ≥ x(y − A ⇒ y − B),
◦ x − ¬A, právě když ∀y ≥ x(y −/ A).
Termín uspořádání má obvyklý význam: ≤ je reﬂexivní, tranzitivní a slabě antisymetrická
relace na množině W. Prvkům množiny W říkejme jednoduše vrcholy.
Zápis x ≤ y čteme „vrchol y je dosažitelný z vrcholu x nebo také „vrchol y je
viditelný z vrcholu x . Relaci ≤ říkáme relace dosažitelnosti. Relace dosažitelnosti
nemusí být lineární. Dvojice W, ≤ je (kripkovský) rámec modelu W, ≤, − . Zápis
x − A čteme „formule A je splněna ve vrcholu x nebo též „vrchol x splňuje
formuli A . Relace − je pravdivostní relace. Množina W může mít libovolnou
(konečnou nebo nekonečnou) mohutnost, musí ale být neprázdná.
Prvkům kripkovského rámce se v literatuře obecně (tj. v souvislosti s kripkovskou
sémantikou pro různé logiky) říká stavy nebo také možné světy (possible
worlds). Můžeme si totiž představovat, že mezi výroky o světě nás obklopujícím
některé jsou speciﬁcké (pro tento svět), kdežto některé jsou nutné (zákonité, logicky
platné), neboť platí ve všech možných světech. Tato představa stejně jako termín
„možné světy pochází od Leibnize. V intuicionistické logice lze prvky kripkovského
rámce považovat za informační stavy; podmínka x − A znamená, že stav
informace x umožňuje tvrdit, že platí A. Přechod ze stavu x do stavu y dosažitelného
z x lze chápat tak, že uplynul čas, během kterého byly získány (konstruktivně
dokázány) nové informace. Naše deﬁnice požaduje, aby v tom případě nepřestal
být splněn žádný výrokový atom, který byl splněn už v x. Tomuto požadavku se
říká podmínka perzistence. Brzy uvidíme (viz 5.1.3), že pro ostatní formule (jiné
než atomy) podmínka perzistence platí také.
Sémantika intuicionistické výrokové logiky zobecňuje sémantiku klasické výrokové
logiky. V klasické logice přidělujeme výrokovým atomům libovolné pravdi-
5.1 Intuicionistická logika 369
vostní hodnoty. V intuicionistické logice je třeba nejprve (libovolně) zvolit kripkovský
rámec a pak teprve přidělovat pravdivostní hodnoty atomům v jeho prvcích.
Jsou-li dány pravdivostní hodnoty výrokových atomů ve všech vrcholech nějakého
rámce, deﬁnice 5.1.1 jednoznačně určuje pravdivostní hodnoty všech ostatních formulí.
Pravdivostní hodnota implikace A → B a negace ¬A v nějakém vrcholu x
závisí na pravdivostních hodnotách formulí A a B resp. formule A ve vrcholech
dosažitelných z x. K určení pravdivostní hodnoty formulí A & B a A ∨ B v x stačí
znát pravdivostní hodnoty formulí A a B jen v samotném vrcholu x.
a
b c
d
p−, q−
p−, q+ p+, q−
p+, q+


o


U
T
Obrázek 5.1.1: Kripkovský model pro intuicionistickou logiku
Příklad 5.1.2 Na obrázku 5.1.1 je příklad kripkovského modelu W, ≤, − . Množina
stavů W obsahuje čtyři vrcholy a, b, c a d, relace dosažitelnosti ≤ je znázorněna
šipkami. Na obrázku nejsou znázorněny „automatické prvky relace ≤: vzhledem
k deﬁnici uspořádání je také vrchol d dosažitelný z vrcholu a a každý ze čtyř prvků
množiny W je dosažitelný sám ze sebe. Znaménka + a − označují, ve kterých
prvcích množiny W atomy jsou a nejsou splněny. O atomech různých od p a q si
můžeme myslet, že nikde splněny nejsou. V tomto modelu platí b − ¬p, protože
atom p není splněn v žádném vrcholu dosažitelném z b. Ze všech ostatních vrcholů
je ale viditelný vrchol d, ve kterém je splněn atom p. Tedy x −/ ¬p pro x ∈ {a, c, d}.
Podobně lze zjistit, že také formule q → ¬p je splněna v b a není splněna v a, c ani
v d. Její negace ¬(q → ¬p) je splněna ve vrcholech x s vlastností, že v x ani nikde
dál formule q → ¬p splněna není, což jsou vrcholy c a d. Formule p ∨ ¬p je splněna
v b, c a v d, není splněna v a.
Lze dokázat, že bychom mohli vystačit s rámci, které z hlediska teorie grafů
jsou stromy; nebudeme to ale potřebovat. Přesto si dovolme nejmenší vrchol rámce
nazvat kořenem. Naopak vrchol s, z kterého nejsou dosažitelné žádné vrcholy různé
od s, nazvěme listem. Samozřejmě ne každý rámec musí mít kořen nebo listy.
Lemma 5.1.3 Nechť W, ≤, − je kripkovský model, nechť x a y jsou jeho vrcholy
takové, že x ≤ y, nechť A je výroková formule. Když x − A, pak y − A.
Důkaz ponecháváme za cvičení.
370 5 Některé neklasické logiky
Deﬁnice 5.1.4 Sekvent Γ ⇒ ∆ platí v modelu W, ≤, − , jestliže v každém
vrcholu x ∈ W, ve kterém jsou splněny všechny formule z Γ, je splněna také některá
formule z ∆. Sekvent Γ ⇒ ∆ je intuicionisticky tautologický, jestliže platí
v každém kripkovském modelu. Formule A platí v modelu W, ≤, − , jestliže v modelu
W, ≤, − platí sekvent ⇒ A . Formule A je intuicionistická tautologie,
jestliže sekvent ⇒ A je intuicionisticky tautologický, tj. jestliže formule A je
splněna v každém vrcholu každého kripkovském modelu. Množinu všech intuicionis-E
tických tautologií označme Int-Taut.
Není-li formule A intuicionistickou tautologií, znamená to, že existuje kripkovský
model, ve kterém A neplatí. Takový model nazvěme kripkovským protipříkladem
na formuli A. Podobně protipříkladem na sekvent Γ ⇒ ∆ je model W, ≤, − a
jeho vrchol a takový, že v a jsou splněny všechny formule z Γ a nesplněny všechny
formule z ∆.
Příklad 5.1.5 Z podmínky pro negaci v deﬁnici kripkovského modelu a z reﬂexivity
relace dosažitelnosti plyne, že pro žádný vrchol z libovolného kripkovského
modelu a žádnou formuli A neplatí současně z − A a z − ¬A. Jsou-li x a y
vrcholy nějakého kripkovského modelu takové, že x ≤ y a x − A, pak z tranzitivity
relace ≤, z lemmatu 5.1.3 a z předchozí úvahy plyne z −/ ¬A pro libovolný
vrchol z dosažitelný z y. To dále znamená y − ¬A → B pro libovolnou formuli B.
Tím je ověřeno, že x − A → (¬A → B). Protože x byl libovolný vrchol libovolného
kripkovského modelu, dokázali jsme, že A→(¬A→B) je intuicionistická tautologie.
Podobně lze ověřit, že také každá formule tvaru A → ¬¬A je intuicionistická tautologie.
Další příklady intuicionistických tautologií jsou ¬¬¬A → ¬A a ¬¬(A ∨ ¬A),
a ještě další příklady intuicionistických tautologií jsou uvedeny ve cvičeních. Na
druhé straně formule ¬¬A → A, A ∨ ¬A a (¬¬A → A) → A ∨ ¬A nejsou intuisticionistickými
tautologiemi: v modelu z obrázku 5.1.1 neplatí formule ¬¬q → q, p ∨ ¬pE
ani (¬¬p → p) → p ∨ ¬p.
Lemma 5.1.6 Nechť formule A není intuicionistickou tautologií. Pak existuje
kripkovský model W, ≤, − a vrchol r ∈ W takové, že r je kořenem v rámci W, ≤
a r −/ A.
Důkaz Není-li formule A intuicionistickou tautologií, existuje model W , ≤ , −
a vrchol r ∈ W takový, že r −/ A. Položme W = { y ∈ W ; r ≤ y }. Relace
≤ a − deﬁnujme jako restrikce relací ≤ a − na množinu W. Snadno lze ověřit,
že konstrukce je korektní a že libovolná formule je v libovolném vrcholu y nového
modelu splněna, právě když je v y splněna ve smyslu původního modelu. QED
Předchozí lemma by pochopitelně zůstalo v platnosti, kdybychom místo o formuli
mluvili o sekventu. Model vzniklý odstraněním všech vrcholů nedosažitelných
z jistého vrcholu r, jehož konstrukce je popsána v předchozím důkazu, se nazývá
model generovaný vrcholem r.
5.1 Intuicionistická logika 371
Je-li s listem nějakého kripkovského modelu, pak pravdivostní hodnoty formulí
se v s vyčíslují „klasicky . Například implikace A → B je splněna, právě když
B je v s splněna nebo A je v s nesplněna. Z toho plyne, že jednoprvkové kripkovské
modely jednoznačně korespondují s pravdivostními ohodnoceními ve smyslu
klasické výrokové logiky. Každá intuicionistická tautologie platí ve všech kripkovských
modelech, takže i ve všech jednoprvkových modelech, a je tedy tautologií ve
smyslu klasické výrokové logiky. Tím jsme zdůvodnili inkluzi Int-Taut ⊆ Taut.
Z příkladu 5.1.5 je jasné, že tato inkluze je ostrá. Zatím nevíme, zda Int-Taut je
jednodušší nebo složitější úloha než Taut. Nevíme ani, zda je rozhodnutelná. Tím
se budeme zabývat v následujícím pododdílu.
5.1.2 Rozhodnutelnost, úplnost, složitost
Podobně jako v sémantice klasické predikátové logiky nenaznačuje deﬁnice intuicionistické
tautologie žádný algoritmus, který by zjistil, zda daná formule platí ve
všech modelech. Kripkovské modely mohou být neomezeně velké nebo i nekonečné.
Ukážeme si, že takový algoritmus přesto — a na rozdíl od klasické predikátové logiky
— existuje. Algoritmus sestavíme tak, aby rozhodoval o sekventech, ne pouze
o jednotlivých formulích. Analýza našeho algoritmu nám pak umožní deﬁnovat
gentzenovský kalkulus pro intuicionistickou logiku a dokázat jeho úplnost.
Lemma 5.1.7 V každém řádku následující tabulky:
Γ, A & B ⇒ ∆ Γ, A & B, A, B ⇒ ∆
Γ, A ∨ B ⇒ ∆ Γ, A ∨ B, A ⇒ ∆ , Γ, A ∨ B, B ⇒ ∆
Γ ⇒ ∆, A & B Γ ⇒ ∆, A & B, A , Γ ⇒ ∆, A & B, B
Γ ⇒ ∆, A ∨ B Γ ⇒ ∆, A ∨ B, A, B
Γ, A → B ⇒ ∆ Γ, A → B ⇒ ∆, A , Γ, A → B, B ⇒ ∆
Γ, ¬A ⇒ ∆ Γ, ¬A ⇒ ∆, A
Γ ⇒ ∆, A → B Γ ⇒ ∆, A → B, B
je sekvent v levém sloupci intuicionisticky tautologický, právě když sekvent v pravém
sloupci je intuicionisticky tautologický, resp. když oba sekventy v pravém sloupci
jsou intuicionisticky tautologické.
Důkaz Podívejme se například na poslední řádek. Není-li Γ ⇒ ∆, A → B
intuicionisticky tautologický sekvent, znamená to, že existuje kripkovský model K,
v jehož kořenu jsou splněny všechny formule z Γ a není splněna formule A → B ani
žádná z formulí z ∆. Není-li splněna formule A → B, není splněna ani formule B,
a K je tedy protipříkladem i na sekvent Γ ⇒ ∆, A → B, B . Naopak, každý
protipříklad na sekvent Γ ⇒ ∆, A→B, B je zároveň automaticky protipříkladem
na sekvent Γ ⇒ ∆, A → B . Stejná úvaha platí i pro ostatních šest případů:
libovolný kripkovský model je protipříkladem na sekvent v levém sloupci, právě
když je protipříkladem na (některý) sekvent v pravém sloupci. QED
372 5 Některé neklasické logiky
Vícenásobným užitím právě dokázaného lemmatu lze otázku, zda daný sekvent
je intuicionisticky tautologický, převést na tutéž otázku týkající se sekventů, které
jsou uzavřené ve smyslu následující deﬁnice. Pak se budeme zabývat uzavřenými
sekventy.
Deﬁnice 5.1.8 Sekvent Γ ⇒ ∆ je uzavřený, jestliže
◦ když A & B ∈ Γ (resp. A ∨ B ∈ ∆), pak A i B jsou v Γ (resp. v ∆),
◦ když A ∨ B ∈ Γ (resp. A & B ∈ ∆), pak A nebo B je v Γ (resp. v ∆),
◦ když A → B ∈ Γ, pak B ∈ Γ nebo A ∈ ∆,
◦ když ¬A ∈ Γ, pak A ∈ ∆,
◦ když A → B ∈ ∆, pak B ∈ ∆.
Příklad 5.1.9 Sekvent ⇒ ¬¬p → p není uzavřený, sekventy ⇒ ¬¬p → p, p
a p → q ⇒ p, ¬q jsou uzavřené. Deﬁnice neříká nic o negaci v sukcedentu ani o
premise implikace v sukcedentu.
Lemma 5.1.10 Nechť Γ ⇒ ∆ je uzavřený sekvent. Pak Γ ⇒ ∆ je intuicionisticky
tautologický, právě když je splněna některá z následujících podmínek:
◦ Γ ∩ ∆ = ∅,
◦ existuje formule A → B ∈ ∆ taková, že A /∈ Γ a sekvent Γ, A ⇒ B je
intuicionisticky tautologický,
◦ existuje formule ¬A ∈ ∆ taková, že A /∈ Γ a sekvent Γ, A ⇒ je intuicionisticky
tautologický.
Důkaz Když Γ ∩ ∆ = ∅, pak Γ ⇒ ∆ je intuicionisticky tautologický sekvent.
Zabývejme se podmínkou týkající se implikace, úvaha pro poslední podmínku týkající
se negace je podobná. Nechť tedy A→B ∈ ∆ a Γ, A ⇒ B je intuicionisticky
tautologický sekvent. Ověříme, že sekvent Γ ⇒ A → B je intuicionisticky tautologický.
To bude samozřejmě znamenat, že i sekvent Γ ⇒ ∆ je intuicionisticky
tautologický. Nechť tedy a je libovolný vrchol libovolného kripkovského modelu takový,
že a − Γ, tj. v a jsou splněny všechny formule z Γ. Máme ověřit a − A→B,
což podle deﬁnice znamená ověřit, že B je splněna ve všech vrcholech b dosažitelných
z a, ve kterých je splněna formule A. Nechť tedy a ≤ b a b − A. Lemma 5.1.3 říká,
že v b jsou splněny všechny formule z množiny Γ. Každý vrchol splňující všechny
formule z množiny Γ ∪ {A} musí splňovat i formuli B, protože Γ, A ⇒ B je
intuicionisticky tautologický sekvent. Tedy b − B.
Uvažujme o implikaci ⇒. Předpokládejme, že Γ ⇒ ∆ je uzavřený sekvent,
který nesplňuje žádnou ze tří podmínek lemmatu. Tedy Γ ∩ ∆ = ∅, pro žádnou
implikaci A→B ∈ ∆ takovou, že A /∈ Γ, sekvent Γ, A ⇒ B není intuicionisticky
tautologický a pro žádnou negaci ¬A ∈ ∆ takovou, že A /∈ Γ, sekvent Γ, A ⇒
není intuicionisticky tautologický. Napišme si seznam
A1 → B1, . . , An → Bn, ¬C1, . . , ¬Cm
5.1 Intuicionistická logika 373
 
 
  
d
d
dd
r  
 
  
d
d
dd
r  
 
  
d
d
dd
r  
 
  
d
d
dd
r
rrrrrrrrrrr
rrr
e
e
e
e
e
eeu
¡
¡
¡
¡
¡
¡¡!
¨¨¨¨¨¨¨¨¨¨¨
¨¨¨B
K1 Kn Kn+1 Kn+m
b1 bn bn+1 bn+m
a
· · · · · ·
r
Obrázek 5.1.2: Amalgamace kripkovských modelů
všech implikací A → B v sukcedentu ∆ takových, že A /∈ Γ, a všech negací ¬C
v ∆ takových, že C /∈ Γ. Protože příslušné sekventy nejsou intuicionisticky tautologické,
pro každou z těchto formulí můžeme zvolit kripkovský model Ki s kořenem
bi, kde 1 ≤ i ≤ n + m, tak, že pro 1 ≤ i ≤ n je model Ki protipříkladem
na sekvent Γ, Ai ⇒ Bi a pro n + 1 ≤ i ≤ n + m je model Ki protipříkladem
na sekvent Γ, Ci−n ⇒ . Tedy ve všech kořenech bi jsou splněny všechny
formule z množiny Γ. Navíc pro 1 ≤ i ≤ m platí bi − Ai a bi −/ Bi, kdežto
pro n + 1 ≤ i ≤ n + m platí bi − Ci−n.
Utvořme nyní ze všech modelů Ki a z jednoho nového vrcholu a nový model K tak,
jak je znázorněno na obrázku 5.1.2. Vrchol a je v K novým kořenem. To znamená,
že z a jsou dosažitelné všechny prvky všech Ki, každý z dosavadních kořenů bi je
dosažitelný jen sám ze sebe a z nového kořenu a. Pravdivostní relaci rozšíříme na
nový model K tak, že v a prohlásíme za splněné ty atomy, které jsou v množině Γ,
a za nesplněné všechny ostatní. Takováto volba pravdivostních hodnot neporuší
podmínku perzistence, neboť všechny atomy v Γ — a vůbec všechny formule v Γ —
jsou splněny ve všech vrcholech všech modelů Ki.
O pravdivostních hodnotách formulí D ∈ Γ ∪ ∆ v kořenu a platí: jestliže D ∈ Γ,
pak a − D, a jestliže D ∈ ∆, pak a −/ D. Toto tvrzení dokážeme indukcí
podle složitosti formule D. Když D je atomem a D ∈ ∆, pak a −/ D, protože
Γ ∩ ∆ = ∅ a všechny atomy, které nejsou v Γ, jsme prohlásili za nesplněné v a.
Když D je tvaru E & F a D ∈ ∆, pak díky uzavřenosti sekventu Γ ⇒ ∆
jedna z formulí E a F je v ∆, a tedy podle indukčního předpokladu je nesplněna
v a. Platí tedy a −/ E & F. Je-li D tvaru E → F a D ∈ Γ, pak opět díky
uzavřenosti sekventu Γ ⇒ ∆ platí F ∈ Γ nebo E ∈ ∆. Podle indukčního
předpokladu F je nebo E není splněna v a. Tedy pro x = a platí podmínka x −/ E
nebo x − F. Je-li x ∈ K a x = a, pak pro x tato podmínka platí rovněž,
neboť x je dosažitelný z některého bi a víme bi − E → F, model Ki je přece
protipříkladem na sekvent obsahující formuli E→F v antecedentu. Tedy podmínka
x −/ E nebo x − F je splněna úplně všude, tedy a − E → F. Uvažme ještě
případ, kdy D je E → F a D ∈ ∆. Všechny zbývající případy jsou podobné právě
probraným nebo jednodušší. Formule E může nebo nemusí být v Γ. Uvažme obě
374 5 Některé neklasické logiky
možnosti. Nechť E ∈ Γ. Víme F ∈ ∆, to plyne z uzavřenosti sekventu Γ ⇒ ∆ .
Z indukčního předpokladu plyne, že pro x = a platí x − E a x −/ F. Nechť E /∈ Γ.
Pak E → F musí být jedna z formulí Ai → Bi pro 1 ≤ i ≤ n. Protože Ki je
protipříklad na sekvent Γ, Ai ⇒ Bi , pro x = bi víme x − Ai a x −/ Bi. V obou
případech existuje vrchol x dosažitelný z a takový, že x − E a x −/ F. Takže
a −/ E → F.
Můžeme tedy konstatovat, že sestrojený model K je hledaným protipříkladem na
sekvent Γ ⇒ ∆ . QED
Konstrukce kripkovského modelu z konečně mnoha modelů a jednoho nového
vrcholu, která je znázorněna na obrázku 5.1.2 a která se uplatnila v důkazu předchozího
lemmatu, se (například v knize [38]) nazývá amalgamace.
Na obou předchozích lemmatech lze založit algoritmus, který o libovolném sekventu
rozhodne, zda je intuicionisticky tautologický, tj. algoritmus, který rozhoduje
úlohu Int-Taut. Důkaz následující věty stejně jako lemmata 5.1.7 a 5.1.10
vznikly přizpůsobením úvah v Ladnerově článku [54], který se zabývá složitostí
rozhodovacích procedur pro různé modální logiky. Článek [54] se ale nezabývá
intuicionistickou logikou ani sekventovými kalkuly. Připomeňme, že za délku sekventu
pokládáme počet výskytů všech logických spojek a výrokových atomů v jeho
zápisu.
Věta 5.1.11 Úloha zjistit, zda daný sekvent je intuicionisticky tautologický, je rozhodnutelná
v polynomiálním prostoru. Jinými slovy, platí Int-Taut ∈ PSPACE.
Důkaz Program rozhodující, zda daný sekvent je intuicionisticky tautologický, lze
založit na podprogramu F z obrázku 5.1.3. Podprogram F očekává jako parametry
dvě konečné množiny Γ a ∆ výrokových formulí. Podprogram je deklarován
jako booleovská funkce. To znamená, že výsledkem jeho činnosti je odpověď ano
nebo ne. Tvrdíme, že podprogram se dopočítá na každém vstupu, při zpracování
vstupu [Γ, ∆] vystačí s prostorem polynomiálním v délce vstupu a jeho odpověď
je správnou odpovědí na otázku, zda Γ ⇒ ∆ je intuicionisticky tautologický
sekvent.
Podprogram využívá rekurzívní volání sama sebe. Například v řádku L2 volá sám
sebe dvakrát, pokaždé na jiná data, a výsledkem výpočtu je logický součin (konjunkce)
obou odpovědí vyjádřený slovem and. Příkaz return V ovšem znamená
„skonči a vydej výsledek V .
Bez rekurzívního volání se podprogram obejde v řádku L8: je-li Γ ∩ ∆ = ∅, pak
výsledek je true, tj. ano, sekvent Γ ⇒ ∆ je intuicionisticky tautologický. Odpověď
false v podprogramu vidět není, ale je skryta v důležitém řádku L9. Tam
je výsledek výpočtu stanoven jako disjunkce (vyjádřená dvěma symboly a slovem
or) dílčích výsledků, jejichž počet může být různý, a to i nulový (v případě,
kdy pro všechny implikace A → B v ∆ a pro všechny negace ¬A v ∆ platí A ∈ Γ).
A disjunkce nulového počtu booleovských hodnot je false.
5.1 Intuicionistická logika 375
boolean function F(Γ, ∆)
if některá formule v Γ porušuje uzavřenost sekventu Γ ⇒ ∆ then
zvol formuli D ∈ Γ, která porušuje uzavřenost
L1: if D = A & B then return F(Γ ∪ {A, B}, ∆)
L2: if D = A ∨ B then return [F(Γ ∪ {A}, ∆) and F(Γ ∪ {B}, ∆)]
L3: if D = A → B then return [F(Γ, ∆ ∪ {A}) and F(Γ ∪ {B}, ∆)]
L4: if D = ¬A then return F(Γ, ∆ ∪ {A})
endif
if některá formule v ∆ porušuje uzavřenost sekventu Γ ⇒ ∆ then
zvol formuli D ∈ ∆, která porušuje uzavřenost
L5: if D = A ∨ B then return F(Γ, ∆ ∪ {A, B})
L6: if D = A & B then return [F(Γ, ∆ ∪ {A}) and F(Γ, ∆ ∪ {B})]
L7: if D = A → B then return F(Γ, ∆ ∪ {B})
endif
L8: if Γ ∩ ∆ = ∅ then return true
L9: return [ A→B∈∆,A/∈Γ F(Γ ∪ {A}, {B}) or ¬A∈∆,A/∈Γ F(Γ ∪ {A}, ∅)]
endfunction
Obrázek 5.1.3: Rozhodnutelnost intuicionistické výrokové logiky
Podprogram tedy pracuje tak, že otázku týkající se daného sekventu převádí na
tutéž otázku nebo otázky týkající se jiných sekventů, a to buď užitím lemmatu 5.1.7
(v řádcích L1–L7), nebo užitím lemmatu 5.1.10 (v řádcích L8 a L9). Celý výpočet
si můžeme představit jako strom, jehož vrcholy jsou ohodnoceny různými daty
tvaru [Γ, ∆]. Vrchol s ohodnocením [Γ, ∆] reprezentuje kopii našeho podprogramu,
která má rozhodnout o logické pravdivosti sekventu Γ ⇒ ∆ . Udělá to tak, že
aktivuje další — podřazené — kopie, a svůj výsledek, který předá nadřazené kopii
nebo hlavnímu programu, získá jako logický součet nebo součin jejich výsledků.
Tvrdíme, že všechny větve výpočtu dospějí po konečném a předem odhadnutelném
počtu kroků buď k uzavřenému sekventu Γ ⇒ ∆ takovému, že Γ ∩ ∆ = ∅ a
pro všechny implikace A → B ∈ ∆ platí A ∈ Γ a pro všechny negace ¬C ∈ ∆
platí C ∈ Γ (ten podle lemmatu 5.1.10 není intuicionisticky tautologický), nebo
k sekventu Γ ⇒ ∆ takovému, že Γ∩∆ = ∅ (ten je intuicionisticky tautologický).
Předpokládejme, že vstupní data podprogramu F mají délku n, a všimněme si, jak
se mění obsah množin Γ a ∆ podél jedné větve výpočtu. Množina ∆ se cestou od
kořene směrem do hloubi stromu může zvětšovat (před voláním podprogramu F
do ní může být přidána jedna nebo dvě formule) nebo zmenšovat (před voláním
podprogramu F v řádku L9 jsou z ní odstraněny všechny formule nebo všechny až
na jednu). Žádný z řádků L1–L9 ale nikdy neodstraní žádnou formuli z množiny Γ.
Ta se může pouze zvětšovat a určitě se zvětší, je-li použit řádek L9.
Všechny formule ve hře jsou podformulemi některé formule v původním sekventu
a je jich nejvýše n. Z toho usuzujeme, že na každé větvi výpočtu je nejvýše n
uzavřených sekventů, protože každý další má v Γ nejméně o jednu formuli více, a
376 5 Některé neklasické logiky
že vzdálenost od jednoho uzavřeného sekventu k druhému je také nejvýše n, protože
každý z řádků L1–L7 vždy přidá alespoň jednu formuli do množiny Γ ∪ ∆.
Tím jsme zdůvodnili, že podprogram F se na každém vstupu dopočítá, neboť každá
větev výpočtu je konečná a má délku O(n2
), kde n je délka vstupních dat. Každá
kopie podprogramu F vystačí s lokálními daty velikosti O(n2
), což je maximální
možná délka seznamu všech podformulí nějakého sekventu délky n. Z oddílu 2.1
víme, že souhrnná velikost paměťového prostoru je dána souhrnnou velikostí lokálních
dat všech kopií podprogramu podél jedné větve výpočtu. Tím je dokázáno, že
podprogram F vystačí s paměťovým prostorem velikosti O(n4
). QED
B ⇒ B
B ⇒ ¬A ∨ B
¬(¬A ∨ B), B ⇒
¬(¬A ∨ B) ⇒ ¬B
A ⇒ A
B ⇒ B
B, ¬B ⇒
A → B, ¬B, A ⇒
A → B, ¬B ⇒ ¬A
¬A ⇒ ¬A
¬A ⇒ ¬A ∨ B
¬(¬A ∨ B), ¬A ⇒
¬(¬A ∨ B), A → B, ¬B ⇒
¬(¬A ∨ B), A → B ⇒
¬(¬A ∨ B) ⇒ ¬(A → B)
Obrázek 5.1.4: Důkaz v intuicionistickém gentzenovském kalkulu
Nyní jsme připraveni deﬁnovat gentzenovský kalkulus pro intuicionistickou výrokovou
logiku. Některá z pravidel kalkulu GK pro klasickou výrokovou logiku
uvedených v oddílu 1.4 jsou korektní i vůči kripkovské sémantice intuicionistické
logiky (ověření ponecháváme jako cvičení) a můžeme je beze změny převzít i do kalkulu
pro intuicionistickou logiku. Jsou to pravidla A, W, Cut, →-l, ¬-l a všechna
čtyři pravidla pro konjunkci a disjunkci. K nim přidáme modiﬁkovaná pravidla pro
zavedení implikace a negace do sukcedentu:
→-rI: Γ, A ⇒ B / Γ ⇒ A → B ,
¬-rI: Γ, A ⇒ / Γ ⇒ ¬A ,
→-w: Γ ⇒ ∆, B / Γ ⇒ ∆, A → B .
Pravidlo →-w nazvěme slabým pravidlem pro zavedení implikace. Zbývající dvě pravidla
jsou téměř shodná s pravidly pro klasickou výrokovou logiku až na důležitý
rozdíl, že v sukcedentu se nepřipouštějí postranní formule. O těchto dvou pravidlech
se někdy mluví jako o kritických. Jsou použitelná jen tak, že po jejich použití
je sukcedent jednoprvkový. Ověření korektnosti těchto pravidel ponecháváme opět
jako cvičení, ale důkazy korektnosti většiny pravidel jsou vlastně obsaženy v důkazech
lemmat 5.1.7 a 5.1.10.
Kalkulus GJ, gentzenovský kalkulus pro intuicionistickou výrokovou logiku, tedy
deﬁnujeme jako kalkulus s pravidly A, W, Cut, →-l, ¬-l, &-l, ∨-l, &-r a ∨-r převzatými
z kalkulu GK a s právě deﬁnovanými pravidly →-w, →-rI a ¬-rI.
5.1 Intuicionistická logika 377
Na obrázku 5.1.4 je uveden příklad důkazu v kalkulu GJ. Jsou v něm použity
dva řezy, nejprve na formuli ¬A a pak na formuli ¬B. Následující věta tvrdí, že
týž sekvent má i bezřezový důkaz. A dále následující věta tvrdí, že sekvent, který
má jakýkoliv kripkovský protipříklad, má i konečný protipříklad. Tato vlastnost se
obecně, tj. v souvislosti s logikami připouštějícími kripkovskou sémantiku, nazývá
vlastnost konečných modelů a označuje se zkratkou FMP, ﬁnite model property.
Věta 5.1.12 (úplnost kalkulu GJ) Každý intuicionisticky tautologický sekvent
délky n má bezřezový důkaz hloubky O(n3
). Každý sekvent délky n, který není
intuicionisticky tautologický, má kripkovský protipříklad hloubky nejvýše n, v němž
každý vrchol má nejvýše n následníků. Kalkulus GJ je tedy úplný vůči kripkovské
sémantice intuicionistické logiky a platí pro něj věta o eliminovatelnosti řezů.
Intuicionistická výroková logika má vlastnost FMP.
Důkaz Vraťme se k důkazu věty 5.1.11. Víme, že výpočet, který má rozhodnout
o sekventu Σ ⇒ Ω , si můžeme představit jako strom, jehož každý vrchol je
ohodnocen daty tvaru [Γ, ∆], která reprezentují otázku, zda sekvent Γ ⇒ ∆
je intuicionisticky tautologický. Označme tento strom T . Víme, že má-li sekvent
Σ ⇒ Ω délku n, pak strom T má hloubku O(n2
). Rozmysleme si, že
strom T lze přepracovat buď na důkaz sekventu Σ ⇒ Ω v kalkulu GJ, nebo na
kripkovský protipříklad na sekvent Σ ⇒ Ω .
Rozdělme sekventy stromu T na pozitivní a negativní podle toho, zda podprogram
F po jejich zpracování odpověděl ano nebo ne. Každý sekvent stromu T je
nebo není uzavřený, přičemž všechny listy jsou uzavřené. Je-li sekvent Γ ⇒ ∆
listem stromu T , pak je pozitivní právě tehdy, když Γ ∩ ∆ = ∅. Není-li uzavřený
sekvent listem, pak je pozitivní právě tehdy, je-li některý z jeho následníků pozitivní.
Neuzavřený sekvent má jednoho nebo dva následníky a je pozitivní právě
tehdy, když každý z jeho následníků je pozitivní.
Předpokládejme, že výsledek celého výpočtu je ANO. Pak kořen Σ ⇒ Ω
stromu T je pozitivní, čili sekvent Σ ⇒ Ω je intuicionisticky tautologický. Odstraňme
ze stromu T každý podstrom, jehož kořen je negativní. Odstraňme případně
ještě další podstromy tak, aby každý uzavřený sekvent, který není listem,
měl právě jednoho následníka. Probráním všech případů lze ověřit, že každý vrchol
stromu T lze nejvýše n kroky a bez užití řezů odvodit v kalkulu GJ z jeho
následníků. To znamená, že strom T lze doplnit na bezřezový důkaz P sekventu
Σ ⇒ Ω v kalkulu GJ, jehož hloubka je O(n3
). Například je-li S neuzavřený
sekvent tvaru Γ, ¬A ⇒ ∆ a ¬A je ona formule D, kterou si podprogram
F zvolil mezi formulemi porušujícími uzavřenost, pak sekvent Γ, ¬A ⇒ ∆
má jednoho následníka Γ, ¬A ⇒ ∆, A , a opravdu jej z tohoto následníka lze
odvodit jedním užitím pravidla ¬-l. Je-li S uzavřený sekvent, který není listem,
pak S má tvar Γ ⇒ A1 → B1, . . , An → Bn, ¬C1, . . , ¬Cm, Π , kde pro každou implikaci
E →F ∈ Π platí E ∈ Γ a pro každou negaci ¬E ∈ Π platí E ∈ Γ. Sekvent S
má jediného následníka S tvaru Γ, Ai ⇒ Bi nebo Γ, Cj ⇒ . V tom případě
378 5 Některé neklasické logiky
můžeme sekvent S odvodit ze sekventu S tak, že užijeme pravidlo →-rI resp. ¬-rI,
a zbývající formule pak do sukcedentu přidáme pomocí pravidla W.
Předpokládejme, že výsledek celého výpočtu je NE. Pak kořen Σ ⇒ Ω stromu T
je negativní, čili sekvent Σ ⇒ Ω není intuicionisticky tautologický. Jestliže podprogram
F vyhodnotil některý sekvent S stromu T jako negativní, znamená to, že
při jeho zpracování buď dostal odpověď ne při některém volání sebe sama v řádcích
L1–L7, nebo použil řádek L9 a při všech voláních sebe sama dostal odpověď ne.
Libovolný kripkovský protipříklad na kterýkoliv ze sekventů, které jsou ve hře při
volání podprogramu F v řádcích L1–L7, je zároveň kripkovským protipříkladem na
sekvent Γ ⇒ ∆ . Indukční předpoklad říká, že každý z těchto (nejvýše dvou) sekventů
má kripkovský protipříklad. Tedy Γ ⇒ ∆ má protipříklad, a to ne větší
hloubky. Byl-li použit řádek L9 a všechny odpovědi byly ne, pak všechny sekventy
ve hře mají protipříklad (to je indukční předpoklad), a z důkazu lemmatu 5.1.10
plyne, že sekvent Γ ⇒ ∆ má protipříklad hloubky o jedna větší, než je maximální
hloubka těchto protipříkladů. Dohromady to znamená, že sekvent Σ ⇒ Ω
má protipříklad, jehož hloubka je omezena maximálním počtem užití řádku L9 na
jedné větvi výpočtu, což je nejvýše n. QED
Příklad 5.1.13 Vezměme sekvent (p → q) ∨ (q → p) → q ⇒ q a podívejme se,
jak jej zpracuje podprogram z obrázku 5.1.3 a co to znamená z hlediska věty 5.1.12.
Označme D formuli (p → q) ∨ (q → p):
......
D → q, p ⇒ q (6)
......
D → q, q ⇒ p (7)
D → q ⇒ q, D, p → q, q → p, p (5)
D → q ⇒ q, D, p → q, q → p (4)
D → q ⇒ q, D (3)
D → q, q ⇒ q (2)
D → q ⇒ q (1)
.
Podprogram nejprve uplatnil řádky L3, L5 a L7, a tím dospěl k uzavřeným sekventům
(2) a (5). Sekvent (2) je pozitivní, neboť jeho antecedent a sukcedent mají
neprázdný průnik. Při zpracování sekventu (5) podprogram uplatnil řádek L9 a
získal sekventy (6) a (7). Snadno lze ověřit, že dalším zpracováním sekventu (6),
tj. opětovným užitím řádků L3, L5, L7 a L9, se zjistí, že sekvent (6) je pozitivní.
Řádek L9 tedy vyhodnotí sekvent (5) jako pozitivní, a to bez ohledu na to, jaký
je sekvent (7) (je ale negativní). Takže i sekventy (5), (4) a (3) jsou pozitivní a
řádek L3 vyhodnotí sekvent (1) jako pozitivní. Důkaz sekventu (1) v kalkulu GJ
získáme tak, že odstraníme podstrom, v jehož kořenu je sekvent (7), mezi sekventy
(4) a (3) přidáme jeden nový sekvent D → q ⇒ q, D, p → q , protože k odstranění
formulí p → q a q → p je třeba užít pravidlo ∨-r dvakrát, a mezi sekventy (6) a (5)
přidáme několik dalších sekventů, protože sekvent (5) lze získat ze sekventu (6)
jedním užitím pravidla →-rI a čtyřnásobným užitím pravidla W. Podobné úpravy
je ovšem třeba provést také v podstromu, v jehož kořenu je sekvent (6). Je jasné, že
5.1 Intuicionistická logika 379
kdybychom byli formulovali pravidlo W tak, aby umožňovalo přidat několik formulí
najednou, odhad O(n3
) ve větě 5.1.12 bychom mohli nahradit odhadem O(n2
).
Příklad 5.1.14 Označme S sekvent ⇒ p → q, q → p, p, q . Při zpracování sekventu
S podprogram z obrázku 5.1.3 uplatní řádek L9, zavolá sám sebe na sekventy
p ⇒ q a q ⇒ p a zjistí, že oba jsou negativní, takže i sekvent S vyhodnotí
jako negativní. Všechny tři sekventy S, p ⇒ q a q ⇒ p jsou uzavřené a dávají
tříprvkový protipříklad na sekvent S: kořen modelu má dva následníky, v jednom je
splněna formule p a není splněna formule q, v druhém je naopak splněna formule q
a není splněna formule p.
V knihách [91] a [49] se uvažuje kalkulus GJ1
, ve kterém se v sukcedentu nikdy
(nejen u kritických pravidel) nepřipouští více než jedna formule a ve kterém není
pravidlo →-w. Lze dokázat (cvičení 15 a 16), že jakýkoliv důkaz v našem kalkulu
je simulovatelný užitím řezů v kalkulu GJ1
. Kalkuly GJ a GJ1
jsou ekvivalentní a
navzájem polynomiálně simulovatelné. Protože v [91] i v [49] je dokázáno, že i pro
kalkulus GJ1
platí věta o eliminovatelnosti řezů, je jasné, že i bezřezové verze kalkulů
GJ a GJ1
jsou spolu ekvivalentní. Nevíme, zda kalkulus GJ bez pravidla Cut
a bez pravidla →-w polynomiálně simuluje kalkulus GJ bez pravidla Cut. Jinými
slovy, nevíme, zda pravidlo →-w, které jsme si vymysleli, může některé bezřezové
důkazy nějak výrazněji zkrátit.
K volbě pravidel gentzenovského kalkulu ještě poznamenejme toto. Některá
z pravidel se dvěma předpoklady, totiž pravidla ∨-l a &-r, jsme formulovali se
dvěma množinami postranních formulí. Takto formulovaným pravidlům se v [94]
říká pravidla se sdíleným kontextem. Takové pravidlo lze aplikovat na dvojici sekventů
pouze tehdy, mají-li oba tutéž množinu postranních formulí v sukcedentu a
současně tutéž množinu postranních formulí v antecedentu. Zbývající pravidla se
dvěma předpoklady, totiž →-l a Cut, jsme formulovali jako kontextově nezávislá,
tj. se čtyřmi množinami postranních formulí. Nyní je jasné, proč je to užitečné.
Kdybychom pravidlo →-l formulovali jako pravidlo se sdíleným kontextem:
→-l: Γ ⇒ ∆, A , Γ, B ⇒ ∆ / Γ, A → B ⇒ ∆ ,
nemohli bychom například sekvent p, p → q ⇒ q odvodit bezřezovým důkazem,
který v žádném sukcedentu nemá více než jednu formuli. Na druhé straně kdybychom
se nechtěli zmínit i o kalkulu GJ1
, nevadilo by formulovat všechna pravidla
jako pravidla se sdíleným kontextem.
Hilbertovský kalkulus HJ pro intuicionistickou výrokovou logiku lze získat tak
(uvádíme verzi z knihy [49]), že schéma A3 kalkulu HK nahradíme následujícím
schématem A3I a přidáme jedno nové schéma A8:
A3I: (A → B) → ((A → ¬B) → ¬A),
A8: A → (¬A → B).
Kalkuly HK a HJ mají tedy společná schémata A1, A2 a A4–A7 (viz oddíl 1.3) a
shodně mají jediné odvozovací pravidlo MP. Schéma A8 vyjadřuje princip „ze sporu
380 5 Některé neklasické logiky
plyne cokoliv , tj. princip ex falso, o kterém jsme se zmínili v úvodu. Schéma A3I
říká, že pokud z A plyne spor, pak A neplatí, tj. platí ¬A. To je slabší princip, než
„pokud z ¬A plyne spor, pak A , který je vyjádřen schématem A3 klasické výrokové
logiky. Ze schématu A3I plyne pouze toto: pokud z ¬A plyne spor, pak ¬¬A.
Kalkuly GJ a HJ jsou ekvivalentní a vzájemně polynomiálně simulovatelné.
Kalkulus HJ je tedy také úplný vůči kripkovské sémantice. Přidáme-li ke kalkulu HJ
buď schéma ¬¬A → A, nebo schéma A ∨ ¬A, dostaneme kalkulus ekvivalentní
s kalkulem pro klasickou výrokovou logiku. Ověření těchto faktů ponecháváme za
cvičení.
Vraťme se nyní ke kripkovské sémantice a uvažujme o vzájemném vztahu klasické
a intuicionistické logiky.
Věta 5.1.15 (a) Formule A je tautologie (klasické výrokové logiky), právě když
formule ¬¬A je intuicionistická tautologie.
(b) Formule B → A je tautologie, právě když formule B → ¬¬A je intuicionistická
tautologie.
Důkaz Samozřejmě (a) plyne z (b) a v obou tvrzeních platí implikace ⇐: když
například ¬¬A je intuicionistickou tautologií, pak je i klasickou tautologií, a v klasické
logice je ¬¬A ekvivalentní s A. Soustřeďme se tedy na implikaci ⇒ v (b).
Nechť B → ¬¬A není intuicionistickou tautologií. To znamená, že existuje kripkovský
model K = W, ≤, − a jeho vrchol a takový, že a −/ B → ¬¬A. Podle věty o
úplnosti vůči kripkovské sémantice můžeme předpokládat, že model K je konečný.
Podmínka a −/ B → ¬¬A znamená existenci vrcholu b takového, že a ≤ b, b − B
a b − ¬A. To dále znamená, že pro každý vrchol c ≥ b platí c −/ A. Protože
model je konečný, existuje vrchol c ≥ b, který je v W, ≤, − listem, tj. z něhož
není dosažitelný žádný vrchol kromě něj samého. Víme, že v listech se pravdivostní
hodnoty formulí vyčíslují klasicky. To znamená, že pravdivostní hodnoty formulí
ve vrcholu c určují pravdivostní ohodnocení e (ve smyslu klasické logiky) takové,
že e /|= A. Díky podmínce perzistence platí ovšem c − B a e |= B. Formule B → A
tedy opravdu není klasickou tautologií. QED
Na tvrzení z předchozí věty se můžeme dívat z hlediska algoritmů a úloh, nebo
z hlediska logiky. Funkce A → ¬¬A je samozřejmě vyčíslitelná v logaritmickém
prostoru. Ekvivalence
A ∈ Taut ⇔ ¬¬A ∈ Int-Taut
tedy znamená, že Taut ≤log
m Int-Taut, takže úloha Int-Taut je coNP-těžkou
úlohou. V dalším dokážeme, že platí víc. Tvrzení, že Int-Taut je úloha rozhodnutelná
v PSPACE, které jsme získali zároveň s větou o úplnosti pro kalkulus GJ,
pravděpodobně nelze zlepšit, neboť úloha Int-Taut je PSPACE-kompletní.
Z logického hlediska lze předchozí větu chápat tak, že klasická logika je vlastně
obsažena v intuicionistické: kdo ví, co jsou intuicionistické tautologie, má také
5.1 Intuicionistická logika 381
plnou informaci o tom, které formule jsou klasickými tautologiemi. Ze dvou logik
slabší je vlastně bohatší a v uvedeném smyslu v sobě obsahuje tu silnější.
Vztah mezi klasickou logikou a intuicionistickou logikou se vyjadřuje slovy „klasická
logika je interpretovatelná v intuicionistické , funkce A → ¬¬A je interpretace
nebo překlad. Není to jediný takový překlad, trochu jiný překlad budeme uvažovat
ve cvičeních. V pododdílu o intuicionistické predikátové logice si ukážeme, že i klasická
predikátová logika je interpretovatelná v intuicionistické, ale nikoliv prostřednictvím
funkce A → ¬¬A. V predikátové logice není pravda, že pouhým připsáním
dvojné negace dostaneme z klasicky logicky platné formule formuli intuicionisticky
logicky platnou.
Následující větu dokázal Statman, [87], v r. 1979. Uvádíme vlastní důkaz, který
je inspirován Ladnerovým článkem [54], vznikl nezávisle na Statmanově důkazu,
je mu ale v lecčem podobný. V [87] je navíc dokázáno, že Int-Taut zůstane
PSPACE-kompletní úlohou i v případě, omezíme-li se jen na výrokové formule neobsahující
jiné logické spojky než implikaci. Domněnka vyslovená v [54], že Int-Taut
je v coNP, je tedy (za předpokladu, že NP = PSPACE) nesprávná.
Věta 5.1.16 Úloha Int-Taut je PSPACE-kompletní.
Důkaz Máme zvolit některou PSPACE-kompletní úlohu a logaritmickým převodem
ji převést na úlohu Int-Taut. Z oddílu 2.3 víme, že úloha QBF i její komplement
QBF jsou PSPACE-kompletními úlohami. Z cvičení 20 oddílu 2.3 dále víme,
že stačí uvažovat pouze kvantiﬁkované výrokové formule tvaru Qmpm . . Q1p1B, kde
každý ze symbolů Q1, . . , Qm je jeden z kvantiﬁkátorů ∀ nebo ∃ a formule B neobsahuje
další výrokové kvantiﬁkátory ani jiné atomy než p1, . . , pm. Každou formuli A
tohoto tvaru máme tedy v logaritmickém prostoru přepracovat na výrokovou formuli
A∗
tak, aby platila podmínka, že A je logicky platná (v tom smyslu, že je
splněna některým čili každým pravdivostním ohodnocením), právě když A∗
není
intuicionistická tautologie. Z cvičení 20 oddílu 2.3 také víme, že bychom navíc mohli
předpokládat, že v kvantiﬁkátorovém preﬁxu Qmpm . . Q1p1 formule A se střídají
existenční a univerzální kvantiﬁkátory, první z nich je existenční a jejich počet m
je sudý. To ale nebudeme potřebovat.
Nechť je tedy dána kvantiﬁkovaná výroková formule A tvaru Qmpm . . Q1p1B(p),
kde každý ze symbolů Q1, . . , Qm je jeden z kvantiﬁkátorů ∀ nebo ∃ a formule B
neobsahuje kvantiﬁkátory ani jiné atomy než p1, . . , pm. Formule A∗
j a A∗
sestrojíme
následující rekurzí podle j:
A∗
0 = ¬B(p)
A∗
j =
(pj ∨ ¬pj) → A∗
j−1 pokud Qj = ∃
(A∗
j−1 → qj) → ((pj → qj) ∨ (¬pj → qj)) pokud Qj = ∀
A∗
= A∗
m,
kde prostřední řádek platí pro 1 ≤ j ≤ m. Každá formule A∗
j je sestavena
z atomů p1, . . , pm a případně nových pomocných atomů q1, . . , qj. O atomu qj
382 5 Některé neklasické logiky
lze uvažovat jako o zkratce pro formuli A∗
j−1. Pro následující sublemma bychom
mohli vystačit i s jednodušší deﬁnicí formule A∗
j , totiž
A∗
j =
(pj ∨ ¬pj) → A∗
j−1 pokud Qj = ∃
(pj → A∗
j−1) ∨ (¬pj → A∗
j−1) pokud Qj = ∀.
Potíž je v tom, že dvojnásobný výskyt formule A∗
j−1 v A∗
j by mohl znamenat, že
délka formule A∗
j roste s j exponenciálně, a nemohli bychom tedy tvrdit, že A → A∗
je funkce počitatelná v logaritmickém prostoru (nebo v polynomiálním čase).
Sublemma Nechť e je libovolné pravdivostní ohodnocení atomů pj+1, . . , pm. Pak
e |= Qjpj . . Q1p1B(p), právě když existuje kripkovský protipříklad na formuli A∗
j ,
ve kterém jsou atomy pj+1, . . , pm ohodnoceny (ve všech vrcholech shodně) podle e.
Toto sublemma dokažme indukcí podle j. Je-li j = 0 a e |= Qjpj . . Q1p1B(p),
tj. e |= B(p), pak jednoprvkový kripkovský model, ve kterém atomy p1, . . , pm
ohodnotíme dle e, bude protipříkladem na formuli ¬B(p), tj. na formuli A∗
0. Nechť
naopak j = 0 a K je protipříklad na formuli ¬B(p), v němž všechny atomy p1, . . , pm
jsou ohodnoceny všude shodně dle e. Model K sice nemusí být jednoprvkový,
ale nic zajímavějšího než v jednoprvkovém modelu se v něm stát nemůže. Nejen
atomy, ale ani žádné jiné formule v něm nemění pravdivostní hodnotu, formule B(p)
v modelu K platí a ohodnocení e ji (v klasickém smyslu) splňuje.
Nechť j > 0, pro j − 1 tvrzení platí a nechť e je ohodnocení atomů pj+1, . . , pm
takové, že e |= Qjpj . . Q1p1B(p). Uvažujme nejprve případ Qj = ∃. Podmínka
e |= ∃pj . . Q1p1B(p) znamená, že alespoň jedno z obou ohodnocení 1 e a 0 e,
která rozšiřují e na atom pj, splňuje formuli Qj−1pj−1 . . Q1p1B(p). Indukční předpoklad
říká, že existuje kripkovský protipříklad K na formuli A∗
j−1, ve kterém jsou
atomy pj, . . , pm ohodnoceny všude shodně dle 1 e nebo dle 0 e. Označme b onen
vrchol modelu K, pro který platí b −/ A∗
j−1. Atomy pj+1, . . , pm jsou všude ohodnoceny
dle e. Atom pj je ohodnocen nějak, ale všude shodně. Tedy b − pj ∨ ¬pj
a b −/ A∗
j . Model K je hledaným protipříkladem na formuli A∗
j .
Nechť j > 0, Qj = ∀ a nechť dále e je ohodnocení atomů pj+1, . . , pm takové,
že e |= ∀pj . . Q1p1B(p). Tedy obě rozšíření 1 e a 0 e ohodnocení e na atom pj
splňují formuli Qj−1pj−1 . . Q1p1B(p). Indukční předpoklad říká, že existují kripkovské
protipříklady K1 a K0 a jejich vrcholy b1 a b0 takové, že b1 v K1 nesplňuje
formuli A∗
j−1, b0 v K0 nesplňuje A∗
j−1, atomy pj+1, . . , pm jsou ve všech vrcholech
obou modelů ohodnoceny shodně dle e, atom pj je v K1 ohodnocen všude kladně
a v K0 všude záporně. Předpokládejme, že b1 je kořenem v K1, b0 je kořenem
v K0, a utvořme nový model K přidáním nového kořenu a jako na obrázku 5.1.2.
Musíme ještě stanovit pravdivostní hodnoty všech atomů vyskytujících se v A∗
j ,
tedy atomů p1, . . , pm a q1, . . , qj, v novém kořenu a, a také pravdivostní hodnoty
atomu qj v celém modelu K. To udělejme takto:
◦ atomy pj+1, . . , pm ohodnoťme v a podle e,
◦ atomy p1, . . , pj a q1, . . , qj−1 prohlašme v a za nesplněné,
5.1 Intuicionistická logika 383
◦ atomu qj přidělme v každém vrcholu x modelu K tutéž pravdivostní hodnotu,
kterou v x má formule A∗
j−1.
Je zřejmé, že při takovémto přidělení pravdivostních hodnot je v K splněna podmínka
perzistence. Navíc a − A∗
j−1 → qj (protože qj a A∗
j−1 mají všude tutéž
pravdivostní hodnotu), a −/ pj → qj (protože b1 − pj a b1 −/ qj) a a −/ ¬pj → qj
(protože b0 − ¬pj a b0 −/ qj). Tedy a −/ A∗
j a model K je hledaným protipříkladem
na formuli A∗
j , ve kterém jsou atomy pj+1, . . , pm ohodnoceny všude dle e.
Zmiňme se ještě o implikaci ⇐ v případě, kdy j > 0. Snadno lze ověřit, že je-li
model K protipříkladem na formuli (pj ∨ ¬pj) → A∗
j−1, ve kterém jsou pj+1, . . , pm
ohodnoceny všude dle e, pak K má podmodel K , ve kterém je atom pj ohodnocen
všude shodně a který je protipříkladem na formuli A∗
j−1. A je-li K protipříkladem
na formuli (A∗
j−1 → qj) → ((pj → qj) ∨ (¬pj → qj)), pak K má dva disjunktní
podmodely K1 a K0, oba jsou protipříklady na formuli A∗
j−1, přičemž pj je v K1
ohodnocen všude kladně a v K0 všude záporně. Na modely K , K1 a K0 lze
vztáhnout indukční předpoklad. Podrobnosti přenecháváme čtenáři a sublemma
tím máme za dokázané.
Pro j = m sublemma říká, že formule A je logicky platná, právě když formule A∗
má kripkovský protipříklad. Funkce A → A∗
je tedy hledaným logaritmickým
převodem. QED
5.1.3 Sémantika intuicionistické predikátové logiky
V intuicionistické predikátové logice máme co dělat s týmiž formulemi jako v klasické
predikátové logice: jsou to formule sestavené z atomických formulí pomocí čtyř
logických spojek &, ∨, →, ¬ a dvou kvantiﬁkátorů ∀ a ∃. Sémantika intuicionistické
predikátové logiky je založena na pojmu kripkovské struktury pro daný jazyk.
Protože malá latinská písmena chceme užívat pro prvky struktur, domluvme se, že
vrcholy kripkovských rámců budeme v tomto pododdílu značit řeckými písmeny ze
začátku abecedy.
Deﬁnice 5.1.17 Řekneme, že trojice W, ≤, l je kripkovská (intuicionistická predikátová)
struktura pro jazyk L, jestliže relace ≤ je uspořádání na neprázdné množině
W a l je funkce deﬁnovaná na množině W, která splňuje podmínky:
◦ všechny hodnoty l(α) funkce l jsou struktury pro jazyk L (ve smyslu klasické
predikátové logiky bez rovnosti),
◦ jsou-li A a B nosné množiny struktur l(α) a l(β) a platí-li α ≤ β, pak A ⊆ B,
◦ jsou-li sl(α)
a sl(β)
realizace libovolného (funkčního nebo predikátového) symbolu
s ve strukturách l(α) a l(β) a platí-li α ≤ β, pak sl(α)
⊆ sl(β)
.
Dvojici W, ≤ říkáme (kripkovský) rámec struktury W, ≤, l .
I v predikátové logice můžeme prvky množiny W chápat jako informační stavy.
Podmínka A ⊆ B pro nosné množiny struktur l(α) a l(β) takových, že α ≤ β, říká,
384 5 Některé neklasické logiky
že při přechodu ze stavu α do stavu β dosažitelného z α nemohou zmizet žádné
objekty (univerza, o kterém se mluví). Podmínka sl(α)
⊆ sl(β)
říká, že nemohou
zmizet ani informace o vztazích mezi objekty. Může ale vyjít najevo existence
nových objektů a nových vztahů.
A1
A2
A3
a b
a b a b
c






o






U






o






U
E
E EU o
§ ¤
¥c
§ ¤
¥c
§ ¤
¥c
§ ¤
¥c
§ ¤
¥c
Obrázek 5.1.5: Predikátová kripkovská struktura
Na obrázku 5.1.5 je příklad predikátové kripkovské struktury W, ≤, l pro jazyk
s jedním binárním predikátovým symbolem R. Rámec W, ≤ této struktury
má tři prvky α1, α2 a α3, které nejsou znázorněny a kterým funkce l přiřazuje
struktury A1, A2 a A3. Relace ≤ je nejmenší (tranzitivní a) reﬂexivní relace
na množině {α1, α2, α3} obsahující množinu {[α1, α2], [α1, α3]}. Tenkými šipkami
je znázorněna jak inkluze mezi nosnými množinami struktur, tak relace dosažitelnosti
≤. Silnější šipky znázorňují relaci R. Nová informace, která byla získána při
přechodu ze stavu α1 do stavu α2, zní, že pro objekt a platí a R a. Nová informace,
která byla získána při přechodu ze stavu α1 do stavu α3, zní, že kromě objektů a a b
existuje také objekt c, pro který platí a R c, b R c a c R c.
Je-li e ohodnocení proměnných v nějaké struktuře l(α) a platí-li α ≤ β, pak
vzhledem k inkluzi, která platí pro nosné množiny struktur l(α) a l(β), je ohodnocení
e současně i ohodnocením proměnných ve struktuře l(β). Snadno lze ověřit,
že je-li t term jazyka L a je-li b jeho hodnota ve struktuře l(α), pak b je hodnota
termu t i v každé struktuře l(β) takové, že α ≤ β.
Deﬁnice 5.1.18 Nechť W, ≤, − je kripkovská struktura pro jazyk L. Relace −
mezi prvky α množiny W, predikátovými formulemi ϕ a ohodnoceními e proměnných
ve struktuře l(α) je deﬁnována podmínkami:
◦ je-li ϕ atomická formule jazyka L, pak α − ϕ[e], právě když l(α) |= ϕ[e] (ve
smyslu klasické predikátové logiky),
◦ α − (ϕ & ψ)[e], právě když α − ϕ[e] a α − ψ[e],
5.1 Intuicionistická logika 385
◦ α − (ϕ ∨ ψ)[e], právě když α − ϕ[e] nebo α − ψ[e],
◦ α − (ϕ → ψ)[e], právě když pro každý stav β ≥ α, pro který platí β − ϕ[e],
platí i β − ψ[e],
◦ α − (¬ϕ)[e], právě když pro každý stav β ≥ α platí β −/ ϕ[e],
◦ α − (∃xϕ)[e], právě když existuje prvek a nosné množiny struktury l(α) takový,
že α − ϕ[e(x/a)],
◦ α − (∀xϕ)[e], právě když pro každý stav β ≥ α a pro každý prvek b nosné
množiny struktury l(β) platí β − ϕ[e(x/b)].
Podmínku α − ϕ[e] čteme „formule ϕ je splněna ohodnocením e ve vrcholu α .
Je zřejmé, že posledních šest podmínek odpovídá podmínkám T4–T9 z deﬁnice
3.1.9 (v jiném pořadí). Podmínka pro univerzální kvantiﬁkátor se podobá
podmínce pro implikaci a negaci v tom, že chceme-li určit, zda α − (∀xϕ)[e],
potřebujeme vědět, kterými ohodnoceními je formule ϕ splněna ve vrcholech dosažitelných
z vrcholu α. Naproti tomu chceme-li určit, zda α − (∃xϕ)[e], stačí vědět,
kterými ohodnoceními je formule ϕ splněna v samotném vrcholu α.
V dalším budeme někdy ztotožňovat vrchol α kripkovské struktury W, ≤, l se
strukturou l(α), tj. budeme si myslet, že prvky množiny W jsou struktury v klasickém
smyslu a že l je identická funkce, a budeme psát například D − ϕ[e] místo
D = l(α) a α − ϕ[e]. Takovéto zjednodušení je ovšem zcela korektní pouze tehdy,
je-li funkce l prostá, což obecně být nemusí.
Podívejme se ještě jednou na strukturu z obrázku 5.1.5. K libovolnému objektu d
libovolného ze tří stavů této struktury existuje v tomtéž stavu objekt d takový,
že R[d, d ]. Tedy formule ∃yR(x, y) je splněna všemi prvky všech tří stavů. To
znamená, že αi − ∀x∃yR(x, y) pro i ∈ {1, 2, 3}. Platí α1 −/ ∀xR(x, y)[b], není
totiž pravda, že ve všech stavech viditelných z α1 vede do b šipka ze všech objektů.
Ani a ovšem v α1 nesplňuje formuli ∀xR(x, y). Tedy α1 −/ ∃y∀xR(x, y). Platí ale
α2 − ∃y∀xR(x, y) i α3 − ∃y∀xR(x, y). To znamená, že formule ¬∃y∀xR(x, y)
není splněna v žádném ze tří stavů, a naopak formule ¬¬∃y∀xR(x, y), kterou lze
číst „nemůže neexistovat y takové, že . . . , je ve všech splněna.
Lemma 5.1.19 Nechť W, ≤, l je kripkovská struktura, nechť α a β jsou její vrcholy
takové, že α ≤ β, a nechť ϕ je formule a e ohodnocení proměnných ve
struktuře l(α). Když α − ϕ[e], pak β − ϕ[e].
Důkaz Indukcí podle složitosti formule ϕ. QED
Řekneme, že struktura W, ≤, l je (intuicionistický kripkovský) protipříklad na
sekvent Γ ⇒ ∆ , jestliže existuje vrchol α ∈ W a ohodnocení proměnných e ve
struktuře l(α) tak, že α − ϕ[e] pro všechny formule ϕ ∈ Γ a α −/ ϕ[e] pro všechny
formule ϕ ∈ ∆. Sekvent Γ ⇒ ∆ je intuicionisticky logicky platný, jestliže nemá
žádný kripkovský protipříklad. Formule ϕ je intuicionisticky logicky platná, jestliže
sekvent ⇒ ϕ je intuicionisticky logicky platný.
386 5 Některé neklasické logiky
Dále řekneme, že formule ϕ je intuicionistický důsledek množiny formulí ∆,
jestliže je v každém vrcholu každé kripkovské struktury splněna každým ohodnocením
proměnných, které v něm splňuje všechny formule z množiny ∆. Formule ϕ
je intuicionistický důsledek formule ψ, jestliže je intuicionistickým důsledkem množiny
{ψ}. Formule ϕ a ψ jsou intuicionisticky ekvivalentní, jestliže každá z nich je
intuicionistickým důsledkem druhé.
Příklad 5.1.20 Nechť P je unární predikátový symbol, nechť W, ≤, l je kripkovská
struktura pro jazyk {P} a nechť α je vrchol struktury W, ≤, l , v němž je (některým
čili každým ohodnocením proměnných) splněna sentence ∀v(P(v)∨¬P(v)).
Je-li a je libovolný prvek nosné množiny struktury l(α), pak z příslušných řádků
deﬁnice 5.1.17 plyne α − (P(x) ∨ ¬P(x))[a] i α − (∃vP(v) ∨ ¬P(x))[a]. Tudíž
první dva z následujících tří sekventů jsou intuicionisticky logicky platné:
∀v(P(v) ∨ ¬P(v)) ⇒ P(x), ¬P(x) ,
∀v(P(v) ∨ ¬P(v)) ⇒ ∃vP(v), ¬P(x) ,
∀v(P(v) ∨ ¬P(v)) ⇒ ∃vP(v), ∀v¬P(v) .
Zvolme W = {A1, A2}, kde A1 ≤ A2, A1 = {a}, A2 = {a, b} a pro realizaci
symbolu P platí PA
1 = ∅ a PA
2 = {b}. Tím jsme získali intuicionistickou strukturu,
která je protipříkladem na třetí sekvent: objekt a splňuje v A1 i v A2 formuli
¬P(x), objekt b splňuje v A2 (tj. všude, v A1 se totiž nevyskytuje) formuli
P(x), tedy A1 − ∀v(P(v) ∨ ¬P(v)); na druhé straně ale A1 −/ ∀v¬P(v)
(protože A2 −/ (¬P(x))[b]) a A1 −/ ∃vP(v).
Gentzenovský kalkulus GJ pro intuicionistickou predikátovou logiku má táž výroková
a strukturální pravidla, která jsme deﬁnovali v předchozím pododdílu, a
dále čtyři kvantiﬁkátorová pravidla:
∃-r: Γ ⇒ ∆, ϕx(t) / Γ ⇒ ∆, ∃xϕ ,
∀-l: Γ, ϕx(t) ⇒ ∆ / Γ, ∀xϕ ⇒ ∆ ,
∃-l: Γ, ϕx(y) ⇒ ∆ / Γ, ∃xϕ ⇒ ∆ ,
∀-rI: Γ ⇒ ϕx(y) / Γ ⇒ ∀xϕ .
kde, jako v klasické predikátové logice, t je term a y je proměnná substituovatelná
za x do formule ϕ, a u pravidel generalizace, tj. u pravidel ∃-l a ∀-rI, se proměnná
y nevyskytuje ve výsledném sekventu. První tři pravidla jsou úplně stejná
jako v klasické predikátové logice. Pravidlo ∀-rI můžeme nazývat kritickým; stejně
jako pravidla →-rI a ¬-rI je použitelné jen tak, že po jeho použití je sukcedent
jednoprvkový. Z příkladu 5.1.20 je zřejmé, že klasické pravidlo ∀-r s libovolnou
množinou postranních formulí v sukcedentu není korektní vůči sémantice intuicionistické
predikátové logiky.
5.1 Intuicionistická logika 387
Věta 5.1.21 (o korektnosti kalkulu GJ) Každý sekvent dokazatelný v predikátovém
kalkulu GJ je intuicionisticky logicky platný. Kalkulus GJ je tedy korektní
vůči kripkovské sémantice intuicionistické predikátové logiky.
Důkaz Korektnost strukturálních a výrokových pravidel platí ze stejných důvodů
jako ve výrokové logice. Dokažme korektnost pravidla ∀-rI; ověření korektnosti
ostatních pravidel ponecháváme na čtenáři. Nechť Γ ⇒ ϕx(y) je intuicionisticky
logicky platný sekvent, W, ≤, l je kripkovská struktura, α její vrchol a e
ohodnocení proměnných ve struktuře l(α) takové, že α − Γ[e]. Máme ověřit,
že α − (∀xϕ)[e]. Podle podmínky pro univerzální kvantiﬁkátor v deﬁnici 5.1.18
máme zdůvodnit, že β − ϕ[e(x/b)] pro libovolný vrchol β dosažitelný z vrcholu α
a pro libovolný prvek b struktury l(β). Nechť tedy vrchol β ≥ α a prvek b nosné
množiny struktury l(β) jsou dány. Lemma 5.1.19 dává β − Γ[e]. Dále můžeme
uvažovat stejně jako v důkazu věty 3.3.1: protože proměnná y se nevyskytuje volně
ve formulích z množiny Γ, platí β − Γ[e], protože sekvent Γ ⇒ ϕx(y) je intuicionisticky
logicky platný, máme β − (ϕx(y))[e(y/b)], a protože proměnná y nemá
volné výskyty ve formuli ∀xϕ, jsou podmínky β − ϕx(y)[e(y/b)] a β − ϕ[e(x/b)]
spolu ekvivalentní. QED
∀y(. .), ¬P(z) ⇒ ¬P(z)
∀y(. .), ¬P(z) ⇒ ∃x¬P(x)
∀y(. .), ¬P(z) ⇒ . .
P(z) ⇒ P(z), P(y)
¬P(z), P(z) ⇒ P(y) P(y), P(z) ⇒ P(y)
¬P(z) ∨ P(y), P(z) ⇒ P(y)
∀y(¬P(z) ∨ P(y)), P(z) ⇒ P(y)
∀y(¬P(z) ∨ P(y)), P(z) ⇒ ∀yP(y)
∀y(¬P(z) ∨ P(y)), P(z) ⇒ ∃x¬P(x) ∨ ∀yP(y)
∀y(¬P(z) ∨ P(y)), ¬P(z) ∨ P(z) ⇒ ∃x¬P(x) ∨ ∀yP(y)
∀y(¬P(z) ∨ P(y)) ⇒ ∃x¬P(x) ∨ ∀yP(y)
∃x∀y(¬P(x) ∨ P(y)) ⇒ ∃x¬P(x) ∨ ∀yP(y)
Obrázek 5.1.6: Příklad důkazu v intuicionistickém predikátovém kalkulu
Na obrázku 5.1.6 je příklad (bezřezového) důkazu v kalkulu GJ. Předpokládáme,
že čtenář dovede doplnit formule, které jsme kvůli úspoře místa naznačili
tečkami. Tento důkaz je obtížnější polovinou důkazu, že formuli ∃x¬P(x)∨∀yP(y)
lze v intuicionistické logice převést na prenexní normální tvar. To je ne zcela samozřejmý
výsledek, neboť věta o převeditelnosti libovolné formule na prenexní normální
tvar v intuicionistické logice obecně neplatí.
Větou o úplnosti a větou o kompaktnosti pro intuicionistickou logiku se nezabývejme.
Spokojme se s prohlášením ex cathedra, že obě věty platí. Důkaz lze nalézt
například v [14], v [22] nebo v [91]. Některá cvičení dávají návod na sestrojení
alternativního důkazu věty o úplnosti pro výrokové kalkuly, ze kterého plyne věta
o kompaktnosti alespoň pro výrokovou logiku a který by šlo zobecnit i na predi-
388 5 Některé neklasické logiky
kátovou logiku. Také věta o eliminovatelnosti řezů platí i pro predikátovou verzi
kalkulu GJ, důkaz lze získat například modiﬁkací našeho důkazu z oddílu 3.3.
Hilbertovský kalkulus HJ pro intuicionistickou predikátovou logiku lze utvořit
tak, že k výrokovému kalkulu HJ uvedenému v předchozím pododdílu přidáme
schémata B1 a B2 a pravidla Gen-A a Gen-E. To znamená, že axiomy a pravidla
klasického hilbertovského kalkulu týkající se kvantiﬁkátorů vyhovují bez jakékoliv
modiﬁkace i pro intuicionistickou logiku. Důkaz ekvivalence a vzájemné polynomiální
simulovatelnosti kalkulů HJ a GJ ponecháváme za cvičení.
Uvažujme nyní jazyk s jediným unárním predikátovým symbolem P a všechny
sentence, které lze v tomto jazyce napsat bez užití binárních logických spojek. To
nám dá podrobnější představu o chování kvantiﬁkátorů v intuicionistické logice a o
vzájemné interakci obou kvantiﬁkátorů a negace. V klasické logice jsou ve hře jen
čtyři sentence: ∀xP(x), ∃xP(x) a jejich negace. Vezměme první z nich, ∀xP(x),
a zkoumejme, jaké implikace v intuicionistické logice platí mezi ní a sentencemi
¬∃x¬P(x), ∀x¬¬P(x), ¬¬∀xP(x) a ¬¬∀x¬¬P(x), které jsou s ní klasicky ekvivalentní.
Žádné jiné sentence nemusíme uvažovat ani v intuicionistické logice: každá
další sentence neobsahující binární logické spojky a klasicky ekvivalentní se sentencí
∀xP(x) už obsahuje jalové kvantiﬁkátory nebo trojnou negaci.
Snadno lze dokázat, že každé dvě formule tvaru ¬∃xϕ a ∀x¬ϕ jsou spolu intuicionisticky
ekvivalentní. Z toho plyne, že sentence ∀x¬¬P(x) a ¬∃x¬P(x) jsou spolu
ekvivalentní, a také ¬¬∀x¬¬P(x) je ekvivalentní s ¬¬¬∃x¬P(x), tedy s ¬∃x¬P(x).
Vezmeme-li v úvahu ještě implikaci ¬¬∀xP(x) → ∀x¬¬P(x), jejíž důkaz ponecháváme
na čtenáři, můžeme našich pět sentencí sestavit do posloupnosti
∀xP(x), ¬¬∀xP(x), ∀x¬¬P(x), ¬∃x¬P(x), ¬¬∀x¬¬P(x),
ve které každá následující sentence vyplývá z předchozí a poslední tři jsou spolu
ekvivalentní. Svislými čarami jsou odděleny neekvivalentní sentence. Protipříklad
na implikaci ¬¬∀xP(x) → ∀xP(x) lze sestrojit snadno, stačí vzít kripkovskou
strukturu se dvěma stavy a jediným objektem, který nejprve nemá a potom má
vlastnost P. Protipříklad na implikaci ∀x¬¬P(x)→¬¬∀xP(x) je na obrázku 5.1.7.
Je to kripkovská struktura, která má nekonečně mnoho stavů α0 ≤ α1 ≤ α2 ≤ . . . ,
jimž funkce l přiřazuje struktury A0, A1, A2 atd. Každá struktura An obsahuje
jeden „nový objekt n a n „starých objektů 0, . . , n − 1. Realizace symbolu
P je naznačena ovály. Staré objekty mají vlastnost P, nový ji nemá. Od
okamžiku n + 1 ji ale mít bude, a to už pořád. Tedy v αn nový objekt n splňuje
formuli ¬¬P(x). Objekty 0, . . , n − 1 ji ovšem splňují také, a platí to pro každé n.
Tedy α0 − ∀x¬¬P(x). Na druhé straně jsou z každého stavu αn viditelné objekty,
které nesplňují formuli P(x). Tedy αn −/ ∀xP(x), a proto α0 − ¬∀xP(x).
Právě popsaný příklad ukazuje důležité rozdíly mezi výrokovou a predikátovou
variantou intuicionistické logiky. Pro sentence ϕ = ¬¬∀xP(x) a ψ = ∀x¬¬P(x)
jsme chtěli sestrojit strukturu a její vrchol α tak, aby platilo α − ψ a α −/ ϕ.
Sestrojili jsme strukturu a její vrchol α dokonce takové, že α − ψ a α − ¬ϕ.
Toto je něco, co by se ve výrokové logice stát nemohlo, a je to zároveň důvod, proč
5.1 Intuicionistická logika 389
jsme sentence ϕ a ψ v našem seznamu pěti sentencí oddělili dvojitou čarou. Když
ψ →ϕ je výroková formule a a vrchol nějakého modelu takový, že a − ψ a a − ¬ϕ,
pak a −/ ψ → ¬¬ϕ, a podle věty 5.1.15 formule ψ → ϕ není klasickou tautologií.
V predikátové logice ale existují sentence ψ a ϕ takové, že ψ →ϕ je klasicky logicky
platnou formulí, a přitom ψ → ¬¬ϕ není intuicionisticky logicky platnou formulí.
Z toho plyne, že analogie věty 5.1.15 v intuicionistické predikátové logice neplatí.
0
T
0
T
0
T
0
T
1
T
1
T
1
T
2
T
2
T
3
T


¨
©


¨
©


¨
©
A0
A1
A2
A3
...
...
...
...
Obrázek 5.1.7: Protipříklad na schéma DNS
O kripkovské struktuře řekneme, že je konečná, má-li jen konečně mnoho stavů
(které ovšem mohou být nekonečné). O schématu
DNS: ∀x¬¬P(x) → ¬¬∀xP(x),
jehož označení pochází z anglického double negation shift, přesunutí dvojné negace
před univerzální kvantiﬁkátor, lze ověřit, že platí v každé konečné kripkovské struktuře.
To znamená, že existují formule, které mají protipříklad, ale nemají konečný
protipříklad, a tedy že FMP, vlastnost konečných modelů, pro intuicionistickou
predikátovou logiku neplatí.
I v predikátové logice ale platí, že kdo zná intuicionistickou logiku, zná vlastně i
klasickou, neboť klasická predikátová logika je interpretovatelná v intuicionistické.
Jednou z možností, jak zvolit příslušný překlad, je tato:
ϕ∗
= ϕ, je-li ϕ atomická,
(ϕ ψ)∗
= ϕ∗
ψ∗
, je-li kterákoliv ze spojek &, ∨, →,
(¬ϕ)∗
= ¬ϕ∗
, (∃xϕ)∗
= ∃xϕ∗
, (∀xϕ)∗
= ∀x¬¬ϕ∗
.
Formule ϕ∗
tedy vznikne z ϕ připsáním dvojné negace za každý univerzální kvantiﬁkátor.
Označme ještě Σ∗
= { ϕ∗
; ϕ ∈ Σ } a ¬Σ = { ¬ϕ ; ϕ ∈ Σ }, kde Σ je
libovolná množina formulí.
Věta 5.1.22 Libovolný sekvent Γ ⇒ ∆ je klasicky logicky platný, právě když
sekvent Γ∗
, ¬∆∗
⇒ je intuicionisticky logicky platný. Tedy libovolná predikátová
390 5 Některé neklasické logiky
formule ϕ je klasicky logicky platná, právě když formule ¬¬ϕ∗
je intuicionisticky
logicky platná.
Důkaz Je jasné, že druhá část věty plyne z první, neboť ϕ je klasicky logicky
platná, právě když sekvent ⇒ ϕ je klasicky logicky platný, a ¬¬ϕ∗
je intuicionisticky
logicky platná, právě když sekvent ¬ϕ∗
⇒ je intuicionisticky logicky
platný. Také je jasné, že je-li sekvent Γ∗
, ¬∆∗
⇒ intuicionisticky logicky platný,
pak sekvent Γ∗
⇒ ¬¬∆∗
je klasicky logicky platný, a také sekvent Γ ⇒ ∆ je
klasicky logicky platný; každá formule ¬¬ψ∗
v ¬¬∆∗
je totiž klasicky ekvivalentní
s formulí ψ.
Zbývá dokázat jen implikaci ⇒ v první části věty. Věta o úplnosti pro klasický
kalkulus GK říká, že každý logicky platný sekvent je v kalkulu GK dokazatelný.
Můžeme tedy postupovat indukcí podle počtu kroků v důkazu sekventu. Proberme
na ukázku případ, kdy poslední krok v důkazu daného sekventu je &-r. Všechny
ostatní případy jsou podobné nebo jednodušší. Mějme tedy důkaz tvaru
Π ⇒ Λ, ϕ
e
e
e
£
£
£
P1
Π ⇒ Λ, ψ
g
g
g
¡
¡
¡
P2
Π ⇒ Λ, ϕ & ψ
v kalkulu GK. Ten lze přepracovat na důkaz v kalkulu GJ:
¬(ϕ∗
& ψ∗
), ψ∗
⇒ ¬ϕ∗
e
e
e
£
£
£
P0
Π∗
, ¬Λ∗
, ¬ϕ∗
⇒
g
g
g
¡
¡
¡
P1
Π∗
, ¬Λ∗
, ¬(ϕ∗
& ψ∗
), ψ∗
⇒
Π∗
, ¬Λ∗
, ¬(ϕ∗
& ψ∗
) ⇒ ¬ψ∗
Π∗
, ¬Λ∗
, ¬ψ∗
⇒
g
g
g
¡
¡
¡
P2
Π∗
, ¬Λ∗
, ¬(ϕ∗
& ψ∗
) ⇒ .
Důkazy P1 a P2 sekventů Π∗
, ¬Λ∗
, ¬ϕ∗
⇒ a Π∗
, ¬Λ∗
, ¬ψ∗
⇒ existují podle
indukčního předpokladu, důkaz P0 sekventu ¬(ϕ∗
& ψ∗
), ϕ∗
⇒ ¬ψ∗
lze snadno
sestrojit. QEDE
Cvičení
1. Dokažte lemma 5.1.3.
2. Nechť a je libovolný vrchol libovolného kripkovského modelu. Dokažte, že
a − ¬¬A, právě když ∀b ≥ a∃c ≥ b(c − A).
3. Nechť A je libovolná výroková formule a W, ≤, − je libovolný kripkovský
model. Dokažte, že ke každému vrcholu a ∈ W existuje vrchol b ∈ W takový,
že a ≤ b, a přitom b − A nebo b − ¬A. Vyvoďte z toho, že každá formule
tvaru ¬¬(A ∨ ¬A) je intuicionistickou tautologií.
5.1 Intuicionistická logika 391
4. Dokažte, že množina Int-Taut je uzavřená na pravidlo substituce.
5. Rozhodněte, které z následujících formulí (schémat) jsou intuicionistické tau-
tologie:
(A → B) → (¬B → ¬A), A ∨ ¬A → (¬¬A → A),
(¬B → ¬A) → (A → B), ¬¬A ∨ (¬¬A → A),
(¬¬A → B) → (¬B → ¬A), (A → ¬¬B) → (¬¬A → ¬¬B),
(A → B) ∨ (B → A), (A → ¬¬B) → ¬¬(A → B),
¬(A → B) → ¬B, ¬¬(A → B) → (A → ¬¬B),
¬(A → B) → A, A & (B ∨ C) → (A & B) ∨ (A & C),
¬(A → B) → ¬¬A, A ∨ (B & C) → (A ∨ B) & (A ∨ C),
(A → B) → ((¬A → B) → B), A → (B ∨ C) → (A → B) ∨ (A → C),
(A → B) → (¬¬A → ¬¬B), ¬¬(A & B) ≡ (¬¬A & ¬¬B),
¬A ∨ ¬¬A, ¬¬(¬¬A → A).
6. Nechť W, ≤, − je kripkovský model pro intuicionistickou výrokovou logiku.
Řekneme, že formule A v modelu W, ≤, − deﬁnuje množinu X ⊆ W, jestliže
X = { x ∈ W ; x − A }. Řekneme, že množina X ⊆ W je deﬁnovatelná
v modelu W, ≤, − , jestliže existuje formule, která ji v něm deﬁnuje. Například
v modelu z obr. 5.1.1 deﬁnuje formule p&q množinu {d}. Dokažte indukcí podle
složitosti formule A, že neobsahuje-li formule A spojku &, pak A v modelu
z obr. 5.1.1 nedeﬁnuje množinu {d}. Vyvoďte z toho, že formule p & q není
v intuicionistické logice ekvivalentní s žádnou formulí neobsahující spojku &.
To znamená, že konjunkce není v intuicionistické logice vyjádřitelná pomocí
ostatních logických spojek. Podobnou úvahu (a model) lze navrhnout i pro
ostatní logické spojky, viz [9].
7. Je-li A∨B intuicionistická tautologie, pak alespoň jedna z formulí A a B je také
intuicionistická tautologie. Dokažte pomocí amalgamace kripkovských modelů.
8. Řekneme, že A je negativní formule, jestliže A je výroková formule sestavená
pomocí konjunkce, implikace a negace z negovaných atomů. Dokažte, že není-li
negativní formule intuicionistickou tautologií, pak má jednoprvkový kripkovský
protipříklad, a není tedy ani klasickou tautologií.
Návod. Dokažte indukcí podle složitosti formule A, že je-li W, ≤, − kripkovský
model a platí-li a −/ A pro negativní formuli A a nějaký vrchol a ∈ W, pak
existuje vrchol b ≥ a takový, že b −/ A a v podstromu generovaném vrcholem b
žádný z atomů vyskytujících se ve formuli A nemění pravdivostní hodnotu.
9. Nechť A je negativní formule. Rozhodněte, zda formule ¬¬A → A a A ∨ ¬A
musí být intuicionistické tautologie.
392 5 Některé neklasické logiky
10. Nechť p0, p1, p2, . . . , q0, q1, q2, . . . jsou navzájem různé výrokové atomy a nechť
posloupnosti An a Bn výrokových formulí jsou deﬁnovány takto:
A0 = ⊥, An+1 = pn ∨ (pn → An),
B0 = ⊥, Bn+1 = (Bn → qn) → (pn → qn) ∨ (¬pn → qn).
Má každá formule An a Bn kripkovský protipříklad? Jaká je jeho minimální
hloubka a počet vrcholů?
11. Zdůvodněte, že výrokový kalkulus GJ je korektní vůči kripkovské sémantice.
12. Dokažte v kalkulu GJ všechny formule z cvičení 5, které jsou intuicionistickými
tautologiemi.
13. (a) Dokažte, že každý sekvent tvaru ¬(A & B), ¬(¬A ∨ ¬B) ⇒ je v gentzenovském
intuicionistickém kalkulu GJ dokazatelný.
(b) Dokažte, že každý sekvent tvaru
¬(p1 & . . & pn), ¬(¬p1 ∨ . . ∨ ¬pn) ⇒
je v kalkulu GJ dokazatelný. Předpokládejte, že závorky se kumulují doprava,
tj. například p1 & (p2 & (. . & pn) . .). Lze sestrojit buď bezřezový důkaz
hloubky O(n2
), nebo zobecněním bodu (a) sestrojit důkaz hloubky O(n) s řezy
na formule ¬(p2 & . . & pn), ¬(p3 & . . & pn) atd.
14. Řekneme, že D je harropovská formule, jestliže disjunkce se v D vyskytuje
pouze v rozsahu některé negace nebo v „levém rozsahu některé implikace.
Dokažte, že když Γ ⇒ ∆ je intuicionisticky tautologický sekvent, množina Γ
obsahuje pouze harropovské formule a ∆ = ∅, pak existuje formule A ∈ ∆
taková, že Γ ⇒ A je intuicionisticky tautologický sekvent.
Návod. Postupujte indukcí podle počtu kroků v bezřezovém důkazu sekventu
Γ ⇒ ∆ v kalkulu GJ.
15. Dokažte, že každý sekvent dokazatelný v kalkulu GJ má důkaz (s řezy), ve
kterém není použito pravidlo →-w.
16. Dokažte, že je-li sekvent Γ ⇒ ∆ dokazatelný v kalkulu GJ, pak sekvent
Γ ⇒ ∆ má důkaz (s řezy), ve kterém se v žádném sukcedentu nevyskytuje
víc než jedna formule, tj. má důkaz v kalkulu GJ1
.
17. Dokažte, že jak užitím schématu ¬¬A → A, tak užitím schématu A ∨ ¬A lze
v kalkulu HJ dokázat axiom A3 klasické výrokové logiky.
18. Dokažte implikaci ⇒ v tvrzení 5.1.15 indukcí dle délky důkazu v kalkulu HJ.
19. Navrhněte modiﬁkace kalkulů GJ a HJ pro případ, kdy nikoliv ¬, ale ⊥ je
základním symbolem, a ¬A se deﬁnuje jako A → ⊥.
20. Množina Γ výrokových formulí je D-úplná, jestliže
5.1 Intuicionistická logika 393
◦ Γ je bezesporná, tj. neexistuje formule A taková, že z Γ lze (v kalkulu HJ)
dokázat A i ¬A,
◦ Γ je deduktivně uzavřená, tj. kdykoliv Γ A, pak A ∈ Γ,
◦ kdykoliv A ∨ B ∈ Γ, pak A ∈ Γ nebo B ∈ Γ.
Dokažte, že když ∆ A, pak existuje D-úplná množina Γ ⊇ ∆ taková, že Γ A.
Návod. Vezměte posloupnost B0, B1, B2, . . . všech výrokových formulí a deﬁnujte
posloupnost Γ0, Γ1, Γ2, . . . množin rekurzí: Γ0 = ∆, Γn+1 = Γn ∪ {Bn},
jestliže Γn ∪ {Bn} A, jinak Γn+1 = Γn. Zdůvodněte, že Γ = n Γn vyhovuje.
21. Vypracujte alternativní důkaz věty o úplnosti kalkulu HJ vůči kripkovské sémantice
založený na předchozím cvičení. Vezměte model W, ≤, − , kde W je
množina všech D-úplných množin, ≤ je inkluze a − je pro atomy deﬁnována
podmínkou Γ − p ⇔ p ∈ Γ. Model W, ≤, − je „univerzální protipříklad :
každá formule nedokazatelná v kalkulu HJ je nesplněna v některém vrcholu
tohoto (jednoho) modelu.
22. Zdůvodněte, že z předchozích cvičení plyne i věta o kompaktnosti pro intuicionistickou
výrokovou logiku.
23. (topologická sémantika intuicionistické logiky) Nechť S je topologický prostor.
Funkce v z množiny všech výrokových formulí do množiny všech otevřených
množin prostoru S je topologická evaluace v S, jestliže splňuje rovnosti
v(A & B) = v(A) ∩ v(B), v(A ∨ B) = v(A) ∪ v(B), v(⊥) = ∅,
v(A → B) = Int(v(A) ∪ v(B)),
kde Int(X) je vnitřek množiny X (tj. sjednocení všech otevřených podmnožin
množiny X). Deﬁnujme dočasně, že A je topologická tautologie, jestliže platí
v(A) = S pro každý prostor S a pro každou topologickou evaluaci v v S.
Dokažte, že každá intuicionistická tautologie je topologickou tautologií.
Návod. Postupujte indukcí podle počtu kroků v důkazu v kalkulu HJ. Dokažte
pomocné tvrzení, že je-li X libovolná a Z uzavřená množina prostoru S, pak
Int(Z ∪ X) ⊆ Z ∪ Int(X) a Int(Z ∪ X) = Int(Z ∪ Int(X)).
24. Dokažte, že každá topologická tautologie je intuicionistickou tautologií.
Návod. Deﬁnujte, že podmnožina nějakého kripkovského modelu je otevřená,
jestliže s každým prvkem x obsahuje i všechny y dosažitelné z x.
25. Deﬁnujme dočasně, že sekvent je skoro uzavřený, jestliže splňuje první čtyři
z pěti podmínek v deﬁnici 5.1.8. Nechť Γ ⇒ ∆ je sekvent nedokazatelný
v kalkulu GJ. Vezměte za W množinu všech skoro uzavřených nedokazatelných
sekventů sestavených z podformulí formulí vyskytujících se v Γ ⇒ ∆ .
Deﬁnujte relaci dosažitelnosti na množině W podmínkou
Π1 ⇒ Λ1 ≤ Π2 ⇒ Λ2 ⇔ Π1 ⊆ Π2.
394 5 Některé neklasické logiky
Dokončete důkaz úplnosti kalkulu GJ vůči kripkovské sémantice. Zdůvodněte,
že i pro kalkulus vzniklý z GJ odstraněním pravidla →-w platí věta o úplnosti
a věta o eliminovatelnosti řezů.
26. Dokažte, že v logice vzniklé přidáním schématu (A → B) ∨ (B → A) k intuicionistické
logice nelze dokázat A ∨ ¬A, lze ale dokázat formule ¬A ∨ ¬¬A
i (¬¬A → A) → (A ∨ ¬A).
Návod. Uvažte, že daná logika je korektní vůči třídě všech lineárně uspořádaných
rámců.
27. Dokažte, že když X je libovolná bezesporná množina výrokových formulí uzavřená
na pravidlo substituce a platí Int-Taut ⊆ X, pak X ⊆ Taut. Množina
Taut je tedy jedinou maximální bezespornou množinou obsahující množinu
Int-Taut. Jak rozumíte termínu bezesporná?
Návod. Není-li A tautologie, pak z A lze substitucí získat formuli A takovou,
že ¬A je tautologie.
28. Rozhodněte, zda množina všech intuicionistických tautologií, které jsou negativními
formulemi, resp. které jsou harropovskými formulemi, je PSPACE-kom-
pletní.
29. Nechť P je unární predikátový symbol. Určete, jaké implikace platí v intuicionistické
predikátové logice mezi formulemi
(a) ∃xP(x), ¬¬∃xP(x), ∃x¬¬P(x), ¬∀x¬P(x), ¬¬∃x¬¬P(x),
(b) ¬∀xP(x), ∃x¬P(x), ¬∀x¬¬P(x), ¬¬∃x¬P(x),
(c) ¬∃xP(x), ∀x¬P(x), ¬∃x¬¬P(x), ¬¬∀x¬P(x).
Sestrojte příslušné důkazy v kalkulu GJ a kripkovské protipříklady. Ve všech
případech, kdy zjistíte, že implikace není intuicionisticky logicky platná, určete
také, zda je možné, aby současně platily premisa a negace závěru.
30. Určete, které z následujících formulí jsou intuicionisticky logicky platné. Sestrojte
příslušné důkazy a protipříklady. Předpokládejte, že formule χ neobsahuje
volné výskyty proměnné x.
¬∃xϕ ≡ ∀x¬ϕ, ∀x(ϕ & ψ) ≡ ∀xϕ & ∀xψ,
∃x¬ϕ → ¬∀xϕ, ∀x(χ ∨ ϕ) ≡ χ ∨ ∀xϕ,
∃x(χ ∨ ϕ) ≡ χ ∨ ∃xϕ, ∀x(χ → ϕ) ≡ χ → ∀xϕ,
∃x(¬ϕ → ∀v¬ϕ(v)), ∀x(ϕ → χ) ≡ ∃xϕ → χ,
¬¬∃x(ϕ → ∀vϕ(v)), ∀x(ϕ ∨ ¬ϕ) & ∀x¬¬ϕ → ¬¬∀xϕ,
¬¬∀xϕ → ∀x¬¬ϕ, ∀x(ϕ ∨ ¬ϕ) → (¬¬∃xϕ → ∃xϕ).
31. Dokažte, že schéma DNS platí ve všech konečných kripkovských strukturách.
5.1 Intuicionistická logika 395
32. Navrhněte deﬁnici harropovské formule i pro predikátovou logiku, předpokládejte
platnost věty o eliminovatelnosti řezů a dokažte predikátovou verzi cvičení
14: když množina Γ obsahuje pouze harropovské formule, ∆ = ∅ a sekvent
Γ ⇒ ∆ je dokazatelný v kalkulu GJ, pak existuje formule ϕ ∈ ∆ taková,
že i sekvent Γ ⇒ ϕ je dokazatelný v kalkulu GJ.
33. Dokažte, že analogické tvrzení, jako bylo v předchozím cvičení dokázáno pro
disjunkci, platí i pro existenční kvantiﬁkátor: když ϕ je formule v L, když Γ je
množina harropovských formulí v L a když sekvent Γ ⇒ ∃xϕ je dokazatelný
v kalkulu GJ, pak existuje term t v jazyce L takový, že i sekvent Γ ⇒ ϕx(t)
je dokazatelný.
34. Navrhněte deﬁnici negativní formule i pro predikátovou logiku a dokažte, že
formule ¬¬ϕ → ϕ je v kalkulu GJ dokazatelná pro každou negativní formuli ϕ.
35. Nechť funkce g je deﬁnovaná rovnostmi
ϕg
= ¬¬ϕ, je-li ϕ atomická,
(ϕ & ψ)g
= ϕg
& ψg
, (ϕ → ψ)g
= ϕg
→ ψg
, (¬ϕ)g
= ¬ϕg
,
(ϕ ∨ ψ)g
= ¬(¬ϕg
& ¬ψg
), (∃xϕ)g
= ¬∀x¬ϕg
, (∀xϕ)g
= ∀xϕg
.
Dokažte, že libovolná predikátová formule ϕ je klasicky logicky platná, právě
když formule ϕg
je intuicionisticky logicky platná. Funkce ϕ → ϕg
je tedy také
interpretací klasické predikátové logiky v intuicionistické.
Návod. Nejprve dokažte predikátovou analogii věty 5.1.22. Pak uvažte, že
každá formule ϕg
je negativní formulí a užijte předchozí cvičení.
5.2 Gödelova fuzzy logika (napsal Petr Hájek)
V tomto oddílu se seznámíme s jednou z významných vícehodnotových logik, nazývanou
Gödelova logika. To potřebuje vysvětlení. Jak bylo řečeno v úvodu k této
kapitole, klasická logika je dvouhodnotová, má dvě pravdivostní hodnoty. To lze
zobecnit tak, že pravdivostní hodnoty 1 (pravda) a 0 (nepravda) považujeme za
extremální a mezi nimi připouštíme mezilehlé hodnoty částečné pravdivosti. (Hned
na začátku čtenáře důrazně varujeme, aby se nepokoušel myslet na pravděpodobnost,
jde o něco zcela jiného.) První, kdo se takovými logikami zabýval, byl polský
logik Jan Lukasiewicz ([56] jsou jeho sebrané spisy). Později zavedl jiné systémy
vícehodnotové logiky E. Post [65]. V souvislosti s intuicionistickou logikou studoval
vícehodnotové logiky A. Heyting [36] a také Kurt Gödel. Jeho kratičká práce [26]
se stala základem logiky, kterou zde probereme. Z dalších významných autorů,
kteří se vícehodnotovými logikami zabývali, jmenujme alespoň tyto: Moisil, Rose,
Rosser, Chang, Belluce, Scott. V roce 1965 vyšla Zadehova práce [100], která se
stala základem teorie fuzzy množin a fuzzy logiky. „Fuzzy znamená „roztřepený ,
„neostrý ; za fuzzy považujeme vágní pojmy jako „malý , „velký , „vysoký apod.,
396 5 Některé neklasické logiky
které nemají ostré hranice (to souvisí s některými známými logickými paradoxy, tím
se však nezabýváme).
Fuzzy logiku tedy můžeme chápat jako logiku komparativní pravdy: výroky mohou
být více či méně pravdivé. To je rozumná myšlenka. Potíž byla v tom, že
po řadu let (desetiletí) se fuzzy logikou zabývali nelogikové (inženýři, odborníci na
řízení) a dělali to, co uměli. Matematikové a logikové nad tím ohrnovali nos a
jen výjimečně se fuzzy logikou zabývali. Čestnou výjimkou jsou např. monograﬁe
S. Gottwalda [27], [28]. Zadeh sám správně rozlišuje fuzzy logiku v širokém smyslu
(cokoli, co se týká fuzzy pojmů a množin) a v úzkém smyslu (vícehodnotové logické
kalkuly vhodné pro formulaci usuzování za vágnosti). V současné době je fuzzy
logika v úzkém smyslu předmětem intenzívního matematického studia a ukazuje se,
že kalkuly fuzzy logiky mají pozoruhodné (a krásné) logické vlastnosti. Gödelova
logika je jedním z několika takových kalkulů. Gödel sám pochopitelně na žádnou
fuzzy logiku nemyslel (ta přišla o 33 let později); použil vícehodnotovou logiku
jako prostředek studia logiky intuicionistické. A protože jsme s intuicionistickou
logikou seznámeni, bude se nám Gödelova logika dobře studovat a vyložíme mimo
jiné i původní Gödelův výsledek z r. 1932. Probereme jak výrokovou, tak predikátovou
Gödelovu logiku a na závěr se stručně zmíníme o některých jiných fuzzy
logikách. Čtenáři, který se zajímá o tuto problematiku hlouběji, doporučujeme
monograﬁi [34].
5.2.1 Gödelova výroková fuzzy logika
Gödelovu výrokovou fuzzy logiku budeme značit písmenem G. Formule jsou budovány
z výrokových atomů pomocí logických spojek &, ∨, →, ¬ (stejně jako v klasické
a v intuicionistické logice). Předpokládáme, že výrokových atomů je konečně nebo
spočetně mnoho. Standardní množina pravdivostních hodnot logiky G je reálný
jednotkový interval [[0, 1]]; pravdivostní ohodnocení je zobrazení v přiřazující každému
atomu p hodnotu v(p) ∈ [[0, 1]]. Pravdivostní funkce logických spojek jsou
deﬁnovány následovně.
Pravdivostní funkce konjunkce je funkce min(x, y), (minimum); pravdivostní
funkce disjunkce je max(x, y). Pravdivostní funkce implikace je funkce (x ⇒ y)
deﬁnovaná takto:
x ⇒ y =
1 jestliže x ≤ y
y jinak.
Pravdivostní funkce negace je funkce x → −x deﬁnovaná předpisem −x = (x ⇒ 0);
platí tedy −0 = 1 a −x = 0 pro x > 0 (hned si všimněme, že −(−x) se obecně
nerovná x).
Množinu [[0, 1]] s operacemi max a min, právě deﬁnovanou funkcí ⇒ a vytčenými
prvky 0 a 1 značíme [[0, 1]]G a nazýváme standardní G-algebrou (obecné G-algebry
deﬁnujeme později).
Pomocí pravdivostních funkcí se každé ohodnocení výrokových atomů jednoznačně
rozšíří na ohodnocení v všech formulí takové, že pro každé dvě formule
5.2 Gödelova fuzzy logika 397
A a B platí
v(A & B) = min(v(A), v(B)),
v(A ∨ B) = max(v(A), v(B)),
v(A → B) = (v(A) ⇒ v(B)),
v(¬A) = −v(A).
Formule A je tautologie (přesněji: [[0, 1]]G-tautologie), jestliže v(A) = 1 pro
každé ohodnocení v. Nyní uvidíme souvislost logiky G s intuicionistickou logikou.
Věta 5.2.1 (a) Všechny axiomy hilbertovského kalkulu HJ pro intuicionistickou
logiku jsou [[0, 1]]G-tautologie.
(b) Dále každá formule tvaru (A → B) ∨ (B → A) je [[0, 1]]G-tautologie.
(c) [[0, 1]]G-tautologie jsou uzavřeny na modus ponens: když A a A → B jsou
[[0, 1]]G-tautologie, pak i B je [[0, 1]]G-tautologie.
(d) Avšak formule A ∨ ¬A obecně není [[0, 1]]G-tautologie.
Důkazu předřadíme lemma, které je užitečné na více místech:
Lemma 5.2.2 Pro každé x, y, z ∈ [[0, 1]] platí z ≤ (x⇒y), právě když min(x, z) ≤ y.
(Tomu se říká, že operace ⇒ je reziduum operace maxima.)
Důkaz Je-li x ≤ y, pak (x ⇒ y) = 1 a podmínky z ≤ 1 a min(x, z) ≤ y platí pro
každé z. Je-li x > y, pak (x ⇒ y) = y, a zřejmě v tomto případě máme z ≤ y, právě
když min(x, z) ≤ y. QED
Důkaz věty 5.2.1 (a) Pro většinu axiomů je ověření tautologičnosti velmi lehké.
Ověříme axiom A2. Následující řádky jsou ekvivalentní:
1 ≤ (a ⇒ (b ⇒ c)) ⇒ ((a ⇒ b) ⇒ (a ⇒ c))
a ⇒ (b ⇒ c) ≤ (a ⇒ b) ⇒ (a ⇒ c)
min(a ⇒ b, a ⇒ (b ⇒ c)) ≤ a ⇒ c
min(a, a ⇒ b, a ⇒ (b ⇒ c)) ≤ c.
Všimněme si, že min(a, a ⇒ b) ≤ min(a, b); tedy min(a, a ⇒ b, a ⇒ (b ⇒ c)) ≤
min(a, b, a ⇒ (b ⇒ c)) ≤ min(a, b, b ⇒ c) ≤ min(a, b, c) ≤ c. Tím je dokázán poslední
ze čtyř navzájem ekvivalentních řádků, a tedy i první.
(b) Zřejmě max(x ⇒ y, y ⇒ x) = 1, neboť x ≤ y nebo y ≤ x.
(c) Je-li v(A) = 1 a v(B) < 1, je v(A → B) = v(B) < 1; tedy je-li v(A) = 1
a v(A → B) = 1, pak v(B) = 1.
(d) Pro v(p) = 1
2 je v(p ∨ ¬p) = max(1
2 , 0) = 1
2 . QED
398 5 Některé neklasické logiky
Můžeme tedy deﬁnovat hilbertovský kalkulus pro logiku G: axiomy jsou axiomy
kalkulu HJ a dále všechny instance schématu (A → B) ∨ (B → A) (nazývaného
axiom prelinearity), odvozovací pravidlo je modus ponens. Protože jiným než hilbertovským
kalkulem se v případě logiky G nezabýváme, značíme právě deﬁnovaný
kalkulus opět písmenem G. Kalkulus G je korektní vůči [[0, 1]]G-tautologiím: každá
formule dokazatelná v G je [[0, 1]]G-tautologie.
Vidíme, že logika G je silnější než intuicionistická a slabší než klasická (takovým
logikám se říká intermediární). O logice G jsme se už nepřímo zmínili ve cvičení 26
oddílu 5.1.
Teorií rozumíme (jako obvykle) libovolnou množinu formulí — vlastních axiomů
této teorie. Pojem důkazu je deﬁnován obvyklým způsobem: důkaz v teorii T (nad
logikou G) je posloupnost formulí A1, . . , An, z nichž každá je buď axiom logiky G,
nebo vlastní axiom teorie T (tj. prvek množiny T), nebo je odvozena z některých
předchozích formulí pomocí odvozovacího pravidla. T A (přesněji T G A) značí,
že formule A je dokazatelná v teorii T (nad logikou G).
Pro logiku G platí věta o dedukci v obvyklém znění: T ∪ {A} G B, právě když
T G A → B (k tomu stačí axiomy A1 a A2).
Ukážeme teď, že (na rozdíl od intuicionistické logiky) disjunkce je v logice G
vyjádřitelná pomocí ostatních spojek:
Lemma 5.2.3 Formule A∨B a ((A→B)→B)&((B→A)→A) jsou nad logikou G
ekvivalentní pro každou volbu formulí A a B.
Důkaz Označme C formuli ((A → B) → B) & ((B → A) → A). Snadno lze ověřit,
že jak z předpokladu A, tak z předpokladu B lze v logice G dokázat jak formuli
(A → B) → B, tak formuli (B → A) → A. Z toho a užitím axiomů A4–A7 se
dokáže G A ∨ B → C, a to stejně, jako kdybychom pracovali v klasické nebo
v intuicionistické logice. Obráceně platí
G (A → B) → (((A → B) → B) → B),
G (A → B) → (C → A ∨ B).
Zcela analogicky se dokáže
G (B → A) → (C → A ∨ B).
Tedy
G (A → B) ∨ (B → A) → (C → A ∨ B).
Díky tomu, že formule (A → B) ∨ (B → A) je axiom, máme G C → A ∨ B. QED
Nic takového, co jsme právě udělali pro disjunkci, nelze udělat pro konjunkci
ani pro implikaci. Metody, kterými je v [9] dokázáno, že konjunkci ani implikaci
v intuicionistické logice nelze vyjádřit pomocí ostatních logických spojek, lze totiž
přizpůsobit i pro logiku G, viz [89].
5.2 Gödelova fuzzy logika 399
Zobecníme nyní pojem struktury pravdivostních hodnot. G-algebrou budeme
rozumět libovolnou lineárně uspořádanou množinu L = (L, ≤) s nejmenším prvkem
0L, největším prvkem 1L a operacemi minima min(x, y), maxima max(x, y) a
rezidua x ⇒ y deﬁnovaného takto: pro x ≤ y je x ⇒ y = 1, pro x > y je x ⇒ y = y.2
L-ohodnocení výrokových atomů je zobrazení v přiřazující každému výrokovému
atomu p hodnotu v(p) ∈ L. To se rozšíří na ohodnocení v(A) libovolné
formule A užitím operací algebry L jako pravdivostních funkcí (pochopitelně deﬁnujeme
−x = (x ⇒ 0L)). Formule A je L-tautologie, jestliže v(A) = 1L pro každé
L-ohodnocení v. Snadno lze ověřit korektnost kalkulu G vůči takto zobecněné sémantice:
je-li formule A dokazatelná v kalkulu G, pak A je L-tautologií pro každou
G-algebru L.
Nadto: L-modelem teorie T rozumíme L-ohodnocení v takové, že pro každou
formuli A ∈ T platí v(A) = 1L. Silná korektnost říká, že je-li formule A dokazatelná
v T (nad logikou G), pak v(A) = 1L pro každý L-model teorie T.
Pochopitelně nás zajímá, zda to platí také obráceně. Kladnou odpověď dá věta
o úplnosti, ke které směřujeme.
Nejprve si uvědomme některé základní vlastnosti G-algeber. Připomeňme, že
izomorﬁsmus dvou lineárně uspořádaných množin (L1, ≤1) a (L2, ≤2) je prosté
zobrazení f množiny L1 na L2 zachovávající uspořádání, tj. splňující podmínku, že
pro každé a, b ∈ L1 je a ≤1 b, právě když f(a) ≤2 f(b).
Lemma 5.2.4 (a) Každý izomorﬁsmus f lineárně uspořádaných množin (L1, ≤1)
a (L2, ≤2) majících nejmenší a největší prvek 0i, 1i (i = 1, 2) zobrazuje 01 na 02,
zobrazuje 11 na 12 a zachovává operace maxima, minima a rezidua, tj. je izomorﬁsmem
G-algeber daných uspořádanými množinami (L1, ≤1) a (L2, ≤2).
(b) Každé dvě konečné G-algebry stejné mohutnosti jsou izomorfní.
(c) Každou konečnou nebo spočetnou G-algebru lze izomorfně vnořit do G-algebry
racionálních čísel z intervalu [[0, 1]].
Důkaz Jde vesměs o zřejmé věci, pro (a) ukažme například, že f(11) = 12 a
f(x ⇒1 y) = f(x) ⇒2 f(y). Skutečně, je-li 01 nejmenší v L1, tj. 01 ≤ x pro každé
x ∈ L1, pak f(01) ≤ f(x) pro každé x ∈ L1, a tedy (jelikož f je zobrazení na L2)
f(01) ≤ y pro libovolné y ∈ L2, tedy f(01) je nejmenší v L2, f(01) = 02. Podobně
pro reziduum: ať x, y ∈ L1. Pak buďto x ≤1 y, a pak x ⇒1 y = 11, f(x ⇒1 y) = 12,
f(x) ≤2 f(y), tedy f(x)⇒2 f(y) = 12; nebo x >1 y, a pak x⇒1 y = y, f(x) >2 f(y),
tedy f(x) ⇒2 f(y) = f(y). V obou případech f(x ⇒1 y) = f(x) ⇒2 f(y).
Tvrzení (b) a (c) plynou z toho, že obdobná tvrzení platí pro lineárně uspořádané
množiny a z (a) víme, že izomorﬁsmus vůči uspořádání je zároveň izomorﬁsmem
ve smyslu G-algeber. Vskutku: každé dvě lineárně uspořádané množiny téže konečné
mohutnosti jsou izomorfní a každou nejvýše spočetnou lineárně uspořádanou
2Vlastně bychom měli mluvit o lineárně uspořádaných G-algebrách; obvyklý pojem G-algebry
je obecnější. My však s jinými než lineárně uspořádanými G-algebrami nebudeme pracovat, a
proto použijeme naši terminologii (srov. [34]).
400 5 Některé neklasické logiky
množinu s nejmenším a největším prvkem lze izomorfně zobrazit na nějakou podmnožinu
uspořádaného racionálního intervalu [[0, 1]] tak, že obrazem nejmenšího
prvku je 0 a obrazem největšího prvku je 1. QED
Věta 5.2.5 Pro libovolnou formuli A platí: A je [[0, 1]]G-tautologie, právě když A
je L-tautologie pro každou G-algebru L.
Důkaz Když A je L-tautologií pro každou G-algebru L, pak i pro L = [[0, 1]]G.
Obráceně, jestliže L je G-algebra a v je L-ohodnocení takové, že v(A) < 1L, pak
vezměme množinu X obsahující 0L a 1L a hodnoty všech výrokových atomů formule
A v ohodnocení v. Množina X je konečná a lze ji izomorfně vnořit do [[0, 1]] se
zachováním nejmenšího a největšího prvku. Buď f takový izomorﬁsmus; víme,
že f zachovává i operace G-algebry (tj. operace max, min a ⇒). Nechť v je
[[0, 1]]G-ohodnocení splňující v (p) = f(v(p)) pro každý výrokový atom p vyskytující
se v A; pak pro každou podformuli B formule A máme v (B) = f(v(B)) a
speciálně v (A) = f(v(A)) < 1 (protože v(A) < 1L). QED
Dokázali jsme vlastně více, než jsme tvrdili: Jestliže A není [[0, 1]]G-tautologie,
pak umíme zkonstruovat konečnou G-algebru L takovou, že A není L-tautologie.
Body nosné množiny L struktury L jsou čísla 0 a 1, a dále hodnoty v(pi), kde
p1, . . , pn jsou atomy formule A. Množina L má tedy nejvíce n + 2 prvků; má-li
méně, můžeme další libovolně přidat. Máme tedy následující důsledek:
Důsledek 5.2.6 Buď A formule obsahující n výrokových atomů. A je [[0, 1]]G-tautologie,
právě když je Ln+2-tautologie, kde Ln+2 je G-algebra mající přesně n + 2
prvků (struktura Ln+2 je určena jednoznačně až na izomorﬁsmus).
Deﬁnice 5.2.7 Teorie T je úplná (nad logikou G), jestliže pro každou dvojici formulí
A a B platí T A → B nebo T B → A (nebo obojí).
Lemma 5.2.8 Buď T teorie a C formule nedokazatelná v T. Pak existuje úplná
teorie T ⊇ T taková, že C je nedokazatelná v T .
Důkaz Protože je nejvýše spočetně mnoho výrokových atomů, lze uspořádané dvojice
všech formulí seřadit do spočetné posloupnosti
[A0, B0], [A1, B1], [A2, B2], . . .
Položme T0 = T a předpokládejme, že již máme teorii Tn ⊇ T0 takovou, že pro
všechna i < n platí Tn Ai → Bi nebo Tn Bi → Ai, a přitom Tn C. Tvrdíme,
že pak buďto Tn ∪ {An → Bn} C, nebo Tn ∪ {Bn → An} C; v prvním případě
bude Tn+1 = Tn ∪ {An → Bn}, v druhém Tn+1 = Tn ∪ {Bn → An}. Dokazujeme
sporem: ať C je dokazatelná jak v Tn ∪ {An → Bn}, tak v Tn ∪ {Bn → An}. Dle
věty o dedukci je Tn (An → Bn) → C a Tn (Bn → An) → C, tedy
Tn [(An → Bn) ∨ (Bn → An)] → C,
5.2 Gödelova fuzzy logika 401
a tedy Tn C, což je ve sporu s předpokladem (postřehli jste, že výraz v hranatých
závorkách je axiom logiky G). Stačí tedy vzít za T sjednocení všech teorií Tn;
zřejmě T ⊇ T, teorie T je úplná a T C (neboť každý důkaz v T je důkazem
v některé Tn). QED
Deﬁnice 5.2.9 Nechť T je úplná teorie. Pro každou formuli A nechť [A]T je
množina { B ; T A ≡ B } (třída všech formulí ekvivalentních s A v T). Množinu
všech tříd { [A]T ; A formule } označme LT . Deﬁnujme, že [A]T ≤ [B]T ,
jestliže T A → B.
Poznamenejme, že relace ≤ je dobře deﬁnována: platí-li [A]T = [A ]T , pak
T A→B, právě když T A →B; a podobně T B →A, právě když T B →A .
Lemma 5.2.10 Nechť T je úplná teorie. Pak
(a) Relace ≤ je lineární uspořádání množiny LT , největší prvek je třída všech
formulí dokazatelných v T a nejmenší prvek je třída všech formulí vyvratitelných
v T (tj. takových formulí B, že T ¬B).
(b) Pro libovolné dvě formule A a B platí:
min([A]T , [B]T ) = [A & B]T ,
max([A]T , [B]T ) = [A ∨ B]T ,
[A]T ⇒ [B]T = [A → B]T ,
kde max, min a ⇒ jsou operace deﬁnované pomocí uspořádání ≤.
Důkaz (a) Připomeňme dokazatelnost následujících formulí v G:
A → A,
(A → B) & (B → C) → (A → C),
(A → B) & B → A) → (A ≡ B).
Z toho dostáváme
[A] ≤ [A],
jestliže [A] ≤ [B] a [B] ≤ [C], pak [A] ≤ [C],
jestliže [A] ≤ [B] a [B] ≤ [A], pak [A] = [B],
(vynecháváme index T). Protože teorie T je úplná, pro každou dvojici A a B
formulí buď T A → B, nebo T B → A, platí tedy [A] ≤ [B] nebo [B] ≤ [A];
relace ≤ je lineární uspořádání. Zbytek je zřejmý.
(b) Je-li [A] ≤ [B], tedy T A → B, pak T A ≡ (A & B), takže min([A], [B]) =
[A] = [A & B]. Podobně z [A] ≤ [B] plyne T B ≡ (A ∨ B).
Je-li [A] ≤ [B], pak T A → B, tedy [A → B] = 1LT
= [A] ⇒ [B]. Nechť tedy
[A] > [B], tj. T A → B a T B → A. Chceme ověřit T (A → B) ≡ B. Jedna
implikace je zřejmá: T B →(A→B). Vyšetřme dvojici formulí A a A→B. Víme
T (A & (A → B)) → B, (∗)
402 5 Některé neklasické logiky
a dále buď T A→(A→B), nebo T (A→B)→A. První možnost by vzhledem
k (∗) dávala T A → B (neboť v T by byly dokazatelné formule A → (A & A),
(A&A)→(A&(A→B)) a (A&(A→B))→B, což je ve sporu s předpokladem); tedy
nastává druhá možnost T (A → B) → A a z ní podobně plyne T (A → B) → B.
Tedy v případě [A] > [B] dostáváme [A → B] = [B] = [A] ⇒ [B]. QED
G-algebru určenou uspořádanou množinou (LT , ≤) značíme LT a nazýváme ji
G-algebrou teorie T.
Věta 5.2.11 (o silné úplnosti kalkulu G) Nechť T je teorie nad logikou G a
nechť A je formule. Následující tři tvrzení jsou ekvivalentní:
(i) T G A,
(ii) v(A) = 1 pro každý [[0, 1]]G-model v teorie T ( A je pravdivá v každém modelu
teorie T nad standardní G-algebrou),
(iii) vL(A) = 1 pro každou G-algebru L a každý L-model v teorie T ( A je pravdivá
v každém modelu teorie T nad libovolnou G-algebrou).
Důkaz Implikace (i) ⇒ (iii) je silná korektnost (viz předchozí výklad); implikace
(iii) ⇒ (ii) je evidentní. Zbývá předpokládat (ii) a dokázat (i), neboli: předpokládáme
T A a najdeme [[0, 1]]G-model v teorie T, v němž v(A) < 1.
Nechť S je úplné rozšíření teorie T, pro které platí S A. Vyšetříme algebru LS.
Protože předpokládáme spočetný jazyk, je množina LS (tříd S-ekvivalentních formulí)
spočetná. Deﬁnujme LS-ohodnocení v takto: pro každý výrokový atom p je
v(p) = [p]S. Z vlastností algebry LS ihned plyne, že vLS
(B) = [B]S pro libovolnou
formuli B; přitom pokud je B axiom teorie T, je [B]S = 1LS
, ale [A]S < 1LS
,
neboť S A. Tedy v je LS-ohodnocení, v němž A není pravdivá (nemá hodnotu
1LS ). My však chceme [[0, 1]]G-model; proto použijeme lemma 5.2.4(c) a vnoříme
LS do [[0, 1]]G pomocí vhodného izomorﬁsmu f (dokonce lze uvést f takový,
že zobrazuje LS do racionálních čísel intervalu [[0, 1]], ale to je teď nepodstatné).
Deﬁnujme [[0, 1]]G-ohodnocení v takto: v (p) = f(v(p)). Pro všechny formule B
platí v (B) = f(vLS
(B)). Tedy v je [[0, 1]]G-model teorie S. Tím spíše v je
[[0, 1]]G-model teorie T a platí v (A) < 1. QED
Důsledek 5.2.12 (úplnost kalkulu G) Pro libovolnou formuli A jsou následující
čtyři tvrzení ekvivalentní:
(i) A je dokazatelná v logice G,
(ii) A je [[0, 1]]G-tautologie,
(iii) A je L-tautologie pro každou G-algebru L,
(iv) A je Ln+2-tautologie, kde n je počet výrokových atomů ve formuli A (a Ln+2
je (n + 2)-prvková G-algebra).
5.2 Gödelova fuzzy logika 403
Úplnost logiky G (vůči tautologiím nad racionálním intervalem [[0, 1]] ∩ Q) dokázal
M. Dummett, viz [18].
Nyní vyložíme výsledky o výpočtové složitosti Gödelovy fuzzy výrokové logiky.
Nechť G-Taut značí množinu všech tautologií logiky G a G-Sat značí množinu
všech formulí splnitelných v logice G (A je v G-Sat, jestliže existuje [[0, 1]]G-ohodnocení
v takové, že v(A) = 1). Připomeňme, že pro analogické množiny Taut a Sat
klasické (booleovské) logiky platí, že Sat je NP-kompletní a Taut je coNP-kompletní
(viz kapitolu 2). Ukažme, že pro množiny G-Sat a G-Taut platí totéž. Pro
jistotu ještě připomeňme, že G-Taut = Taut: například formule p∨¬p je v Taut
a není v G-Taut.
Věta 5.2.13 Platí G-Sat = Sat. Množina G-Sat je tedy NP-kompletní.
Důkaz Zřejmě Sat ⊆ G-Sat (je-li A splnitelná v klasické logice ohodnocením v
s hodnotami 0 a 1, pak totéž ohodnocení v dává formuli A hodnotu 1 i ve smyslu
algebry [[0, 1]]G). Obráceně nechť A ∈ G-Sat a nechť v je [[0, 1]]G-ohodnocení takové,
že v(A) = 1 ve smyslu [[0, 1]]G. Deﬁnujme ohodnocení v takto: v (p) = 0, jestliže
v(p) = 0; v (p) = 1, pokud v(p) > 0. Ověřte, že pro každou formuli B platí:
v (B) = 0, jestliže v(B) = 0; v (B) = 1, jestliže v(B) > 0 (indukcí podle počtu
logických spojek ve formuli B). Tedy v (A) = 1 a A ∈ Sat. QED
Věta 5.2.14 Množina G-Taut je coNP-kompletní.
Důkaz Máme ukázat, že množina G-Taut je v třídě coNP a že je v ní kompletní.
K první věci stačí ukázat, že množina všech formulí, které nejsou G-tautologie, je
v NP. Jde o to ukázat, že existuje nedeterministický algoritmus pracující v polynomiálním
čase, který přijme formuli A, právě když pro nějaké ohodnocení v
platí v(A) < 1. Činnost takového algoritmu popíšeme neformálně; čtenář může
vypracovat detaily. Uvědomme si, že dle důsledku 5.2.6 stačí ohodnocovat čísly
0, 1
k+1 , 2
k+2 , . . , k
k+1 , 1, kde k je počet atomů formule A. Algoritmus tedy nedeterministicky
uhodne takové ohodnocení a pak deterministicky spočítá příslušnou
hodnotu dané formule. Kompletnost ukážeme tak, že udáme funkci f počitatelnou
v logaritmickém prostoru a takovou, že pro libovolnou formuli A je A ∈ Taut,
právě když f(A) ∈ G-Taut. Takovou funkcí je například funkce, která ve formuli A
nahradí každý atom p jeho dvojitou negací ¬¬p (ověřte). QED
Nyní si ještě položme otázku, zda logika G umožňuje odvozovat částečně pravdivé
důsledky z částečně pravdivých předpokladů. Ukážeme, že ano. Buď r ∈ [[0, 1]];
říkejme, že formule A je r-pravdivá při ohodnocení v, jestliže v(A) ≥ r (nyní pracujeme
s [[0, 1]]G-ohodnoceními).
Lemma 5.2.15 (o korektnosti vůči r-pravdivosti) Nechť r ∈ [[0, 1]] a dále
nechť T je teorie, A formule dokazatelná v teorii T a v pravdivostní ohodnocení.
Jestliže každý axiom teorie T je r-pravdivý, pak i formule A je r-pravdivá při
ohodnocení v.
404 5 Některé neklasické logiky
Důkaz Jediné, co je třeba ověřit, je skutečnost, že pravidlo modus ponens zachovává
r-pravdivost.
Nechť v(C) ≥ r a v(C → D) ≥ r. Kdyby v(D) < r, bylo by v(C → D) = v(D) < r,
což není. Tedy v(D) ≥ r. Vidíme tedy, že je-li v(B) ≥ r pro každý axiom B ∈ T,
pak každý důkaz v T nad G sestává jen z formulí r-pravdivých při ohodnocení v.
QED
Toto tvrzení lze dokonce obrátit, logika G je silně úplná vůči r-pravdivosti.
Říkejme, že v je r-model teorie T, jestliže v(B) ≥ r pro každý axiom B ∈ T.
Věta 5.2.16 Nechť T je teorie, A formule a 0 < r ≤ 1. Pak T G A, právě když
A je r-pravdivá v každém r-modelu v teorie T, tj. právě když v(A) ≥ r pro každé
[[0, 1]]G-ohodnocení v, které každému prvku B ∈ T přiřazuje hodnotu alespoň r.
Důkaz V jednom směru jde o předcházející lemma. Obráceně nechť formule A
je r-pravdivá v každém r-modelu teorie T. Je-li r = 1, jde o úplnost dokázanou
výše. Je-li 0 < r < 1, pak si všimněme, že pro každé 0 < s < 1 platí,
že A je s-pravdivá v každém s-modelu teorie T. Pro dané s stačí vzít libovolné
prosté rostoucí zobrazení f intervalu [[0, 1]] na sebe takové, že f(r) = s. Pro daný
s-model v teorie T buď v (p) = f−1
(v(p)) pro každý výrokový atom p. Všimněme
si, že v(B) = f(v (B)) pro každou formuli B; jelikož v je r-model teorie T,
je v (A) ≥ r, a tedy v(A) = f(v (A)) ≥ s. QED
Výklad Gödelovy výrokové fuzzy logiky uzavřeme důkazem Gödelova výsledku
z r. 1932, kvůli němuž se Gödel vícehodnotovou logikou zabýval. Pro tento účel
deﬁnujme:
Deﬁnice 5.2.17 Konečná sémantika výrokové logiky je libovolná struktura tvaru
H = H, ∗, ⊕, ⇒, −, 1H ,
kde H je konečná (neprázdná) množina, ∗, ⊕ a ⇒ jsou binární operace na H
(chápané jako pravdivostní funkce konjunkce, disjunkce a implikace), − je unární
operace na H (pravdivostní funkce negace) a 1H je vytčený prvek struktury H
(pravda). Struktura H je n-hodnotová sémantika, jestliže její nosná množina H
má n prvků.
Každá G-algebra Ln+2 je příkladem (n + 2)-hodnotové sémantiky. Také dvouhodnotová
sémantika klasické výrokové logiky je příkladem sémantiky vyhovující
deﬁnici 5.2.17. Protože každá sémantika H vyhovující deﬁnici 5.2.17 je konečná,
lze pravdivostní funkce zadávat tabulkami.
Ke konečné sémantice H se obvyklým způsobem deﬁnuje H-ohodnocení v výrokových
atomů a jeho rozšíření přiřazující každé formuli A její hodnotu v(A).
Formule A je H-tautologie, když v(A) = 1H pro každé H-ohodnocení v. Naše (Gödelova)
otázka je, zda existuje konečná sémantika H ekvivalentní se sémantikou
5.2 Gödelova fuzzy logika 405
intuicionistické logiky, tj. taková konečná sémantika H, že množina všech H-tautologií
je rovna množině Int-Taut všech intuicionistických tautologií. Odpověď dává
věta 5.2.21, kterou dokázal K. Gödel.
Deﬁnice 5.2.18 Mějme výrokové atomy p0, p1, . . , pn. Symbolem DPn (kde „DP
značí Dirichletův princip) označíme formuli, která je disjunkcí všech formulí pi ≡pj
pro 0 ≤ i < j ≤ n, tj. formuli 0≤i<j≤n(pi ≡ pj).
Lemma 5.2.19 Nechť H je n-hodnotová sémantika taková, že každá intuicionistická
tautologie je H-tautologií. Pak DPk je H-tautologie pro každé k ≥ n.
Důkaz Protože H má n pravdivostních hodnot, je každé H-ohodnocení (k+1) výrokových
atomů p0, . . , pn neprosté, tj. pro jisté i0 < j0 je v(pi0 ) = v(pj0 ). Pro
toto v má tedy formule DPk stejnou hodnotu jako formule, která z ní vznikne tak,
že atom pj0 nahradíme atomem pi0 . Tímto nahrazením ale vznikne intuicionistická
tautologie (neboť každá disjunkce, která obsahuje formuli pi0 ≡ pi0 jako jeden člen,
jistě je intuicionistickou tautologií). Protože pro všechny intuicionistické tautologie
A platí v(A) = 1H, máme v(DPk) = 1H. QED
Lemma 5.2.20 Žádná z formulí DPk pro k ≥ 1 není intuicionistickou tautologií.
Důkaz Vezměme n ≥ k; pak můžeme ohodnotit atomy p0, p1, . . , pk vesměs různými
hodnotami 0, 1
n , 2
n , . . , k
n . Pro toto ohodnocení v a pro i < j v Ln+1 (tj.
v (n + 1)-prvkové G-algebře) platí v(pi ≡ pj) = i
n , tedy v(DPk) = k−1
n < 1. Tedy
formule DPk není Ln+1-tautologie a tudíž není dokazatelná v G; tím spíše není
intuicionistickou tautologií. QED
Věta 5.2.21 Neexistuje žádná konečná sémantika H taková, že množina všech
H-tautologií je rovna množině všech intuicionistických tautologií.
5.2.2 Gödelova predikátová fuzzy logika
Formule Gödelovy predikátové logiky jsou tytéž jako formule klasické (a intuicionistické)
predikátové logiky. Nebudeme pro jednoduchost pracovat s funkčními
symboly kromě konstant ani s predikátem rovnosti. Atomické formule mají
tvar P(t1, . . , tn), kde P je predikátový symbol četnosti n a ti jsou proměnné nebo
konstanty. Složené formule se budují pomocí logických spojek →, &, ∨ a ¬ a kvantiﬁkátorů
∀ a ∃. Pojem struktury (viz 3.1.7) zobecníme tak, že budeme predikátové
symboly realizovat fuzzy relacemi.
Deﬁnice 5.2.22 Nechť D je neprázdná množina a nechť H je G-algebra. Pak
n-ární H-fuzzy relace na množině D je libovolné zobrazení r přiřazující každé
n-tici [a1, . . , an] prvků množiny D prvek r(a1, . . , an) ∈ H (stupeň příslušnosti
n-tice k relaci). Je-li H standardní G-algebra [[0, 1]]G, mluvíme prostě o fuzzy relaci.
H-struktura D pro jazyk L s nosnou množinou D je dána funkcí r přiřazující
406 5 Některé neklasické logiky
každému predikátovému symbolu P četnosti n nějakou n-ární H-fuzzy relaci PD
na D a každé konstantě c nějaký prvek cD
∈ H. Tarského deﬁnice (viz 3.1.9) se
přirozeně zobecní následovně.
(a) Hodnota tD
= [e] termu t při ohodnocení proměnných e ve struktuře D je
určena rovnostmi
T1: xD
[e] = e(x), je-li x proměnná,
T2: cD
[e] = cD
, je-li x konstanta.
(b) Pravdivostní hodnota ϕ H
D formule ϕ v H-struktuře D při ohodnocení e je
určena takto:
T3: P(t1, . . , tn) H
D[e] = PD
(tD
1 [e], . . , tD
n [e]),
tj. stupeň pravdivosti atomické formule P(t1, . . , tn) je stupeň, v němž n-tice hodnot
termů t1, . . , tn je v relaci r(P),
T4: ϕ → ψ H
D[e] = ϕ H
D[e] ⇒ ψ H
D[e],
T5: ¬ϕ H
D[e] = − ϕ H
D[e],
T6: ϕ & ψ H
D[e] = min( ϕ H
D[e], ψ H
D[e] ),
T7: ϕ ∨ ψ H
D[e] = max( ϕ H
D[e], ψ H
D[e] ),
T8: ∃xϕ H
D[e] = supa∈D ϕ H
D[e(x/a)],
T9: ∀xϕ H
D[e] = infa∈D ϕ H
D[e(x/a)],
kde ⇒, −, min a max jsou operace algebry H a hodnoty na levé straně rovnosti
v podmínkách T8 a T9 se považují za nedeﬁnované, pokud supremum resp. inﬁmum
neexistuje.
Příklad 5.2.23 Nechť V je unární predikát „vysoký , S binární predikát „sympatický
. Nechť D = {1, 2, 3, 4}, nechť r(V ) a r(S) jsou dány těmito tabulkami:
1 2 3 4
0.2 0.4 0.9 1
1 2 3 4
1 1 0.7 0.3 0
2 0.4 0.9 0.4 0.4
3 0.3 0.6 1 0.8
4 0.5 0.5 1 1
Platí-li například e(x) = 3 a e(y) = 4, pak S(x, y) D[e] = 0.8, S(y, x) D[e] = 1
a V (x) & V (y) D[e] = 0.9. Označíme-li ϕ formuli V (x) & V (y) → S(x, y), platí
dále ∀yϕ D[e] = infa∈D ϕ D[e(y/a)] = inf {min(0.9, 0.2)⇒ 0.3, min(0.9, 0.4)⇒ 0.6,
min(0.9, 0.9)⇒1, min(0.9, 1)⇒0.8} = inf {1, 1, 1, 0.8} = 0.8. Číslo 0.8 je pravdivostní
hodnota tvrzení, které lze číst objekt 3 je sympatický každému objektu y, který je také
vysoký.
Pokud je struktura D konečná nebo G-algebra H je úplně uspořádaná (tj. každá
množina X ⊆ H má inﬁmum a supremum, což splňuje například algebra [[0, 1]]G),
pak pravdivostní hodnota ϕ H
D[e] je deﬁnována pro každou dvojici ϕ a e.
5.2 Gödelova fuzzy logika 407
Deﬁnice 5.2.24 (a) H-struktura D pro jazyk L je bezpečná, jestliže ϕ H
D[e] je
deﬁnováno pro každou dvojici ϕ a e. (Tedy každá [[0, 1]]G-struktura je bezpečná; ale
existují i bezpečné H-struktury pro G-algebry H, které nejsou úplně uspořádány.)
(b) Pravdivostní hodnota ϕ H
D formule ϕ v H-struktuře D je deﬁnována jako
ϕ H
D = inf
e
ϕ H
D[e],
pokud toto inﬁmum existuje.
(c) Formule ϕ platí (je pravdivá) v H-struktuře D, jestliže ϕ H
D = 1H (kde 1H
je největší prvek G-algebry H). Formule ϕ je logicky H-platná, je-li pravdivá
v každé bezpečné H-struktuře. Konečně řekneme, že ϕ je logicky platná, je-li
logicky H-platná pro každou G-algebru H.
Dále budeme uvažovat o tom, jak lze hilbertovský kalkulus pro výrokovou logiku
G rozšířit na kalkulus pro predikátovou logiku G∀.
Deﬁnice 5.2.25 Axiomy kalkulu G∀ (logiky G∀) jsou
◦ axiomy Gödelova výrokového kalkulu G, tj. axiomy intuicionistického výrokového
kalkulu HJ s přidaným axiomem prelinearity (ϕ → ψ) ∨ (ψ → ϕ),
◦ axiomy B1 a B2 klasického (i intuicionistického) predikátového kalkulu (viz
oddíl 3.2),
◦ pro každé ϕ a ψ takové, že x není volně ve ψ, následující axiom BG:
BG: ∀x(ϕ ∨ ψ) → (∀xϕ ∨ ψ).
Odvozovací pravidla kalkulu G∀ jsou pravidla generalizace Gen-A a Gen-E (viz opět
oddíl 3.2).
Pro ověření korektnosti axiomů si nejprve uvědomme, že v Gödelově predikátové
logice platí následující varianta lemmatu 3.1.14:
Lemma 5.2.26 (a) Pro každé ohodnocení e, termy s a t a proměnnou x platí
(sx(t))D
[e] = sD
[e(x/tD
[e])] (připomeňme, že termy v kalkulu G∀ jsou jen proměnné
a konstanty).
(b) Je-li ϕ formule (daného jazyka) a t term substituovatelný za x ve ϕ, pak
ϕx(t) H
D[e] = ϕ H
D[e(x/tD
[e])].
Důkaz je zcela analogický důkazu lemmatu 3.1.14; zejména máme pro formuli ϕ
tvaru ∃yψ a proměnnou y různou od x (vynecháváme indexy H a D):
ϕx(t) [e] = ∃yψx(t) [e] = sup
a∈D
ψx(t) [e(y/a)]
= sup
a∈D
ψ [(e(y/a))(x/tD
[e(y/a)])]
= sup
a∈D
ψ [(e(x/tD
[e]))(y/a)]
= ∃yψ [e(x/tD
[e])].
QED
408 5 Některé neklasické logiky
Lemma 5.2.27 (korektnost kalkulu G∀) (a) Všechny axiomy kalkulu G∀ jsou
logicky platné, tj. jsou logicky H-platné pro každou G-algebru H.
(b) Odvozovací pravidla zachovávají r-pravdivost: pro každé r ∈ H a každou bezpečnou
H-strukturu D platí: jsou-li předpoklady odvozovacího pravidla r-pravdivé
v D, je i závěr pravidla r-pravdivý v D.
Důkaz Postupujeme analogicky jako v důkazu věty 3.2.3 a lemmatu 3.1.20. Z důkazu
korektnosti logiky G je jasné, že pro každé ohodnocení e a pro každý výrokový
axiom ϕ logiky G∀ platí ϕ H
D[e] = 1.
Korektnost axiomů B1 a B2 plyne z předchozího lemmatu; za předpokladu substituovatelnosti
máme
∀xϕ H
D[e] = inf
a
ϕ H
D[e(x/a)] ≤ ϕ H
D[e(x/tD
[e])] = ϕx(t) H
D[e],
tedy ∀xϕ → ϕx(t) H
D = 1H. Úvaha pro axiom B2 je analogická.
Nyní k odvozovacím pravidlům. Nechť proměnná x nemá volné výskyty ve formuli
ψ; ukážeme ψ→ϕ H
D ≤ ψ→∀xϕ H
D. Protože ψ→ϕ H
D = infe ψ→ϕ H
D[e] =
∀x(ψ → ϕ) H
D, stačí ukázat, že formule ∀x(ψ → ϕ) → (ψ → ∀xϕ) je logicky platná.
Nechť tedy e je libovolné ohodnocení. Pro a ∈ D označme va = ϕ [e(x/a)].
Dále označme u = ψ [e]. Protože x nemá volné výskyty ve ψ, pro každé a ∈ D
platí u = ψ [e](x/a). Máme dokázat
inf
a
(u ⇒ va) ≤ (u ⇒ inf
a
va).
Ukážeme dokonce rovnost. Na jedné straně infa va ≤ va pro každé a, tedy u⇒infa va
je dolní závorou všech prvků u⇒va. Na druhé straně, je-li z nějaká jiná dolní závora,
tj. z ≤ u⇒va pro všechna a, pak dle lemmatu 5.2.2 je min(z, u) ≤ va pro všechna a,
tj. min(z, u) ≤ infa va, tedy z ≤ (u ⇒ infa va). Tedy u ⇒ infa va je inﬁmum všech
hodnot u⇒va. To je korektnost pravidla Gen-A. Důkaz korektnosti pravidla Gen-E
je analogický a ponecháváme jej čtenáři jako cvičení.
Zbývá ověřit logickou platnost axiomu BG. K tomu stačí (při označení jako výše)
dokázat
inf
a
max(u, va) ≤ max(u, inf
a
va).
Opět dokážeme rovnost. Platí max(u, infa va) ≤ max(u, va) pro každé a ∈ D, tedy
max(u, infa va) ≤ infa max(u, va). Nechť pro nějaké z platí z ≤ max(u, va) pro
všechna a; dokážeme z ≤ max(u, infa va). Máme dvě možnosti: buďto u ≤ infa va,
tedy max(u, va) = va pro všechna a, takže z ≤ infa va ≤ max(u, infa va); nebo
infa va < u, tedy pro jisté a je va < u, pro toto a platí max(u, va) = u, takže
z ≤ u ≤ max(u, infa va). Tedy max(u, infa va) je inﬁmum všech hodnot max(u, va).
QED
Deﬁnice 5.2.28 Teorie (nad logikou G∀) je libovolná množina T sentencí — axiomů
teorie T. Důkaz v teorii T je posloupnost formulí ϕ1, . . , ϕn, jejíž každý člen je
buď axiom logiky G∀, nebo axiom teorie T, nebo je odvozen z některých předchozích
formulí pomocí některého odvozovacího pravidla.
5.2 Gödelova fuzzy logika 409
Lemma 5.2.29 Pro kalkulus G∀ platí věta o dedukci ve stejném znění jako pro
klasický predikátový kalkulus HK (viz lemma 3.2.2).
Důkaz je stejný jako důkaz lemmatu 3.2.2.
Deﬁnice 5.2.30 Nechť H je G-algebra. H-modelem teorie T rozumíme libovolnou
bezpečnou H-strukturu D pro jazyk teorie T, v níž jsou všechny axiomy teorie T
pravdivé, tj. platí ϕ H
D = 1H pro každý axiom ϕ ∈ T. Modelem teorie T rozumíme
[[0, 1]]G-model, tj. libovolnou [[0, 1]]G-strukturu, v níž jsou všechny axiomy teorie T
pravdivé. Pro r ∈ (0, 1]] rozumíme r-modelem teorie T libovolnou [[0, 1]]G-strukturu,
v níž mají všechny axiomy teorie T hodnotu alespoň r.
Lemma 5.2.27 o korektnosti axiomů a odvozovacích pravidel má následující důsledek
pro dokazatelnost v teoriích:
Důsledek 5.2.31 (silná korektnost) Nechť T je teorie v logice G∀ a nechť D
je H-model teorie T. Pak každá formule dokazatelná v T je H-pravdivá v D.
(Speciálně každá formule dokazatelná v logice G∀ je logicky pravdivá.)
Zdůvodněme, že formule z lemmatu 3.2.1 nejsou dokazatelné v G∀, a to tak,
že najdeme strukturu D (nad [[0, 1]]G), v níž tyto formule nejsou 1-pravdivé. Buď
D = N (přirozená čísla); buď 0 < v < 1 a buď un klesající posloupnost čísel z [[0, 1]]
taková, že infn un = v. Buď r(P)(n) = un; vyšetřeme strukturu D = (D, r) a
formuli ∃z(P(z) → ∀xP(x)). Zřejmě její hodnota ve struktuře D je supn(un ⇒ v) =
supn v = v < 1. Podobně lze postupovat v případě formule ∃z(∃xP(x) → P(z))
(zde předpokládáme, že un rostou a supn un = v).
Nyní přistoupíme k důkazu (silné) úplnosti logiky G∀. Z předchozího plyne, že
nelze mechanicky převzít důkaz, který jsme užili pro klasický predikátový kalkulus
HK.
Převezmeme z výrokového kalkulu G deﬁnice úplné a bezesporné teorie takto:
teorie T je bezesporná, jestliže neexistuje formule ϕ taková, že T ϕ a zároveň
T ¬ϕ. Teorie T je úplná, jestliže je bezesporná a pro každou dvojici uzavřených
formulí ϕ a ψ platí T ϕ → ψ nebo T ψ → ϕ. Vztah následujícího pojmu
henkinovská teorie k analogickému pojmu užitému v oddílu 3.2 je vysvětlen ve
cvičeních.
Deﬁnice 5.2.32 Teorie T je henkinovská, jestliže pro každou uzavřenou formuli
tvaru ∀xϕ nedokazatelnou v T existuje v jazyce teorie T konstanta c taková, že
sentence ϕx(c) není dokazatelná v T.
Lemma 5.2.33 Nechť T je teorie a α formule taková, že T α. Pak existuje
bezesporné úplné henkinovské rozšíření S teorie T takové, že S α.
Důkaz Rozšiřme nejprve jazyk teorie T o henkinovské konstanty c∀xϕ všech řádů
(jako v oddílu 3.2, ale henkinovské konstanty pro sentence začínající existenčním
kvantiﬁkátorem nyní neuvažujeme). Máme nalézt teorii S s tímto rozšířeným jazykem,
pro kterou platí S α a která má navíc tyto vlastnosti:
410 5 Některé neklasické logiky
◦ pro každý pár sentencí ϕ, ψ je alespoň jedna z formulí ϕ→ψ a ψ→ϕ dokazatelná
(podmínka prvního druhu),
◦ pro každou sentenci ∀xρ platí S ∀xρ, právě když S ρx(c∀xρ) (podmínka
druhého druhu).
Předpokládejme, že jazyk teorie T (a tedy i jazyk teorie S) je spočetný (konstrukci
lze s užitím axiomu výběru zobecnit na libovolné jazyky). Máme tedy zaručit spočetně
mnoho podmínek indexovaných dvojicemi sentencí [ϕ, ψ] a sentencemi ∀xρ.
Seřadíme je do posloupnosti podmínek tak, že má-li podmínka pro ∀xρ číslo n, pak
se henkinovská konstanta c∀xρ nevyskytuje ve formulích odpovídajících předchozím
podmínkám (s čísly 0, . . , n − 1). Konstruujeme rekurzí posloupnost { Ti ; i ∈ N }
teorií a posloupnost { αi ; i ∈ N } sentencí. Položme T0 = T a α0 = α. Předpokládejme,
že je již sestrojena teorie Tn a sentence αn splňující Tn ⊇ T0, Tn α → αn
a Tn αn. Přitom Tn neobsahuje henkinovské konstanty dané podmínkami druhého
druhu s číslem k takovým, že k ≥ n. Sestrojme teorii Tn+1 a sentenci αn+1
rozebráním následujících případů.
Případ 1, n-tá podmínka se týká dvojice [ϕ, ψ]. V tomto případě postupujeme
jako v důkazu lemmatu 5.2.8, teorii Tn+1 deﬁnujeme jako tu z teorií Tn ∪ {ϕ → ψ}
a Tn ∪ {ψ → ϕ}, ve které nelze dokázat sentenci αn. Dále deﬁnujeme αn+1 = αn.
Případ 2(a), n-tá podmínka se týká sentence ∀xρ a navíc Tn αn ∨ ρx(c∀xρ). Pak
zřejmě Tn ∀xρ. Deﬁnujeme Tn+1 jako Tn a dále deﬁnujeme αn+1 = αn ∨ρx(c∀xρ).
Platí Tn+1 αn+1 a ostatní požadavky (včetně podmínky druhého druhu pro sentenci
∀xρ) jsou také splněny.
Případ 2(b), n-tá podmínka se týká sentence ∀xρ a navíc Tn αn ∨ ρx(c∀xρ). Vezměme
důkaz sentence αn ∨ρx(c∀xρ) a nahraďme v něm všechny výskyty konstanty c
nějakou proměnnou y, která se v důkazu nevyskytla. Tím dostaneme důkaz formule
αn ∨ ρx(y) v teorii Tn. Generalizace (ve tvaru Gen z cvičení 5 oddílu 3.2)
dává Tn ∀y(αn ∨ ρx(y)). Užití axiomu B1, faktu, že (ρx(y))y(x) je ρ, a opětovná
generalizace dávají Tn ∀x(αn ∨ρ). Díky axiomu BG máme Tn αn ∨∀xρ. Z toho
plyne Tn ∪ {∀xρ → αn} αn. Tedy Tn ∪ {αn → ∀xρ} αn, neboť jinak by platilo
Tn αn, což by byl spor s předpoklady o Tn a αn. Deﬁnujme tedy teorii Tn+1
jako Tn ∪ {αn → ∀xρ} a položme αn+1 = αn. Platí Tn+1 αn+1 a ostatní požadavky
na Tn+1 a αn+1 jsou také splněny. Dále platí Tn+1 ∀xρ, tedy je splněna i
podmínka druhého druhu pro sentenci ∀xρ.
Nyní položme S = n∈N Tn. Zřejmě S je úplná a S α (neboť pro všechna n
platí S αn). Ověřme, že S je henkinovská. Nechť S ∀xρ a nechť podmínka
pro ∀xρ má číslo n. Pak při ošetření této podmínky musel nastat případ 2(a),
jinak by platilo Tn+1 ∀xρ a také S ∀xρ. Tedy αn+1 = αn ∨ ρx(c∀xρ), a
protože S αn+1, máme S ρx(c∀xρ). QED
Lemma 5.2.34 Nechť ϕ, ψ a χ jsou formule, nechť x není volně v χ. Pak následující
formule jsou dokazatelné v kalkulu G∀ (dokonce v predikátovém intuicionistickém
kalkulu HJ):
5.2 Gödelova fuzzy logika 411
(a) ∀x(ϕ → ψ) → (∀xϕ → ∀xψ), (c) ∀x(ϕ → χ) ≡ (∃xϕ → χ).
(b) ∀x(χ → ϕ) ≡ (χ → ∀xϕ),
Důkaz tohoto lemmatu je naznačen ve cvičeních.
Deﬁnice 5.2.35 Nechť T je úplná bezesporná teorie. Pak G-algebra HT teorie
T je deﬁnována takto: pro libovolnou sentenci ϕ nechť [ϕ]T označuje množinu
všech sentencí T-ekvivalentních s ϕ, nosná množina HT algebry HT je množina
{ [ϕ]T ; ϕ sentence }, dále [ϕ]T ≤T [ψ]T , jestliže T ϕ → ψ, a konečně operace
min, max a ⇒ jsou dány uspořádáním ≤T .
Ověření korektnosti této deﬁnice je stejné jako ve výrokové logice; všimněme
si jen, že pracujeme s třídami T-ekvivalentních sentencí. Protože algebra HT je
z teorie T deﬁnována stejně jako v lemmatu 5.2.10, i nyní platí tvrzení onoho
lemmatu: logické spojky jsou „kongruentní vůči operacím algebry HT . Následující
lemma tvrdí, že také kvantiﬁkátory jsou kongruentní vůči supremům a inﬁmům.
Lemma 5.2.36 Je-li teorie T úplná, bezesporná a henkinovská, pak pro každou
formuli ϕ s jedinou volnou proměnnou x platí
[∀xϕ]T = inf { [ϕx(c)]T ; c konstanta },
[∃xϕ]T = sup { [ϕx(c)]T ; c konstanta }.
Důkaz Jelikož G∀ ϕx(c) → ∃xϕ, je třída [∃xϕ] (vynecháváme index T) horní
závorou všech tříd tvaru [ϕx(c)]. Ukážeme, že je nejmenší horní závorou. Nechť γ
je sentence taková, že [ϕx(c)] ≤ [γ] pro všechny konstanty c; tvrdíme [∃xϕ] ≤ [γ].
Neplatí-li to, máme T ∃xϕ→γ, lemma 5.2.34(c) dává T ∀x(ϕ→γ), a protože T
je henkinovská, pro příslušnou henkinovskou konstantu c platí T (ϕ →γ)x(c). To
je spor s T ϕx(c) → γ, neboť (ϕ → γ)x(c) je táž formule jako ϕx(c) → γ. Podobně
se dokáže, že [∀xϕ] je inﬁmem všech hodnot tvaru [ϕx(c)]. QED
Věta 5.2.37 (o silné úplnosti kalkulu G∀) Nechť T je teorie nad logikou G∀
(se spočetným jazykem), nechť ϕ je formule. Následující tvrzení jsou navzájem
ekvivalentní:
(i) T ϕ,
(ii) ϕ je pravdivá v každém H-modelu teorie T pro každou G-algebru H,
(iii) ϕ je pravdivá v každém [[0, 1]]G-modelu teorie T.
Důkaz Připomeňme, že H-modelem teorie T rozumíme bezpečnou strukturu D pro
jazyk teorie T takovou, že ϕ H
D = 1H pro každý axiom ϕ ∈ T. Z (i) plyne (ii) (to
je silná korektnost) a z (ii) evidentně plyne (iii). Zbývá dokázat, že z (iii) plyne (i).
Nechť tedy T ϕ, máme najít model D teorie T takový, že ϕ D < 1. Naším cílem
je nalézt model nad algebrou [[0, 1]]G; nejprve najdeme model nad jistou spočetnou
412 5 Některé neklasické logiky
G-algebrou H. Podle lemmatu 5.2.33 můžeme předpokládat, že teorie T je bezesporná,
úplná a henkinovská. Nechť HT je G-algebra teorie T; pišme H místo HT .
Napodobíme důkaz lemmatu 3.2.9. Nechť D je množina všech konstant teorie T;
když P je n-ární predikát, deﬁnujeme
PD
(c1, . . , cn) = [P(c1, . . , cn)]T ,
tj. pravdivostní hodnota P(c1, . . , cn) D je třída určená formulí P(c1, . . , cn), což
je prvek G-algebry H. Dále položme cD
= c pro každou konstantu c. Podobně jako
v lemmatu 3.2.9 nyní ukažme, že pro libovolnou sentenci ψ je
ψ H
D = [ψ]T
(detaily jsou ve cvičeních). Tedy naše struktura D je H-model teorie T, protože
pochopitelně pro každý axiom teorie T je [α]T = 1H. Přitom pro naši formuli ϕ
nedokazatelnou v T je ϕ H
D = [ϕ]T = 1H, tj. ϕ neplatí v D.
Zbývá ukázat, jak z D sestrojit [[0, 1]]G-model, tj. model nad standardní G-algebrou.
K tomu opět stačí ukázat, že naše H lze izomorfně vnořit do intervalu [[0, 1]] tak,
že izomorﬁsmus zachovává všechna suprema a inﬁma existující v H. Tento fakt,
přesněji řečeno o trochu silnější fakt, formulujeme jako samostatné lemma. Pak
dokončíme důkaz věty.
Lemma 5.2.38 Pro každou spočetnou G-algebru H existuje prosté zobrazení f
množiny H do racionálních čísel zachovávající uspořádání (tj. pro u, v ∈ H je
u ≤H v, právě když f(u) ≤ f(v)) a zachovávající suprema a inﬁma existující v H
(tj. je-li X ⊆ H a a = supH X, pak f(a) = sup f(X), kde f(X) = { f(b) ; b ∈ X };
podobně pro inf).
Důkaz Připomeňme, že dle lemmatu 5.2.4 zobrazení jedné G-algebry do druhé
přenášející (lineární) uspořádání přenáší též operace minima, maxima a rezidua
⇒, a je tedy izomorfním vnořením první algebry do druhé. Ukážeme nejprve, že
tvrzení lemmatu platí za dodatečného předpokladu, že uspořádání algebry H je
husté (tj. pro každé x < y existuje z tak, že x <H z <H y). Je známo, že každá
spočetná hustě uspořádaná množina s největším a nejmenším prvkem je izomorfní
s uspořádanou množinou racionálních čísel z [[0, 1]], tj. s množinou [[0, 1]] ∩ Q (viz
cvičení). Nechť f je takové izomorfní vnoření algebry H do [[0, 1]]∩Q. Ukážeme, že f
zachovává libovolná suprema i inﬁma. Buď X ⊆ H a a = infH X. Pak f(a) ≤ f(b)
pro každé b ∈ X, tj. f(a) je dolní závora množiny f(X). Kdyby z ∈ [[0, 1]] byla
jiná dolní závora množiny f(X) taková, že f(a) < z, pak by existovalo racionální
číslo u = f(c) takové, že f(a) < u < z; tedy c by byla dolní závora množiny X
větší než a — to je spor. Tedy f(a) = inf f(X). Podobně se uvažuje v případě
operace sup.
K dokončení důkazu lemmatu je třeba si uvědomit, že každou spočetnou lineárně
uspořádanou množinu H0 lze vnořit do spočetné lineárně hustě uspořádané množiny
H izomorﬁsmem zachovávajícím suprema a inﬁma existující v H0 (viz cvičení).
QED
5.2 Gödelova fuzzy logika 413
Dokončení důkazu věty o úplnosti Zbývá ukázat, že ke každému H-modelu D
teorie T takovému, že ϕ H
D < 1, existuje [[0, 1]]G-model M teorie T takový, že
ϕ M < 1. Struktura H je spočetná G-algebra. Buď f její izomorfní vnoření
do [[0, 1]]G (s racionálními hodnotami) zachovávající suprema a inﬁma existující
v H a buď PM
(c1, . . , cn) = f(PD
(c1, . . , cn)), jinak jsou struktury D a M stejné.
M je [[0, 1]]G-struktura a pro každou sentenci ψ platí ψ H
D = ψ M, jakmile je levá
strana deﬁnována. Tedy M je [[0, 1]]G-model teorie T a ϕ M < 1. QED
x ∗ y x ⇒ y −x
Lukasiewiczova
t-norma
max(0, x + y − 1) 1 − x + y 1 − x
Gödelova
t-norma
min(x, y)
y pro x > y
1 jinak
0 pro x > 0
1 jinak
produktová
t-norma
x · y
y/x pro x > y
1 jinak
0 pro x > 0
1 jinak
Obrázek 5.2.1: Spojité t-normy
V úvodu k tomuto oddílu jsme se zmínili o tom, že Gödelova logika je jednou
z významných fuzzy logik, nikoliv však jedinou. Obecný přístup, zpracovaný v monograﬁi
[34] (který také není jediný možný), vychází z pojmu spojité t-normy jako
pravdivostní funkce konjunkce a jejího rezidua jako pravdivostní funkce implikace.
Binární operace ∗ na intervalu [[0, 1]] je t-norma, jestliže je komutativní, asociativní,
neklesající v obou argumentech a platí 1∗x = 1 pro každé x. Je-li t-norma spojitá,
pak má operaci rezidua ⇒ deﬁnovanou takto: x ⇒ y = max{ z ; x ∗ z ≤ y }. Pravdivostní
funkcí negace je operace − deﬁnovaná předpisem −x = x ⇒ 0. Pro každou
spojitou t-normu platí x ⇒ y = 1 pro x ≤ y, a tedy −0 = 1. Tři nejdůležitější spojité
t-normy jsou uvedeny ve druhém sloupci tabulky na obrázku 5.2.1. Ve třetím
a čtvrtém sloupci tabulky jsou operace rezidua a negace příslušející k dané normě.
Gödelova fuzzy logika (G a G∀), se kterou jsme se v tomto oddílu dost podrobně
seznámili, je tedy logikou Gödelovy t-normy. Je vybudována výroková i predikátová
logika L a L∀ Lukasiewiczovy t-normy i výroková a predikátová logika Π a Π∀
produktové t-normy. Studuje se také logika všech spojitých t-norem (basic logic
BL resp. BL∀). Přehled predikátových fuzzy logik a jejich algebraických protějšků
může čtenář najít v knize [57]; pro plný výklad odkazujeme k monograﬁi [34]. Za
zmínku stojí rovněž rozšíření Lukasiewiczovy logiky o pravdivostní konstanty: pro
každé r ∈ [[0, 1]] (případně r ∈ [[0, 1]] ∩ Q) je k dispozici formule ¯r mající hodnotu r
pro každé ohodnocení. Tuto logiku zavedl (bez vztahu k Lukasiewiczově logice) Jan
Pavelka v disertační práci z r. 1979 a je známa jako Pavelkova logika. Navázal na
něho Vilém Novák, který tuto logiku intenzívně studuje a rozvíjí (viz [60]).
414 5 Některé neklasické logiky
Cvičení
1. Rozhodněte, které z následujících formulí (schémat) jsou [[0, 1]]G-tautologie:
(A & B → C) → ((A → C) ∨ (B → C)), ¬A ∨ ¬¬A,
(¬¬A → A) → A ∨ ¬A, ¬¬A → A,
¬(A & B) → ¬A ∨ ¬B, (A → B) → ¬A ∨ B,
¬(¬A & ¬B) → A ∨ B, (A → ¬B) → ¬A ∨ B.
2. Ověřte silnou korektnost kalkulu G: buď T teorie nad G a buď ϕ1, . . , ϕn důkaz
v T (nad G). Nechť L je G-algebra a nechť v je L-ohodnocení, které je L-modelem
teorie T. Ukažte indukcí, že vL(ϕi) = 1L pro každé i = 1, . . , n.
3. Prověřte důkaz věty o dedukci pro kalkulus G.
4. Pro každou z formulí z cvičení 1, která je [[0, 1]]G-tautologií, zdůvodněte bez
užití věty o úplnosti, že je dokazatelná v G.
5. Dokažte, že každé spočetné lineární uspořádání s největším a nejmenším prvkem
lze izomorfně vnořit do uspořádané množiny [[0, 1]] ∩ Q racionálních čísel
z intervalu [[0, 1]].
Návod: Nechť H = H, ≤H je uvažované uspořádání a H = {h0, h1, h2, . . . } je
nějaké očíslování množiny H. Předpokládejte, že h0 je nejmenší a h1 největší
prvek v H. Dále postupujte metodou „cik-cak podobně jako v příkladu 3.4.12.
6. Vypracujte detaily důkazu tvrzení, že množina G-Taut je v coNP.
7. Ukažte, že formule ((p → q) → q) → ((q → p) → p) není dokazatelná v kalkulu G,
je ale dokazatelná v kalkulu HK.
8. Ukažte, že axiom BG není dokazatelný predikátovém kalkulu HJ, je ale dokazatelný
v kalkulu HK.
9. Vypracujte detaily důkazu korektnosti pravidla Gen-E v kalkulu G∀.
10. Ukažte, že pro klasickou logiku splývá deﬁnice úplné teorie podané zde (pro
každé dvě sentence ϕ a ψ je T ϕ → ψ nebo T ψ → ϕ) s deﬁnicí obvyklou
pro klasickou logiku (pro každou sentenci ϕ je T ϕ nebo T ¬ϕ).
11. Totéž platí pro pojem henkinovské teorie (henkinovského rozšíření dané teorie).
12. Postupně ukažte, že každá z následujících formulí je dokazatelná v kalkulu G∀.
(Které formule je třeba doplnit, aby vzniklá posloupnost byla důkazem?)
∀x(ϕ → ψ) → (ϕ → ψ), ∀x(ϕ → ψ) → (∀xϕ → ψ),
∀xϕ → ϕ, ∀x(ϕ → ψ) & ∀xϕ → ψ,
(∀xϕ → ϕ) → ((ϕ → ψ) → (∀xϕ → ψ)), ∀x(ϕ → ψ) & ∀xϕ → ∀xψ,
(ϕ → ψ) → (∀xϕ → ψ), ∀x(ϕ → ψ) → (∀xϕ → ∀xψ).
5.2 Gödelova fuzzy logika 415
13. V důkazu úplnosti logiky G∀ vypracujte důkaz (indukcí), že ϕ H
D = [ϕ]T pro
každou sentenci ϕ.
Návod: indukční krok pro případ, kdy ϕ má tvar ∀xψ, vypadá takto:
∀xψ H
D = inf
v
ψ H
D[v] = inf
c
ψx(c) H
D = inf
c
[ψx(c)]T = [∀xψ]T .
14. Dokažte, že každé spočetné lineární uspořádání H lze vnořit do hustého spočetného
lineárního uspořádání vnořením zachovávajícím všechna suprema i inﬁma
existující v H. Návod: Pro a ∈ H buď α+
nejbližší větší prvek H, pokud takový
existuje (horní soused), jinak buď α+
= α. Pokud α+
= α, přidejte mezi
α a α+
exemplář racionálních čísel větších než 0 a menších než 1 (pro různé α
různé exempláře).
5.3 Logika dokazatelnosti
Hlavní myšlenku stojící v pozadí Gödelových vět o neúplnosti lze stručně vyjádřit
takto: aritmetický jazyk umožňuje napsat sentenci, která říká o sobě já jsem
nedokazatelná, a dokázat o ní, že opravdu je nedokazatelná. V roce 1952 položil
L. Henkin otázku, která vypadá poněkud kuriózně: co kdybychom naopak napsali
sentenci, která o sobě říká já jsem dokazatelná; byla by taková sentence dokazatelná?
Henkinovu otázku vyřešil v roce 1955 (pozitivně) M. H. Löb v článku [55].
Fakt, že sentence ϕ tvrdí svou vlastní dokazatelnost například v Peanově aritmetice,
se symbolicky zapíše
PA ϕ ≡ Prπ(ϕ), (∗)
a my se ptáme, co můžeme říci o dokazatelnosti takto deﬁnované sentence. Není
ale v použití slova „deﬁnované skryta nepřesnost? Věta o autoreferenci zaručuje
existenci sentence ϕ, která splňuje podmínku (∗), ale netvrdí, že taková sentence
je určena jednoznačně. Nejsme tedy možná oprávněni říci, že ϕ je deﬁnována
vztahem (∗). O jedné sentenci, totiž o sentenci 0 = 0, můžeme okamžitě říci,
že splňuje podmínku (∗) a je dokazatelná. To ale samozřejmě není odpověď na
Henkinovu otázku.
Tím jsme dospěli k přesnější formulaci Henkinovy otázky: platí o každé sentenci
ϕ, která splňuje podmínku (∗), že je dokazatelná? Uvědomme si, že takovýmto
zpřesněným způsobem je možno (a nutno) chápat i První Gödelovu větu:
každá sentence, která tvrdí svou vlastní nedokazatelnost v PA, je v PA nedokaza-
telná.
Pozor, není to ale tak, že když nějaká sentence tvrdí něco o sobě, tak to také
musí být pravda. Ponecháváme na čtenáři, aby si rozmyslel, že tvrdí-li sentence ϕ
o sobě moje negace je dokazatelná, pak negace sentence ϕ určitě v PA dokazatelná
není.
Věta 5.3.1 (Löbova) Nechť T je teorie obsahující Peanovu aritmetiku a nechť
τ(z) je Σ-formule, která deﬁnuje v N množinu T. Nechť ϕ je libovolná sentence,
pro kterou platí T ϕ ≡ Prτ (ϕ). Pak ϕ je dokazatelná v T.
416 5 Některé neklasické logiky
Důkaz Předpokládejme tedy, že sentence ϕ splňuje podmínku
1: T ϕ ≡ Prτ (ϕ).
Chceme dokázat dokazatelnost sentence ϕ v T. Domluvme se, že „T před znakem
psát nebudeme, všechny dokazatelnosti myslíme v teorii T. Vezměme pomocnou
sentenci λ, o které platí
2: λ ≡ Prτ (λ) → ϕ.
Taková sentence λ existuje díky větě o autoreferenci. Předpokládejme na chvíli,
že λ je dokazatelná v T. Pak je v T dokazatelná jednak implikace Prτ (λ) → ϕ
(díky (2)), jednak její premisa Prτ (λ) (díky podmínce D1). Tedy je dokazatelná i
sentence ϕ. Tím jsme dokázali implikaci
3: Když T λ, pak T ϕ.
Vezměme nyní z ekvivalence (2) jen jednu implikaci a použijme na ni podmínku D1:
Prτ (λ → (Prτ (λ) → ϕ)).
Dvojí užití podmínky D2 dává
Prτ (λ) → Prτ (Prτ (λ) → ϕ),
Prτ (λ) → (Prτ (Prτ (λ)) → Prτ (ϕ)).
Vezmeme-li nyní v úvahu implikaci Prτ (λ) → Prτ (Prτ (λ)) (dokazatelnou díky podmínce
D3), máme
4: Prτ (λ) → Prτ (ϕ).
Uvědomme si, že podmínka (4) je vlastně formalizací podmínky (3), a rovněž důkaz
byl formalizací důkazu podmínky (3). A teď už rychle dostaneme dokazatelnost
sentence ϕ:
5: Prτ (λ) → ϕ ; 4, 1
6: λ ; 5, 2
ϕ ; 3.
QED
Všimněme si, že z ekvivalence (2) se nakonec uplatnily obě implikace, ale z podmínky
(1) jsme vystačili s jedinou implikací. To znamená, že postačující podmínkou
pro dokazatelnost sentence ϕ je dokazatelnost implikace Prτ (ϕ) → ϕ.
Na důkazu Löbovy věty je pozoruhodné, že se v něm nevyskytují žádné proměnné
ani kvantiﬁkátory, přesněji řečeno všechny jsou skryty ve formuli Pr. Veškeré
formule vyskytující se v důkazu jsou sestaveny jen z logických spojek, z formule Pr
a ze sentencí (totiž λ a ϕ), jejichž vnitřní strukturu není nutno uvažovat. To je
totéž, co lze říci i o důkazu Druhé Gödelovy věty. Navíc oba důkazy vystačily s podmínkami
D1–D3. Jako by to byly důkazy v nějakém zvláštním logickém kalkulu
z axiomů D1–D3.
5.3 Logika dokazatelnosti 417
Logické kalkuly, ve kterých se uvažují formule sestavené z dále nedělitelných
formulí — atomů — pomocí logických spojek a jednoho dodatečného unárního
operátoru, se studují a nazývají se modální výrokové logiky. Dodatečný operátor se
nazývá modalita (nebo modalita nutnosti), zpravidla se značí P a čte se „nutně .
Lze pochopitelně uvažovat i jiné nebo další modality. I v (nejobvyklejším) případě,
kdy se uvažuje jen jediná modalita nutnosti, existuje více modálních logik, které se
liší v tom, jaký význam se té modalitě dává. Liší se tedy sémantikou.
V tomto oddílu se zabýváme modální logikou, ve které se modalita nutnosti P
interpretuje formulí Pr, tj. nutnost se chápe jako formální dokazatelnost v nějaké
axiomatické teorii. Tato modální logika se nazývá logikou dokazatelnosti. Logika
dokazatelnosti nám umožní hlouběji pochopit metodu autoreference. Pokud tato
logika bude úplná a rozhodnutelná, což bude, dá nám zároveň obecnou metodu pro
řešení takových otázek, jako položil L. Henkin. Zdůrazněme, že naším cílem není
logická analýza modalit v přirozené řeči. Zajímáme se o aplikace modální logiky
v metamatematice.
Možnost modální analýzy sentencí deﬁnovaných autoreferencí se otevřela až
formulováním podmínek D1–D3. Právě formulaci podmínek D1–D3 je asi nutno
považovat za velký přínos Löbova článku [55]. Samotné tvrzení Löbovy věty lze
získat i jednodušeji, viz cvičení. Před Löbem formuloval P. Bernays jiné podmínky
— známé jako Hilbertovy-Bernaysovy podmínky pro dokazatelnost — které
také umožňují dokázat Druhou Gödelovu větu, ale na rozdíl od Löbových podmínek
na nich nelze založit modální logiku. O Hilbertových-Bernaysových podmínkách si
lze přečíst ve Smory´nského knize [80]. Kniha [80] je celá věnována autoreferenci,
náš text v tomto oddílu z ní do značné míry vychází a je jí pokryt s výjimkou
pojednání o gentzenovském kalkulu pro logiku dokazatelnosti a o její algoritmické
složitosti. Gentzenovský kalkulus pro logiku dokazatelnosti se studuje v článku [74].
Z novějších zdrojů doporučujeme také Boolosovu knihu [8]. Čtivý výklad o historii
logiky dokazatelnosti je článek [7].
5.3.1 Modální formule, aritmetická sémantika
Modální (výrokové) formule jsou formule sestavené z konstanty ⊥ a z výrokových
atomů podle stejných pravidel jako v klasické výrokové logice s tím, že kromě negace
se připouští ještě unární operátor P. Příklady modálních formulí jsou
P¬P⊥, (Pp → P¬⊥) a P((p ∨ q) → (Pp ∨ Pq)).
Domluvme se, že pro prioritu operací a pro vypouštění nadbytečných závorek platí
obvyklá domluva s tím, že modalita P má nejvyšší možnou prioritu (stejnou jako
negace). Rovněž symbol ⊥ má obvyklý význam: je to logická konstanta pro nepravdu
(spor). Formuli PA čteme „nutně A , v našem kontextu případně též „je
dokazatelné, že A . Kromě ⊥ a P se často užívají duální symboly: je zkratka
pro ¬⊥ a QA je zkratka pro ¬P¬A. Formuli QA čteme „možná A ; něco je možné,
jestliže není nutný opak.
418 5 Některé neklasické logiky
Logika dokazatelnosti (stejně jako klasická výroková logika) není příliš závislá
na volbě seznamu logických spojek. Uvidíme ale, že logická konstanta ⊥ je užitečná
a neradi bychom ji postrádali.
Jak již bylo řečeno v úvodu, nutnost chceme chápat jako dokazatelnost. Teď se
domluvme přesněji, že uvažujeme dokazatelnost v Peanově aritmetice vyjádřenou
formulí Prπ, kde π je přirozená deﬁnice axiomů Peanovy aritmetiky. S pomocí
formule Prπ tedy deﬁnujeme aritmetickou sémantiku modální logiky.
Deﬁnice 5.3.2 Aritmetický překlad je libovolná funkce ∗ z množiny všech modálních
formulí do množiny všech aritmetických sentencí, která splňuje podmínky:
◦ ⊥∗
= (0 = S(0)),
◦ funkce ∗ komutuje se všemi logickými spojkami, tj. (A→B)∗
= A∗
→B∗
atd.,
◦ (PA)∗
= Prπ(A∗).
Deﬁnice aritmetického překladu neříká nic o atomech, těm mohou být přiřazeny
libovolné sentence. Existuje tedy více — nekonečně mnoho — aritmetických
překladů. Jsou-li ale dány funkční hodnoty překladu na atomech, říkejme jim ohodnocení
atomů, určuje deﬁnice překladu jednoznačně hodnoty na všech ostatních modálních
formulích. Aritmetický překlad tedy hraje v aritmetické sémantice modální
logiky stejnou úlohu jako pravdivostní ohodnocení v sémantice klasické výrokové
logiky. A deﬁnice překladu hraje stejnou úlohu jako pravdivostní tabulky logických
spojek: určuje, jak se ohodnocení formule spočítá z ohodnocení podformulí.
Je-li A modální formule a ∗ aritmetický překlad, dovolme si o hodnotě A∗
funkce ∗ v bodě A mluvit jako o překladu formule A. Překlad jedné modální
formule A je určen ohodnocením jen těch atomů, které se v A skutečně vyskytují.
Neobsahuje-li formule A výrokové atomy, její překlad A∗
je táž aritmetická
sentence pro všechny překlady ∗.
Deﬁnice 5.3.3 Řekneme, že modální formule A je PA-platná, jestliže PA A∗
pro každý překlad ∗. Formule A je N-platná, jestliže N |= A∗
pro každý překlad
∗. Množinu všech PA-platných resp. N-platných formulí označme PA-Taut
resp. N-Taut.
Kromě „PA-platná a „N-platná by se také mohlo říkat PA-tautologie nebo
N-tautologie. Každá PA-tautologie je samozřejmě zároveň N-tautologií. Deﬁnice
modální tautologie je podobná jako v klasické výrokové logice: A je tautologie, právě
když pro každé ohodnocení atomů atd. Jeden rozdíl je v tom, že uvažujeme současně
dvě deﬁnice modální tautologie. Druhý je v tom, že z deﬁnice není zřejmé, zda
množina všech tautologií (v tom či onom smyslu) je obecně rekurzívní nebo alespoň
rekurzívně spočetná. O některých formulích ale můžeme rovnou rozhodnout, zda
vyhovují našim deﬁnicím.
Příklad 5.3.4 Je-li sentence 0 = S(0) v PA dokazatelná, pak v PA je každá sentence
dokazatelná. Uvnitř PA je tento fakt také znám: PA Prπ(0 = S(0)) → Prπ(ϕ) pro
5.3 Logika dokazatelnosti 419
libovolnou sentenci ϕ. Tedy překlad modální formule P⊥→Pp je vždy dokazatelný,
takže formule P⊥ → Pp je PA-platná i N-platná.
Příklad 5.3.5 Nechť A je modální formule Pp → p. Vezměme překlad ∗, který
atom p ohodnocuje sentencí ν z První Gödelovy věty. Pak A∗
je aritmetická sentence
Prπ(ν) → ν. To je sentence, která není v PA dokazatelná: kdyby byla, pak by
vzhledem k dokazatelnosti sentence ¬Prπ(ν) → ν platilo PA ν, což není pravda.
Našli jsme překlad ∗, pro který platí PA A∗
. Tedy formule Pp → p není PA-tau-
tologií.
Příklad 5.3.6 Modální formule ¬P⊥ se bez ohledu na ohodnocení atomů přeloží
na sentenci ¬Prπ(0 = S(0)), tj. na sentenci Con(π). O té víme, že ve struktuře
N platí, ale v PA není dokazatelná. Formule ¬P⊥ je tedy N-platná, ale není
PA-platná.
Příklad 5.3.7 Formuli A = ¬P⊥ → ¬P¬P⊥ lze číst „není-li dokazatelný spor,
pak není dokazatelné, že není dokazatelný spor . Tato formule vyjadřuje v modální
logice Druhou Gödelovu větu. Jejím překladem je sentence Con(π)→¬Prπ(Con(π)),
o které z cvičení 4 oddílu 4.5 víme, že je v PA dokazatelná. Formule A je tedy
PA-platná. Opačná implikace ¬P¬P⊥ → ¬P⊥ je také PA-platná, což lze rychle
zjistit dosazením formule ¬P⊥ za atom p do formule v příkladu 5.3.4.
Vidíme, že modální logika umožňuje formulovat obecné fakty o dokazatelnosti
v PA, tj. fakty nezávislé na konkrétních tvrzeních. „Je-li dokazatelný spor, pak je
dokazatelná každá formule je příklad obecného faktu. Tvrzení „Bezoutova věta je
v PA dokazatelná nepovažujeme za obecný fakt.
Dvojí deﬁnice logické platnosti formule (PA-platná a N-platná) nám umožňuje
odlišit obecné fakty o dokazatelnosti, které jsou pravdivé, od obecných faktů o
dokazatelnosti, o jejichž pravdivosti „ví Peanova aritmetika. Příklad 5.3.6 ukazuje,
že to není totéž.
Mohli bychom si také klást obecnější otázku, totiž uvažovat dvě teorie T a S a
ptát se, jaké obecné fakty o dokazatelnosti v teorii T ví teorie S. Aritmetická interpretace
by tak byla zadána dvojicí S, Prτ , kde formule Prτ deﬁnuje dokazatelnost
v teorii T a určuje, jak se překládají modální formule, a S určuje, ve které teorii
se ptáme na dokazatelnost jejich překladů. Takto obecnou situací se zabývat nebudeme,
ale vypůjčíme si z ní terminologii. Místo „A je PA-platná nebo „N-platná
budeme také říkat, že formule A platí v aritmetické interpretaci PA, Prπ resp.
v interpretaci N, Prπ .
Čtenář by si ale neměl myslet, že modálních logik se vztahem k dokazatelnosti
v axiomatických teoriích existuje velké množství, jiná pro každou aritmetickou
interpretaci S, Prτ . Je sice pravda, že například Zermelova-Fraenkelova teorie
množin ví o Peanově aritmetice, že je bezesporná, což Peanova aritmetika o sobě
neví. Uvažujeme-li ale, co se o dokazatelnosti v T dá dokázat uvnitř téže teorie T,
v mnoha případech dostaneme tutéž modální logiku, totiž tu, kterou zde prezentujeme.
Korektní a dostatečně silné teorie se neliší ve svých znalostech o vlastní
dokazatelnosti.
420 5 Některé neklasické logiky
5.3.2 Logické kalkuly
V tomto pododdílu se pokusíme axiomatizovat množinu všech PA-platných formulí
a množinu všech N-platných formulí pomocí vhodných kalkulů. V následujících
pododdílech dospějeme mimo jiné k důkazům úplnosti těchto kalkulů vůči aritmetické
sémantice. Začněme deﬁnicí fregovského kalkulu pro jednu z modálních
logik.
Deﬁnice 5.3.8 Axiomy modální logiky K4 jsou
L1: všechny výrokové tautologie,
a dále všechny modální formule tvaru
L2: P(A → B) → (PA → PB),
L3: PA → PPA.
Logika K4 má odvozovací pravidla
MP: A , A → B / B,
Nec: A / PA.
K4 je tradiční označení, viz např. [38]. Výrokovou tautologií myslíme modální
formuli, která vznikne z nějaké klasické výrokové tautologie substitucí modálních
formulí za její atomy. Vzpomeňme si, že podobně jsme v oddílu 3.2 (na str. 157)
deﬁnovali predikátové formule, které jsou tautologiemi. Například p → (Pq → p)
a ⊥ → p jsou modální formule, které jsou tautologiemi. Také ¬A → (A → ⊥) je
výroková tautologie bez ohledu na volbu formule A.
Když ∗ je libovolný překlad a modální formule A je PA-platná, tj. platí PA A∗
,
pak díky podmínce D1 platí i PA Prπ(A∗). To znamená, že množina všech
PA-platných modálních formulí je uzavřena na pravidlo Nec. Je-li A modální formule,
která je výrokovou tautologií, pak A∗
je predikátová sentence, která je rovněž
tautologií (v před chvílí zmíněném „predikátovém smyslu), a je tedy dokazatelná
v PA. Také překlady axiomů L2 a L3 jsou v PA dokazatelné, to plyne bezprostředně
z podmínek D2 a D3. Z toho je jasné, že logika K4 je korektní vůči interpretaci
PA, Prπ .
Kdykoliv je dokázána nějaká modální formule A, můžeme díky pravidlu Nec
usoudit, že platí i PA. To ale neznamená, že implikace A→PA musí být PA-platná.
Vezměme sentenci ν z První Gödelovy věty. Kdyby platilo PA ν → Prπ(ν), pak
by vzhledem k dokazatelnosti sentence ν → ¬Prπ(ν) platilo i PA ¬ν. To ale
není pravda. Vidíme, že sentence ν je aritmetickým protipříkladem na modální formuli
p→Pp. Tento příklad zároveň ukazuje, že věta o dedukci pro logiku K4 neplatí
a neplatí pro žádnou modální logiku, která je korektní vůči interpretaci PA, Prπ
a má mezi odvozovacími pravidly pravidlo Nec.
Pravidlo Nec se anglicky nazývá rule of necessitation, česky snad pravidlo přidání
nutnosti. Hraje v modální logice podobnou úlohu, jako pravidlo generalizace
v predikátové logice, a někdy se mu i tak říká. Ukažme si několik příkladů důkazů
v našem kalkulu.
5.3 Logika dokazatelnosti 421
1: ⊥ → p ; L1
2: P(⊥ → p) ; Nec
3: P(⊥ → p) → (P⊥ → Pp) ; L2
4: P⊥ → Pp ; MP.
V druhém důkazu si už dovolíme malé přeskakování.
1: A → (B → A & B) ; L1
2: P(A → (B → A & B)) ; Nec
3: PA → P(B → A & B) ; 2, L2
4: P(B → A & B) → (PB → P(A & B)) ; L2
5: PA & PB → P(A & B) ; 3, 4.
Nejen s pojmem tautologie, ale i s pojmem tautologický důsledek můžeme zacházet
analogicky, jako když jsme v oddílu 3.2 konstruovali důkazy v kalkulu HK. Formule
(5) je tautologickým důsledkem formulí (3) a (4). Jinak řečeno, formuli (5)
lze snadno odvodit z formulí (3) a (4) bez užití axiomů L2 a L3 a pravidla Nec,
neboť formule (3) → ((4) → (5)) je výrokovou tautologií čili instancí schématu L1.
K formuli (5) ještě poznamenejme, že opačnou implikaci P(A&B)→PA&PB lze
v logice K4 dokázat také, naopak nelze dokázat analogickou formuli pro disjunkci.
O tom jsou některá cvičení.
Podívejme se ještě na jeden důkaz v logice K4. Začněme s implikací
1: P(p ≡ ¬Pp) → (Pp → P¬Pp) ; L2.
Protože zápis p≡¬Pp je zkratkou pro konjunkci (p→¬Pp)&(¬Pp→p), v odvození
formule (1) jsme kromě axiomu L2 použili také schéma P(A&B)→PA. V odvození
řádku (8) níže využijeme i opačnou implikaci ekvivalence p ≡ ¬Pp. Označme D
předpoklad P(p ≡ ¬Pp) implikace (1).
2: ¬Pp → (Pp → ⊥) ; L1
3: P¬Pp → (PPp → P⊥) ; 2, Nec, dvakrát L2
4: D → (Pp → (PPp → P⊥)) ; 1, 3
5: Pp → PPp ; L3
6: D → (¬P⊥ → ¬Pp) ; 4, 5.
422 5 Některé neklasické logiky
Dosud napsaný důkaz je vlastně modální simulací důkazu První Gödelovy věty a
formule (6) vyjadřuje část První Gödelovy věty: když nějaká sentence tvrdí svou
vlastní nedokazatelnost, pak, pokud ovšem není dokazatelný spor, není dokazatelná.
K plnému znění První Gödelovy věty chybí tvrzení, že existuje sentence, která tvrdí
svou vlastní nedokazatelnost. Pochopitelně lze simulovat i důkaz Druhé Gödelovy
věty:
7: PD → (P¬P⊥ → P¬Pp) ; 6, Nec, dvakrát L2
8: D → (P¬Pp → Pp) ; L2
9: D → PD ; L3
10: D → (P¬P⊥ → Pp) ; 9, 7, 8
11: D → (¬P⊥ → ¬P¬P⊥) ; 6, 10.
Tím jsme skoro dokázali formuli ¬P⊥ → ¬P¬P⊥, která nás zajímá a o které z příkladů
k aritmetické sémantice víme, že je PA-platná. Bohužel předpokladu D se
zbavit nelze, formule ¬P⊥ → ¬P¬P⊥ není v logice K4 dokazatelná. Z toho je
jasné, že chceme-li mít modální logiku úplnou vzhledem k aritmetické interpretaci,
musíme k axiomům nebo pravidlům logiky K4 přidat ještě něco.
Jednou z možností je přidat odvozovací pravidlo, které umožňuje odvodit formuli
A, pokud je dokázána implikace D → A, kde jako v řádku (11), D je autoreferenční
předpoklad o nějakém atomu p, který se nevyskytuje v A. O takovém
pravidlu, pravidlu autoreference, se zmíníme v části o kripkovské sémantice.
Další možnosti, jak rozšířit logiku K4, jsou přidat k ní buď Löbův axiom L4,
nebo Löbovo pravidlo LR:
L4: P(PA → A) → PA,
LR: PA → A / A.
Rozmyslíme si, že obě možnosti jsou ekvivalentní. Všimněme si ještě, že jak Löbův
axiom, tak Löbovo pravidlo je modálním vyjádřením Löbovy věty: je-li implikace
Prπ(ϕ) → ϕ dokazatelná, pak je dokazatelná i sentence ϕ. Löbův axiom je
vlastně formalizací Löbova pravidla ve stejném smyslu, jako je axiom L3 formalizací
pravidla Nec.
Lemma 5.3.9 Množina všech formulí dokazatelných v rozšíření logiky K4 o Löbův
axiom L4 je uzavřena na Löbovo pravidlo LR. V rozšíření logiky K4 o Löbovo
pravidlo lze dokázat všechny instance Löbova axiomu. Rozšíření logiky K4 o Löbův
axiom nebo o Löbovo pravidlo jsou tedy spolu ekvivalentní.
Důkaz Je-li již dokázána implikace PA → A, lze použitím pravidla Nec získat
předpoklad Löbova axiomu, a tedy i formuli PA. Tato formule a opětovné užití
implikace PA → A dává A.
Naopak, předpokládejme, že máme dokázat formuli P(PA → A) → PA. Označme
ji B. Stačí v logice K4 dokázat formuli PB → B a pak užít pravidlo LR:
5.3 Logika dokazatelnosti 423
1: PB → (PP(PA → A) → PPA) ; L2
2: P(PA → A) → PP(PA → A) ; L3
3: PB → (P(PA → A) → PPA) ; 1, 2
4: P(PA → A) → (PPA → PA) ; L2
5: PB → (P(PA → A) → PA) ; 3, 4
6: B ; 5, LR.
QED
Nyní už můžeme oﬁciálně deﬁnovat logiku dokazatelnosti a dokázat její aritmetickou
korektnost. Ještě si uvědomme, že vzhledem k tomu, že uvažujeme současně
dvě různé aritmetické interpretace, potřebujeme dvě modální logiky.
Deﬁnice 5.3.10 Modální logika GL, logika dokazatelnosti, vznikne přidáním Löbova
axiomu L4 k logice K4. Modální logika GLω
má jediné odvozovací pravidlo
modus ponens a jejími axiomy jsou všechny formule dokazatelné v logice GL a dále
všechny formule tvaru PA → A.
Věta 5.3.11 (o korektnosti vůči aritmetické sémantice) (a) Každá modální
formule dokazatelná v (kalkulu z deﬁnice 5.3.10 pro logiku) GL je PA-platná.
(b) Každá modální formule dokazatelná v logice GLω
je N-platná.
Důkaz Platnost axiomů L1–L3 a korektnost pravidel MP a Nec vůči interpretaci
PA, Prπ jsme již konstatovali. K důkazu korektnosti logiky GL zbývá ověřit
PA-platnost Löbova axiomu L4. Vzhledem k lemmatu 5.3.9 stačí zdůvodnit, že
množina všech PA-platných modálních formulí je uzavřena na pravidlo LR. To je
ale přesně to, co věta 5.3.1 tvrdí pro formuli τ := π (tj. pro přirozenou deﬁnici
axiomů Peanovy aritmetiky).
Předpokládejme nyní, že N |= Prπ(A∗) pro nějaký překlad nějaké modální formule
A. Pak platí PA A∗
(viz podmínku Def na str. 349), a protože PA je
korektní teorie, musí platit i N |= A∗
. Tedy N |= Prπ(A∗) → A∗
. Tím je dokázána
N-platnost schématu PA→A a dokončen důkaz věty o korektnosti obou modálních
logik vůči aritmetickým interpretacím. QED
Postup přijmout jako axiomy logiky GLω
(mimo jiné) všechny formule dokazatelné
v logice GL je oprávněn faktem, že množina všech formulí dokazatelných
v logice GL je algoritmicky rozhodnutelná. To dokážeme v následujícím pododdílu.
V logice GL, a tedy ovšem i v GLω
, lze snadno dokázat formuli ¬P⊥→¬P¬P⊥,
stačí volit A := ⊥ v axiomu L4. V logice GLω
lze navíc dokázat formuli ¬P⊥, a
tedy i formuli ¬P¬P⊥; stačí volit A := ⊥ ve schématu PA → A. Víme ale, že
formule ¬P⊥ není PA-platná, a tedy není v logice GL dokazatelná. Z toho je
zároveň vidět, že schéma PA → A není PA-platné, což už ostatně víme z jednoho
z příkladů.
424 5 Některé neklasické logiky
Pravidlo Nec není v logice GLω
z dobrého důvodu přípustné. Jeho použitím
na již dokázanou formuli ¬P⊥ bychom dostali P¬P⊥, což je formule, která jednak
není N-platná, jednak je ve sporu s již dokázanou formulí ¬P¬P⊥. Modální logiky,
které jsou deﬁnovány axiomatickými schématy, mezi nimiž je alespoň L1 a L2, a
schematickými odvozovacími pravidly, mezi nimiž je alespoň MP a Nec, se nazývají
normální modální logiky. Logika GL je, logika GLω
není normální modální logika.
Schématu PA → A se říká schéma reﬂexe. Toto schéma lze v přirozené řeči
považovat za korektní a v několika modálních logikách vystupuje jako axiom. Jeho
N-platnost se odvolává na fakt, že struktura N je modelem Peanovy aritmetiky.
To je argument, který není možno formalizovat uvnitř PA. Peanova aritmetika ví,
že ve sporné teorii je dokazatelné cokoliv, ale neví o sobě, je-li bezesporná. Nemůže
tedy s jistotou tvrdit, že jen pravdivé sentence jsou v ní dokazatelné. Ve skutečnosti
to ovšem je pravda.
Až dokážeme úplnost logiky GLω
vůči aritmetické sémantice, budeme zároveň
vědět, že schéma reﬂexe je vlastně jediný obecný fakt o dokazatelnosti, který je
platný ve skutečnosti, jehož platnost ale není známa uvnitř Peanovy aritmetiky.E
Pp, p, PPp ⇒ Pp
Pp ⇒ PPp
Pp ⇒ Pp, ⊥
Pp, ¬Pp ⇒ ⊥ p ⇒ p
Pp, p → ¬Pp, p ⇒ ⊥
PPp, P(p → ¬Pp), Pp ⇒ P⊥
Pp, P(p → ¬Pp) ⇒ P⊥
P(p → ¬Pp) ⇒ Pp, ¬P⊥
P(p → ¬Pp), ¬P⊥ ⇒ ¬Pp
Obrázek 5.3.1: Důkaz v gentzenovském kalkulu pro logiku GL
Gentzenovský kalkulus pro logiku GL vznikne přidáním jediného (!) modálního
pravidla ke gentzenovskému výrokovému systému z kapitoly 1:
P-r: Γ, PΓ, PA ⇒ A / PΓ ⇒ PA ,
kde PΓ značí množinu { PB ; B ∈ Γ }. Všimněme si, že pravidlo P-r je použitelné
jen tak, že před jeho použitím i po něm je sukcedent jednoprvkový. V tom se pravidlo
P-r podobá kritickým pravidlům intuicionistického gentzenovského kalkulu.
Dále si všimněme, že následující jednodušší (odvozená) modální pravidla lze snadno
simulovat pomocí pravidla P-r a několikanásobného užití pravidla W:
PΓ ⇒ A
PΓ ⇒ PA
Γ ⇒ A
PΓ ⇒ PA .
Pamatujme si tedy, že pravidlo P-r umožňuje odstranit z antecedentu sekventu libovolnou
formuli B, pokud je pravda, že v antecedentu je i formule PB nebo že ji
tam přidáme, a pokud současně v sukcedentu je jediná formule A, kterou musíme
5.3 Logika dokazatelnosti 425
nahradit formulí PA. Přitom byla-li v antecedentu formule PA, je povoleno ji odstranit
bez náhrady. Je vidět, že pravidlo P-r i jeho odvozené varianty zachovávají
podformule.
Na obrázku 5.3.1 jsme na ukázku převedli do gentzenovského kalkulu již dříve
uvedený fregovský důkaz modální verze První Gödelovy věty. V tomto důkazu
je pravidlo P-r užito dvakrát. Jednou má formule A tvar Pp, podruhé je užito
odvozené pravidlo Γ ⇒ A / PΓ ⇒ PA a formule A má tvar ⊥. V důkazu
je také jednou užito pravidlo řezu na formuli PPp. Protože v tomto oddílu mezi
základní logické symboly počítáme i symbol ⊥, předpokládáme, že v našem kalkulu
máme také pravidlo příslušné k tomuto symbolu, totiž pravidlo
⊥-l: / Γ, ⊥ ⇒ ∆ ,
které jsme dosud explicitně neformulovali, ale vlastně o něm byla řeč ve cvičeních
oddílu 1.4. V důkazu z obrázku 5.3.1 se toto pravidlo neuplatnilo. Žádné pravé
pravidlo pro symbol ⊥ neexistuje, stejně jako neexistuje žádné levé pravidlo pro
modalitu. Nepokoušíme se sestrojit gentzenovský kalkulus pro logiku GLω
, bez
toho se v dalším obejdeme.
Věta 5.3.12 Je-li formule A dokazatelná ve fregovském kalkulu pro logiku GL,
pak sekvent ⇒ A je dokazatelný v gentzenovském kalkulu. Naopak, je-li sekvent
Γ ⇒ ∆ dokazatelný v gentzenovském kalkulu pro logiku GL, pak formule
Γ → ∆ je dokazatelná ve fregovském kalkulu.
Důkaz V následujících třech řádcích je sekvent vpravo vždy odvoditelný jediným
krokem dle pravidla P-r ze sekventu vlevo:
P(A → B), PA, A → B, A, PB ⇒ B / P(A → B), PA ⇒ PB ,
PA, A, PPA ⇒ PA / PA ⇒ PPA ,
P(PA → A), PA → A, PA ⇒ A / P(PA → A) ⇒ PA .
Ve všech případech lze sekvent vlevo velmi rychle dokázat, a to bez dalšího užití
modálního pravidla. V druhém případě máme dokonce iniciální sekvent. Ze sekventu
vpravo lze jedním nebo dvěma kroky dokázat axiom L2 resp. L3 resp. L4.
Simulaci pravidel MP a Nec přenecháváme čtenáři.
Simulace pravidla P-r ve fregovském kalkulu je také jednoduchá. Předpokládejme,
že sekvent PΓ ⇒ PA byl jedním krokem odvozen ze sekventu Γ, PΓ, PA ⇒ A
a že již máme fregovský důkaz formule Γ& PΓ&PA→A. Tento důkaz můžeme
přepracovat (doplnit) na důkaz formule PΓ → PA:
1: Γ & PΓ & PA → A
2: Γ & PΓ → (PA → A)
3: P( Γ & PΓ) → P(PA → A) ; Nec, L2
4: P( Γ & PΓ) → PA ; L4
426 5 Některé neklasické logiky
5: PΓ & PPΓ → PA
6: PΓ → PA ; L3.
V odvození řádku 5 jsme využili již známý fakt, že modalita nutnosti komutuje
s konjunkcí (viz náš druhý příklad důkazu v kalkulu pro logiku GL). V posledním
řádku jsme z premisy implikace odstranili formule PPB, kde B ∈ Γ. Každá z nich je
totiž zbytečná, neboť vyplývá z formule PB, která se v premise implikace vyskytuje
také. QED
5.3.3 Kripkovská sémantika
V této části ukážeme, že logika dokazatelnosti má kromě aritmetické sémantiky také
uspokojivou kripkovskou sémantiku v mnohém podobnou sémantice intuicionistické
logiky.
Deﬁnici dobrého uspořádání lze snadno rozšířit i na uspořádání, které není lineární,
nebo dokonce na libovolnou relaci. Tak dostaneme pojem fundované relace.
Relace R ⊆ A2
je fundovaná na množině A, jestliže pro každou neprázdnou podmnožinu
Y ⊆ A existuje prvek a ∈ Y takový, že
∀x ∈ A(x R a ⇒ x /∈ Y ).
Jinými slovy, každá neprázdná podmnožina Y množiny A má R-minimální prvek.
Každá fundovaná relace je automaticky antireﬂexivní: kdyby pro nějaké x platilo
x R x, množina {x} by neměla R-minimální prvek. Naopak, každá tranzitivní
a antireﬂexivní relace na konečné množině je fundovaná.
Deﬁnice 5.3.13 Řekneme, že dvojice W, R je kripkovský rámec (pro logiku dokazatelnosti),
jestliže W = ∅ a R ⊆ W2
je tranzitivní relace taková, že relace R−1
je fundovaná.
Požadujeme tedy, aby každá neprázdná podmnožina množiny W měla maximální
prvek vzhledem k relaci R. Domluvme se, že stejně jako v oddílu o intuicionistické
logice mluvíme o prvcích rámce jako o vrcholech, případný nejmenší vrchol
je kořen, maximální vrcholy jsou listy. Relace R je relace dosažitelnosti.
Deﬁnice 5.3.14 Řekneme, že trojice W, R, − je kripkovský model (pro logiku
dokazatelnosti), jestliže W, R je kripkovský rámec a relace − (pravdivostní relace)
splňuje podmínky:
◦ x − A → B, právě když x −/ A nebo x − B, a podobně pro všechny ostatní
logické spojky (pro ⊥ to znamená x −/ ⊥),
◦ x − PA, právě když ∀y ∈ W(x R y ⇒ y − A).
Zápis x − A čteme stejně jako v intuicionistické logice „formule A je splněna
ve vrcholu x nebo „x splňuje (formuli) A . Modalita nutnosti se chová podobně
jako implikace a negace v intuicionistické logice: pravdivostní hodnota formule PA
5.3 Logika dokazatelnosti 427
ve vrcholu x závisí na pravdivostní hodnotě formule A ve vrcholech dosažitelných
z x (ve světech možných z hlediska x). Naproti tomu implikace a negace se chovají
„klasicky : pravdivostní hodnota formule ¬A nebo A → B ve vrcholu x závisí jen
na pravdivostních hodnotách formulí A a B v témže vrcholu x. Negace formule A
je v x splněna, právě když A v x splněna není. Deﬁnice neříká nic o ohodnocení
výrokových atomů. Pravdivostní hodnota atomu p ve vrcholu x může být zvolena
libovolně a bez ohledu na ohodnocení atomu p v ostatních vrcholech. V kripkovské
sémantice logiky dokazatelnosti tedy na rozdíl od intuicionistické logiky nemáme
žádnou podmínku perzistence.
Příklad 5.3.15 Vzhledem k tomu, že negace se vyčísluje klasicky, můžeme kripkovský
model graﬁcky znázornit tak, že ke každému vrcholu připíšeme například
p nebo ¬p podle toho, zda atom p v onom vrcholu je nebo není splněn, viz obrázek
5.3.2. Z vrcholu b není dosažitelný žádný vrchol (ani b, relace dosažitelnosti
je antireﬂexivní), takže b − PA pro libovolnou formuli A. Totéž lze říci i o vrcholu
c. Z a jsou dosažitelné vrcholy b a c, a v obou je splněna formule p → r,
tedy a − P(p → r). Platí také a − PP⊥, protože formule P⊥ je splněna ve
všech (obou) vrcholech dosažitelných z a. Připomeňme, že QA je zkratka pro formuli
¬P¬A. V našem modelu platí například b −/ Qp a a − Qp.
a
b c


o


U
p, r ¬p, ¬r
p, ¬r
Obrázek 5.3.2: Kripkovský model pro logiku dokazatelnosti
Řekneme, že formule A platí v modelu W, R, − , jestliže A je splněna v každém
vrcholu x z W. Sekvent Γ ⇒ ∆ platí v modelu W, R, − , jestliže v každém vrcholu
x ∈ W, ve kterém jsou splněny všechny formule z Γ, je splněna také některá
formule z ∆. Řekneme, že formule A nebo sekvent Γ ⇒ ∆ platí v kripkovském
rámci W, R , jestliže formule A resp. sekvent Γ ⇒ ∆ platí v každém
modelu W, R, − , tj. jestliže A či Γ ⇒ ∆ platí při každé volbě pravdivostní
relace − na W, R .
Příklad 5.3.16 Formule r → p, P(r → p) a P(p → r) platí, formule p → r neplatí
v modelu z obrázku 5.3.2.
Příklad 5.3.17 V jakémkoliv modelu W, R, − je formule P⊥ splněna ve vrcholu
x právě tehdy, když z x není dosažitelný žádný (jiný) vrchol, tj. když x je
maximálním prvkem (listem) v rámci W, R . Formule ¬P⊥ neplatí v žádném
rámci, protože z fundovanosti plyne, že nějaké maximální prvky existovat musí.
Relace R může být i prázdná. V tom případě v rámci W, R platí formule P⊥.
428 5 Některé neklasické logiky
Deﬁnice 5.3.18 Nechť W, R, − je kripkovský model pro logiku dokazatelnosti.
Řekneme, že vrchol x ∈ W je ∆-korektní, kde ∆ je množina modálních formulí,
jestliže x splňuje formuli PD → D, kdykoliv PD je podformule některé formule
v množině ∆. Vrchol x ∈ W je A-korektní, kde A je modální formule, jestliže x
je {A}-korektní.
Příklad 5.3.19 V modelu z obrázku 5.3.2 vrchol b je (Pp)-korektní. Vrchol b ale
není (P¬p)-korektní, protože platí b − P¬p a b −/ ¬p. Vrchol a není (P(p→r))-korektní,
je (P(r → p))-korektní nebo třeba (P(r → p) & ¬P⊥)-korektní. Vrchol a je
také (Qp)- i (Q¬r)-korektní, není (Q(p & ¬r))-korektní.
 
 
 
d
d
d
q a0  
 
 
d
d
d
q a0
q
T
a1
Obrázek 5.3.3: Přidání nového kořenu ke kripkovskému modelu
Bohužel, termín „korektní je v této kapitole trochu přetížen. Korektní pravidla,
axiomy a kalkuly, a teď ještě korektní vrcholy kripkovských modelů.
Nyní směřujeme k důkazu korektnosti logik GL a GLω
vůči kripkovské sémantice.
Důkaz pro logiku GLω
je o dost komplikovanější a budeme v něm potřebovat
lemma, které se týká situace jako na obrázku 5.3.3. Nalevo je kripkovský rámec
s kořenem a0, rámec vpravo je z něj utvořen přidáním nového kořenu a1. Dosavadní
kořen a0 je v novém rámci dosažitelný jen z vrcholu a1.
Lemma 5.3.20 Nechť A je modální formule, W, R, − je kripkovský model s kořenem
a0 a a0 je A-korektní vrchol modelu W, R, − . Nechť rámec W , R je
utvořen z rámce W, R přidáním nového kořenu a1 jako na obrázku 5.3.3. Nechť
pravdivostní relace − rozšiřuje relaci − tak, že každý výrokový atom má v a1
tutéž pravdivostní hodnotu, jako měl (a má stále) v a0. Pak A má v a0 i v a1 tutéž
pravdivostní hodnotu a nový kořen a1 je A-korektní.
Důkaz Dokážeme indukcí podle složitosti podformule B formule A, že B má v a0
a v a1 tutéž pravdivostní hodnotu, a pokud B začíná modalitou, neporušuje A-korektnost
vrcholu a1. Pro atomy je to pravda, tak byly hodnoty atomů v a1 zvoleny.
Je-li B sestavena pomocí některé logické spojky z formulí, které mají v a0 i v a1
stejnou pravdivostní hodnotu, pak i B má v a0 i v a1 stejnou pravdivostní hodnotu.
Nechť B začíná modalitou, B = PD. Když a0 − ¬PD, podle deﬁnice pravdivostní
relace to znamená, že pro nějaký vrchol x dosažitelný z a0 platí x −/ D. Vrchol x
je dosažitelný i z a1, tedy a1 − ¬PD. Když a0 − PD, pak a0 − D (vzhledem
ke korektnosti vrcholu a0), a1 − PD (protože D je splněna ve všech vrcholech
dosažitelných z a1) a a1 − D (protože, podle indukčního předpokladu, D má
5.3 Logika dokazatelnosti 429
stejnou hodnotu v a0 i v a1). V obou případech má formule PD stejnou pravdivostní
hodnotu v a0 i v a1 a neporušuje A-korektnost vrcholu a1. QED
Věta 5.3.21 (korektnost vůči kripkovské sémantice) (a) Když GL A, pak
formule A platí v každém kripkovském modelu.
(b) Když GLω
A, pak je formule A splněna v každém A-korektním vrcholu libovolného
kripkovského modelu.
Důkaz Uvažujme Löbův axiom L4. Nechť A je modální formule a nechť x je vrchol
nějakého kripkovského modelu W, R, − . Předpokládejme, že x −/ PA. Chceme
dokázat x −/ P(PA → A). Uvažujme množinu Y všech vrcholů dosažitelných z x,
ve kterých formule A není splněna: Y = { y ∈ W ; x R y & y −/ A }. Z x −/ PA
plyne, že Y = ∅. Díky fundovanosti relace R existuje nějaký R-maximální prvek
množiny Y . Označme y0 některý takový maximální vrchol. Uvažujme libovolný
vrchol z dosažitelné z vrcholu y0. Díky tranzitivitě relace R platí x R z, tj. vrchol z
je dosažitelný z x. Kdyby platilo z −/ A, měli bychom z ∈ Y , tedy spor s tím,
že vrchol y0 je maximální v množině Y . Tedy z − A. Toto platí pro každý
vrchol z dosažitelný z vrcholu y0 (netvrdíme ovšem, že takové vrcholy z existují).
Tedy y0 − PA. Vrchol y0 je dosažitelný z vrcholu x a splňuje formuli PA & ¬A.
Tedy není pravda, že implikace PA→A je splněna ve všech vrcholech dosažitelných
z x, a tedy opravdu x −/ P(PA → A).
Dokázali jsme, že (každý) Löbův axiom je splněn v každém vrcholu x libovolného
kripkovského modelu. Löbův axiom tedy platí v každém kripkovském modelu. Ověření
platnosti ostatních axiomů logiky GL přenecháváme čtenáři. Důkaz bodu (a)
lze uzavřít konstatováním, že množina všech modálních formulí splněných v daném
vrcholu x daného modelu W, R, − je uzavřena na pravidlo MP a množina
všech modálních formulí platných v daném modelu W, R, − je navíc uzavřena na
pravidlo Nec.
Nechť nyní A1, . . , Ak(=A) je důkaz formule A v logice GLω
. Nechť W, R, − je
libovolný kripkovský model a a0 jeho A-korektní vrchol. Chceme ověřit a0 − A.
Jako obvykle můžeme předpokládat, že a0 je kořen rámce W, R . Potíž je v tom,
že nemůžeme rovnou dokázat indukcí podle j, že a0 − Aj. Nevíme totiž, zda v a0
jsou splněny všechny axiomy PD → D použité v důkazu. Z korektnosti vrcholu a0
plyne pouze, že to platí, je-li PD podformulí formule A. Potřebovali bychom vědět,
že a0 je nejen A-korektní, ale dokonce {A1, . . , Ak}-korektní.
Vezměme v úvahu všechny formule PD vyskytující se v důkazu A1, . . , Ak. Zvolme
číslo n větší, než je jejich počet. Použijme n-krát lemma 5.3.20 o přidání nového
kořenu. To znamená, že k modelu přidáme n nových vrcholů a1, . . , an, vrchol ai
prohlásíme za dosažitelný z vrcholů aj pro j > i, a jen z nich, a každému atomu
přidělíme v nových vrcholech a1, . . , an tutéž pravdivostní hodnotu, jakou měl v a0.
Vezměme libovolnou formuli PD vyskytující se v důkazu A1, . . , Ak. Pokud PD je
zároveň podformulí formule A, víme o ní z lemmatu, že cestou proti směru šipek
od a0 k an nemění pravdivostní hodnotu. Pokud PD není podformulí formule A,
430 5 Některé neklasické logiky
cestou od a0 k an pravdivostní hodnotu změnit může, ale z deﬁnice pravdivostní
relace vyplývá, že jen z PD na ¬PD, a tedy nejvýše jednou. Protože n je větší
než počet všech takových formulí PD, existuje i takové, že od ai k ai+1 se nestane
nic: žádná formule PD vyskytující se v důkazu A1, . . , Ak nezmění pravdivostní
hodnotu. Snadno se ověří, že v tom případě vrchol ai je {A1, . . , Ak}-korektní.
Indukcí podle j dostaneme, že ai splňuje každou formuli Aj, tedy ai − A. Lemma
říká, že formule A má v ai a v a0 stejnou pravdivostní hodnotu, tedy a0 − A.
QED
Úplnost obou systémů vůči kripkovské sémantice lze dokazovat různým způsobem.
Ve Smory´nského knize [80] je důkaz, jehož vedlejším produktem je důkaz
úplnosti i pro logiku K4 a případně i jiné modální systémy. V Solovayově článku [86]
je kratší důkaz jen pro logiku dokazatelnosti. My se přidržíme postupu paralelního
s předchozím oddílem. To nám umožní využít některé zkušenosti, které jsme udělali
s intuicionistickou logikou. Na rozdíl od před chvílí uvedeného důkazu korektnosti
logik GL a GLω
, ve kterém jsme pracovali s fregovskými kalkuly, nyní dáváme
přednost (vzhledem k větě 5.3.12 ekvivalentnímu) gentzenovskému kalkulu pro logiku
GL. Úplnost logiky GLω
(tj. úplnost jejího fregovského kalkulu) pak bude
snadným důsledkem úplnosti logiky GL.E
Věta 5.3.22 (úplnost logiky GL) Je-li libovolný sekvent délky n dokazatelný
v logice dokazatelnosti, pak má také bezřezový důkaz hloubky O(n3
). Není-li dokazatelný,
pak má kripkovský protipříklad hloubky nejvýše n, v němž má každý vrchol
nejvýše n následníků. Gentzenovský kalkulus pro logiku GL je tedy úplný vůči kripkovské
sémantice intuicionistické logiky a platí pro něj věta o eliminovatelnosti řezů.
Intuicionistická výroková logika má vlastnost FMP. Platí PA-Taut ∈ PSPACE, tj.
úloha rozhodnout, zda daný sekvent je logicky platný, je rozhodnutelná v polynomiálním
prostoru.
Důkaz Důkaz ponecháváme na čtenáři, protože je velmi podobný příslušnému důkazu
v intuicionistické logice a opírá se o dvě lemmata podobná lemmatům 5.1.7
a 5.1.10. Z prvního lemmatu uveďme pouze vzorek:
sekvent Γ, A→B ⇒ ∆ platí ve všech kripkovských modelech, právě když
oba sekventy Γ ⇒ ∆, A a Γ, B ⇒ ∆ platí ve všech kripkovských
modelech,
z kterého by mělo být jasné, jak je třeba formulovat zbývajících sedm případů (logická
spojka taková nebo onaká, a to v antecedentu nebo v sukcedentu). Rozdíl
oproti lemmatu 5.1.1 je v tom, že zkoumanou formuli nikdy v sekventu neponecháváme,
takže vícenásobným užitím tohoto lemmatu je otázka, zda daný sekvent
platí ve všech kripkovských modelech, převedena na tutéž otázku týkající se nikoliv
uzavřeného sekventu (ten pojem zde odpadá), nýbrž na otázku týkající se sekventu,
v němž jsou jen atomy a formule začínající modalitou.
Druhé lemma říká, že je-li PΓ, Π ⇒ P∆, Λ sekvent takový, že množiny Π a Λ
obsahují pouze atomy, pak sekvent PΓ, Π ⇒ P∆, Λ platí ve všech kripkovských
5.3 Logika dokazatelnosti 431
modelech, právě když (PΓ∪Π)∩(P∆∪Λ) = ∅, nebo existuje formule A ∈ ∆ taková,
že sekvent Γ, PΓ, PA ⇒ A platí ve všech kripkovských modelech. Důkaz je úplně
stejný jako v případě lemmatu 5.1.10. Poznamenejme, že právě z tohoto lemmatu
lze vypozorovat formulaci pravidla P-r.
Na obou lemmatech lze stejně jako v intuicionistické logice založit algoritmus, který
rozhodne o logické platnosti daného sekventu, a to se stejným odhadem na paměťový
prostor. I zde platí, že algoritmus k danému sekventu vlastně buď sestrojí
konečný kripkovský protipříklad, nebo nalezne jeho bezřezový důkaz v gentzenovském
kalkulu. Více podrobností o důkazu je v článku [90]. QED
Věta 5.3.23 (úplnost logiky GLω
) Modální formule A je dokazatelná ve fregovském
kalkulu pro logiku GLω
, právě když je splněna ve všech A-korektních vrcholech
libovolného kripkovského modelu. Úloha N-Taut je také v PSPACE.
Důkaz Nechť A je libovolná modální formule. Sestavme seznam PD1, . . , PDn
všech jejích podformulí začínajících modalitou. Libovolný vrchol libovolného kripkovského
modelu je A-korektní, právě když splňuje konjunkci
n
i=1(PDi →Di). To
znamená, že podmínky (ii) a (iii) v následujícím seznamu jsou ekvivalentní:
(i) GLω
A,
(ii) A je splněna v každém A-korektním vrcholu libovolného kripkovského modelu,
(iii)
n
i=1(PDi → Di) → A platí v každém kripkovském modelu,
(iv) GL
n
i=1(PDi → Di) → A.
Implikace (i) ⇒ (ii) je již dokázaná věta o korektnosti logiky GLω
. Podmínky (iii)
a (iv) jsou ekvivalentní podle věty o úplnosti pro logiku GL. Platí také implikace
(iv) ⇒ (i): formuli A lze dokázat z formule v (d) a z předpokladů PDi → Di
bez užití pravidla Nec, tedy ji lze dokázat v kalkulu pro logiku GLω
. Tím jsme
ověřili, že všechny čtyři podmínky jsou ekvivalentní.
Implikace (ii) ⇒ (i) je to, co se mělo dokázat — úplnost logiky GLω
. Formuli
v (iv) lze sestrojit z A v logaritmickém prostoru. Tedy ekvivalence (i) ⇔ (iv)
je vlastně převodem úlohy N-Taut na úlohu PA-Taut, a úloha N-Taut je tedy
v třídě PSPACE. QED
Zbývající část tohoto oddílu lze číst selektivně, zejména již máme pohromadě
vše, co potřebujeme k důkazu věty 5.3.30 o aritmetické úplnosti GL a GLω
. To je
upozornění pro netrpělivého čtenáře.
V souvislosti se sémantikou, ať už aritmetickou nebo kripkovskou, jsme se nikde
nezmínili o kompaktnosti. Možná, že tady je určitý prostor pro další výzkum.
Nevíme, zda pro aritmetické interpretace N, Prπ a PA, Prπ věta o kompaktnosti
platí, dokonce si nejsme jisti, jak by se měla formulovat. Je ale známo, že pro
kripkovskou sémantiku věta o kompaktnosti neplatí, viz cvičení.
V tomto pododdílu o kripkovské sémantice se ještě chceme zmínit o některých
důsledcích věty o úplnosti logik GL a GLω
vůči kripkovské sémantice a také dokázat,
432 5 Některé neklasické logiky
že obě úlohy jsou PSPACE-kompletní. V následujícím pododdílu se zmíníme o
některých důsledcích věty o eliminovatelnosti řezů pro logiku GL.
Deﬁnujme formuli ·PA, kde A je libovolná modální formule, jako zkratku za
formuli A & PA. Formuli ·PA čteme „silně nutně A . Symbol ·P je odvozená
modalita, říkejme jí operátor silné nutnosti.
Je-li nějaká aritmetická sentence ϕ (například Con(π) → ¬Prπ(Con(π))) v PA
dokazatelná s pomocí předpokladu, že nějaká jiná sentence (například ν) splňuje
nějakou autoreferenční podmínku (v našem případě ν ≡ ¬Prπ(ν)), pak ϕ je dokazatelná
i bez tohoto předpokladu. V modální logice tento fakt vystihuje pravidlo
autoreference:
DiR: ·P(q ≡ B) → A / A,
kde atom q se nevyskytuje ve formuli A, a navíc všechny jeho výskyty ve formuli B
jsou v rozsahu platnosti některé modality P. Zkratka DiR znamená diagonalization
rule. Místo „atom q se vyskytuje jen v rozsahu platnosti některé modality říkejme
také, že atom q se vyskytuje pouze v modálním kontextu. Z následující věty a ze
cvičení plyne, že kalkulus vzniklý přidáním pravidla DiR k logice K4 je ekvivalentní
s logikou GL.
Věta 5.3.24 (de Jonghova) Když GL ·P(q ≡B)→A a atom q se ve formuli B
vyskytuje jen v modálním kontextu a nevyskytuje se ve formuli A, pak GL A.
Logika GL je tedy uzavřena na pravidlo DiR.
Důkaz Předpokládejme GL A. Podle věty o úplnosti má formule A nějaký kripkovský
protipříklad K = W, R, − . Změníme-li kdekoliv v modelu K ohodnocení
atomu q, nebude to mít vliv na pravdivostní hodnoty formule A, protože ta atom q
neobsahuje. Tvrdíme, že atomu q lze ve vrcholech modelu K přidělit (nové) pravdivostní
hodnoty tak, aby v K platila formule ·P(q ≡B). Tím dostaneme protipříklad
na formuli ·P(q≡B)→A. Ukažme si postup na modelu z obrázku 5.3.2. Předpokládejme,
že B je formule Pq → p. Chceme tedy zvolit pravdivostní hodnoty atomu q
tak, aby ekvivalence q≡(Pq→p) byla splněna ve všech třech vrcholech. Víme b − p,
c − Pq a c − ¬p, takže b − Pq → p a c −/ Pq → p. Ekvivalenci q ≡ (Pq → p)
lze tedy zaručit volbou b − q a c −/ q. Teď můžeme vyčíslit pravdivostní hodnotu
formule Pq → p ve vrcholu a. Vychází a − Pq → p, volíme tedy a − q. Výsledkem
je platnost formule q ≡ (Pq → p), a tedy i formule ·P(q ≡ (Pq → p)) v modelu K.
Stejně můžeme postupovat i v případě jakéhokoliv jiného modelu K a jakékoliv jiné
formule B. V každém kroku zvolíme vrchol a, v němž dosud nebyla stanovena hodnota
atomu q, ale byla již stanovena ve všech vrcholech dosažitelných z a. V prvním
kroku to samozřejmě znamená zvolit za a některý z listů. Vzhledem k tomu, že
atom q se v B vyskytuje jen v modálním kontextu, jeho pravdivostní hodnoty ve
vrcholech dosažitelných z vrcholu a dovolují určit pravdivostní hodnotu formule B
v samotném vrcholu a. Atomu q pak přidělíme tutéž pravdivostní hodnotu, kterou
jsme zjistili pro B. Tím bude zajištěno a − q ≡ B. QED
5.3 Logika dokazatelnosti 433
Ukažme si ještě jednu jednoduchou aplikaci věty o úplnosti. Mějme kripkovský
protipříklad K na formuli A. Jako obvykle můžeme předpokládat, že model K
má kořen. Rozšíříme-li model K na nový model K tak, jak je naznačeno na
obrázku 5.3.3 a popsáno v lemmatu 5.3.20, dostaneme protipříklad na formuli PA.
Tím je zdůvodněno, že má-li jakákoliv formule A protipříklad, pak i formule PA má
protipříklad. Vzhledem k větě o úplnosti pro logiku GL vůči kripkovské sémantice
to znamená, že množina všech formulí dokazatelných v logice GL je uzavřena na
pravidlo opačné k pravidlu Nec, totiž na pravidlo PA / A. Týž fakt lze dokázat
i důkazově teoreticky: je-li ⇒ PA poslední sekvent bezřezového důkazu, pak
předposlední sekvent musí být PA ⇒ A , a užití řezu na tyto dva sekventy dává
sekvent ⇒ A . Další podobné příklady jsou uvedeny ve cvičeních 14–16.
Věta 5.3.25 Obě úlohy PA-Taut a N-Taut jsou PSPACE-kompletní.
Důkaz I tento důkaz je podobný příslušnému důkazu o intuicionistické logice,
takže postup jen naznačíme a upozorníme na některé rozdíly. Také zde deﬁnujeme
převod úlohy QBF, začínáme tedy s kvantiﬁkovanou výrokovou formulí A
tvaru Qmpm . . Q1p1B(p), kde každý ze symbolů Q1, . . , Qm je jeden z kvantiﬁkátorů
∀ nebo ∃ a formule B neobsahuje další výrokové kvantiﬁkátory ani jiné atomy
než p1, . . , pm. K formuli A sestrojíme modální formuli A∗
podobným způsobem
jako v intuicionistické logice:
A∗
0 = B(p)
A∗
j =
Q(qj & ( ·Ppj ∨ ·P¬pj)) & P(qj → A∗
j−1) pokud Qj = ∃
Q(qj & ·Ppj) & Q(qj & ·P¬pj) & P(qj → A∗
j−1) jinak
A∗
= A∗
m.
Stejným způsobem jako v intuicionistické logice se dokáže, že formule A platí, právě
když formule A∗
je splněna v některém vrcholu některého kripkovského modelu, tj.
právě když formule ¬A∗
není dokazatelná v logice GL.
Navíc dokážeme, že když formule A∗
je splněna v některém vrcholu kripkovského
modelu, pak je splněna i v některém A∗
-korektním vrcholu. To se udělá takto.
Nechť A∗
je splněna ve vrcholu a modelu W, R, − . Předpokládejme, že model je
konečný a vrchol a je jeho kořenem. Všechny atomy ve formuli A∗
se vyskytují jen
v modálním kontextu, a změníme-li jejich pravdivostní ohodnocení ve vrcholu a,
nebude to mít vliv na pravdivostní hodnotu formule A∗
ve vrcholu a. Změníme je
tak, aby vrchol a byl A∗
-korektní.
Vezměme v úvahu, že Q je zkratka za ¬P¬ a také ·P je zkratka, a napišme si seznam
všech podformulí formule A∗
, které začínají modalitou P:
Ppj, P¬pj, P¬(qj & ·Ppj), P¬(qj & ·P¬pj), P(qj → A∗
j−1),
kde 1 ≤ j ≤ m. Může se stát, že ve vrcholu a je splněna některá z formulí
Ppj a P¬pj, ale ne obě najednou: formule A obsahuje modality pouze v případě,
434 5 Některé neklasické logiky
kdy m = 0, a tehdy jsou z vrcholu a určitě dosažitelné nějaké jiné vrcholy. Správnou
volbou pravdivostní hodnoty atomu pj ve vrcholu a lze zajistit, že žádná z prvních
dvou formulí neporušuje A∗
-korektnost vrcholu a. Volbou a −/ qj lze zajistit, že
ani žádná ze zbývajících tří formulí neporušuje A∗
-korektnost.
Dokázali jsme, že když formule A neplatí, pak je formule ¬A∗
dokazatelná v logice
GL (protože nemá žádný kripkovský protipříklad), a když A platí, pak formule
¬A∗
má dokonce A∗
-korektní protipříklad. Funkce A → ¬A∗
tedy redukuje
úlohu QBF (přesněji řečeno, její komplement QBF, ale víme, že je to jedno) zároveň
na úlohu PA-Taut i na úlohu N-Taut. Obě úlohy jsou tedy PSPACE-kompletní.
QED
Stejně jako v případě intuicionistické logiky je podstatným krokem v předchozím
důkazu nalezení takové posloupnosti { An ; n ∈ N } formulí, že délka formule An
roste polynomiálně s n, každá formule An má kripkovský protipříklad, avšak délka
minimálního kripkovského protipříkladu na formuli An roste exponenciálně s n.
Ve cvičení 19 je ukázáno, že v případě logiky dokazatelnosti lze při konstrukci
formulí An vystačit s jediným atomem. Tento výsledek lze způsobem analogickým
jako v důkazu vět 5.1.16 a 5.3.25 doplnit na důkaz tvrzení, že úloha PA-Taut
zůstane PSPACE-kompletní úlohou i v případě, omezíme-li se na jediný výrokový
atom.
5.3.4 Některé aplikace v metamatematice
Aritmetické sentenci ϕ, která je řešením nějaké autoreferenční rovnice, tj. která
splňuje podmínku tvaru PA ϕ ≡ ψ(ϕ), můžeme říkat pevný bod formule ψ(x).
Věta o autoreferenci zaručuje, že každá aritmetická formule má nějaký pevný bod.
V úvodu k tomuto oddílu jsme se v souvislosti s Löbovou větou zmínili o otázce,
zda aritmetická sentence je faktem, že splňuje nějakou autoreferenční podmínku,
určena jednoznačně. To je otázka po jednoznačnosti pevných bodů: jsou každé
dva pevné body nějaké formule ψ(x) navzájem ekvivalentní? V tomto pododdílu
mimo jiné uvidíme, že s pomocí modální logiky lze na tuto otázku určitým způsobem
odpovědět. Zatím víme, že alespoň pro některé formule ψ je odpověď ano.
Každé dva pevné body formule ¬Prπ(x) jsou spolu ekvivalentní, protože jsou ekvivalentní
se sentencí Con(π). Každý pevný bod formule Prπ(x) je podle Löbovy věty
dokazatelný, tedy ekvivalentní se sentencí 0=0.
Mějme nějakou modální formuli A, výrokový atom p a jiný výrokový atom q,
který se nevyskytuje ve formuli A. Současně s formulí A uvažujme formuli Ap(q)
vzniklou z formule A substitucí atomu q za všechny výskyty atomu p. Uvědomme
si, že (Ap(q))q(p) je formule A a pišme A(p) a A(q) místo A a Ap(q). Formule
A(p) a A(q) mohou ovšem obsahovat i jiné atomy než p a q.
Věta 5.3.26 (a) Jsou-li formule A a atomy p a q jako výše, pak v logice GL lze
dokázat sekvent P(p ≡ q) ⇒ P(A(p) ≡ A(q)) .
(b) Pokud se navíc atom p vyskytuje ve formuli A(p) pouze v modálním kontextu,
pak je v logice GL dokazatelný i sekvent P(p ≡ q) ⇒ A(p) ≡ A(q) .
5.3 Logika dokazatelnosti 435
Důkaz V (a) postupujme indukcí podle počtu logických symbolů ve formuli A(p).
Je-li jich nula, máme sekvent P(p≡q) ⇒ P(p≡q) nebo P(p≡q) ⇒ P(r ≡r) ,
který je v obou případech evidentně dokazatelný. Když A(p) má tvar B(p) ∨ C(p),
pak indukční předpoklad dává důkazy sekventů P(p ≡ q) ⇒ P(B(p) ≡ B(q))
a P(p ≡ q) ⇒ P(C(p) ≡ C(q)) . V tom případě sestrojme samostatně důkaz
sekventu P(B(p) ≡ B(q)), P(C(p) ≡ C(q)) ⇒ P(B(p) ∨ C(p) ≡ B(q) ∨ C(q)) a
požadovaný sekvent P(p ≡ q) ⇒ P(B(p) ∨ C(p) ≡ B(q) ∨ C(p)) odvoďme dvěma
řezy.
V (b) postupujme také indukcí, avšak podle počtu kroků, kterými je formule A
utvořena pomocí logických spojek z formulí začínajících modalitou. Bázi indukce
lze snadno odvodit z tvrzení (a), kroky týkající se logických spojek jsou podobné
jako v důkazu tvrzení (a). Podrobnosti opět ponecháváme na čtenáři. QED
Věta 5.3.27 Jsou-li formule A a atomy p a q jako výše a atom p se ve formuli
A(p) vyskytuje pouze v modálním kontextu, pak v logice GL lze dokázat sekvent
P(p ≡ A(p)), P(q ≡ A(q)) ⇒ P(p ≡ q) .
Důkaz Sekvent
1: p ≡ A(p), q ≡ A(q), A(p) ≡ A(q) ⇒ p ≡ q
je tautologický a jako takový je dokazatelný (bez užití pravidla P-r). Dále postupujme
takto:
2: P(p ≡ q) ⇒ A(p) ≡ A(q) ; Věta 5.3.26(b)
3: p ≡ A(p), q ≡ A(q), P(p ≡ q) ⇒ p ≡ q ; 1, 2, Cut
4: P(p ≡ A(p)), P(q ≡ A(q)) ⇒ P(p ≡ q) ; 3, W, P-r.
QED
Větu 5.3.26 můžeme označit jako větu o substituci, věta 5.3.27 je věta o jednoznačnosti
pevných bodů pro logiku dokazatelnosti. Jak už jsme poznamenali, je-li
ψ(x) formule ¬Prπ(x) nebo formule Prπ(x), pak řešení ϕ rovnice ϕ ≡ ψ(ϕ) je
určeno jednoznačně v tom smyslu, že každé dva pevné body jsou spolu dokazatelně
ekvivalentní. Na základě věty 5.3.27 můžeme usoudit, že je to pravda i o mnoha
dalších formulích ψ(x). Ukažme si úvahu na formuli Prπ(x) → χ z důkazu Löbovy
věty. Věta 5.3.27 říká, že modální formule B:
(P(p ≡ Pp → r) & P(q ≡ Pq → r) → P(p ≡ q))
je dokazatelná v logice GL. Tedy musí být N-platná. Kdybychom ale měli dvě
navzájem neekvivalentní sentence λ1 a λ2 splňující podmínky PA λ1 ≡Prπ(λ1)→χ
a PA λ2≡Prπ(λ2)→χ, měli bychom zároveň aritmetický protipříklad na formuli B:
při ohodnocení atomů p, q a r sentencemi λ1, λ2 a χ by v N neplatil překlad
formule B.
436 5 Některé neklasické logiky
Věta 5.3.27 říká, že autoreferenční rovnice ϕ ≡ ψ(ϕ) má jednoznačně určený
pevný bod za podmínky, že sentence ψ(ϕ) je tvaru A∗
, kde A(p) je modální formule
a ∗ je aritmetický překlad, který atomu p přiřazuje hodnotu (aritmetickou
sentenci) ϕ. Takovým autoreferenčním rovnicím můžeme říkat gödelovské. Užitím
modální logiky jsme tedy ukázali, že všechny gödelovské autoreferenční rovnice
mají jednoznačně (až na dokazatelnou ekvivalenci) určené řešení.
Zdaleka ne všechny autoreferenční rovnice jsou gödelovské. Příkladem formule
ψ(x), na kterou se věta 5.3.27 nevztahuje, je formule před každým důkazem
sentence x existuje menší důkaz její negace ¬x, jejímž řešením je Rosserova sentence,
viz 4.5.6. O jisté variantě Rosserovy sentence je v článku [29] dokázáno, že není
svou autoreferenční rovnicí určena jednoznačně. Žádná obecná věta o jednoznačné
řešitelnosti autoreferenčních rovnic tedy neplatí.
O rovnicích ϕ ≡ Prπ(¬ϕ) a ϕ ≡ Prπ(ϕ) víme víc než to, že jejich řešení
existují a jsou jednoznačně určena. Jejich řešení lze explicitně vyjádřit bez užití
autoreference, neboť, jak jsme už připomněli, řešením první je sentence Con(π),
řešením druhé je sentence 0 = 0. Nyní směřujeme k tvrzení, že toto je pravda
vždy, řešení každé gödelovské autoreferenční rovnice lze explicitně vyjádřit, tj. sestavit
z „parametrů rovnice pomocí logických spojek a formule Prπ(x). Nejprve
dokážeme větu o interpolaci, která je zajímavá i samostatně.
Věta 5.3.28 Nechť Γ, Π ⇒ ∆, Λ je sekvent dokazatelný v logice GL. Pak existuje
modální formule D, která je sestavena pouze z takových atomů, jež se současně
vyskytují v obou sekventech Γ ⇒ ∆ a Π ⇒ Λ , a přitom taková, že oba sekventy
Γ ⇒ ∆, D a Π, D ⇒ Λ jsou dokazatelné v logice GL.
Důkaz Postupujme analogicky jako v důkazu lemmatu 3.3.15, indukcí dle hloubky
bezřezového důkazu daného sekventu. Případy, kdy v posledním kroku je užito
některé výrokové pravidlo, jsou úplně stejné. Případy, kdy je užito kvantiﬁkátorové
pravidlo, zde ovšem odpadají. Zabývejme se podrobněji případem, kdy v posledním
kroku důkazu je užito modální pravidlo. Máme tedy důkaz, jehož ﬁnální sekvent S
je z předposledního sekventu odvozen pomocí pravidla P-r. Antecedent sekventu S
tudíž obsahuje pouze formule začínající modalitou, jeho sukcedent obsahuje právě
jednu formuli, která také začíná modalitou, a přitom jak antecedent, tak sukcedent
sekventu S je sjednocením dvou množin modálních formulí. Sekvent S má tedy
tvar PΓ, PΠ ⇒ ∆, Λ , kde množina ∆∪Λ obsahuje jedinou modální formuli PA.
Předposlední sekvent našeho důkazu musí být Γ, Π, PΓ, PΠ ⇒ A . Poslední krok
našeho důkazu má tedy jeden z tvarů
Γ, PΓ, PA, Π, PΠ ⇒ A
PΓ, PΠ ⇒ PA
Γ, PΓ, PA, Π, PΠ ⇒ A
PΓ, PΠ ⇒ PA ,
kde složené závorky dole naznačují, že pro dané sjednocení {PA} = ∆ ∪ Λ sukcedentu
sekventu S může platit PA ∈ Λ nebo PA ∈ ∆, kdežto složené závorky
nahoře naznačují, jak jsme se tudíž rozhodli rozložit antecedent a sukcedent předposledního
sekventu na dvě množiny. Ponecháváme na čtenáři, aby si rozmyslel,
5.3 Logika dokazatelnosti 437
že případ ∆ = Λ = {PA} nemusíme uvažovat. V prvním (levém) případě dává
indukční předpoklad formuli D, která je sestavena pouze z atomů vyskytujících se
současně v sekventech Γ, PΓ ⇒ a Π, PΠ, PA ⇒ A a která přitom splňuje
podmínku, že sekventy Γ, PΓ ⇒ D a Π, PΠ, PA, D ⇒ A jsou oba dokazatelné
v logice GL. Ze sekventu Γ, PΓ ⇒ D lze odvodit sekvent PΓ ⇒ PD ,
ze sekventu Π, PΠ, PA, D ⇒ A lze odvodit sekvent PΠ, PD ⇒ PA . Formule
PD je tedy hledanou formulí, neboť obsahuje pouze atomy vyskytující se
současně v obou sekventech PΓ ⇒ a PΠ ⇒ PA .
V druhém případě dává indukční předpoklad formuli D splňující požadavek na
výrokové atomy a takovou, že sekventy Γ, PΓ, PA ⇒ A, D a Π, PΠ, D ⇒
jsou oba dokazatelné v logice GL. Ponecháváme na čtenáři, aby domyslel, že v tom
případě sekventy PΓ ⇒ PA, ¬P¬D a PΠ, ¬P¬D ⇒ jsou oba dokazatelné a
že formule ¬P¬D splňuje požadavek na výrokové atomy. V tomto případě je tedy
formule ¬P¬D hledanou formulí. QED
Věta 5.3.29 Nechť A(p) je modální formule, v níž se atom p vyskytuje jen v modálním
kontextu. Pak existuje formule D sestavená pouze z atomů formule A(p)
různých od p a taková, že ekvivalence D ≡ A(D) je dokazatelná v logice GL.
Důkaz Zvolme atom q nevyskytující se ve formuli A(p). Pak formule A(p) a atomy
p a q jsou jako v tvrzeních 5.3.26(b) a 5.3.27 a můžeme pokračovat v odvozování
v gentzenovském kalkulu, které v důkazu věty 5.3.27 skončilo řádkem (4):
5: A(p) ≡ A(q), A(p) ⇒ A(q) .
Tento sekvent je snadno dokazatelný, neboť je tautologický.
6: P(p ≡ A(p)), P(q ≡ A(q)) ⇒ A(p) ≡ A(q) ; 2, 4, Cut
7: P(p ≡ A(p)), P(q ≡ A(q)), A(p) ⇒ A(q) ; 5, 6, Cut.
První a třetí formule antecedentu sekventu (7) neobsahuje atom q, druhá formule
P(q ≡ A(q)) a formule A(q) v sukcedentu neobsahují atom p. Věta 5.3.28
říká, že existuje modální formule D, která neobsahuje atomy p ani q, obsahuje
pouze atomy vyskytující se ve formuli A a přitom následující dva sekventy
8: P(p ≡ A(p)), A(p) ⇒ D
9: P(q ≡ A(q)), D ⇒ A(q)
jsou dokazatelné v logice GL. Vezměme důkaz sekventu (8) a substituujme v něm
formuli D za všechny výskyty atomu p. Dále vezměme důkaz sekventu (9) a substituujme
v něm formuli D za všechny výskyty atomu q. Tím získáme důkazy
sekventů
10: P(D ≡ A(D)), A(D) ⇒ D
11: P(D ≡ A(D)), D ⇒ A(D) .
Formule D se totiž substituce nedotkne, neboť ta atomy p a q neobsahuje. Takže:
438 5 Některé neklasické logiky
12: P(D ≡ A(D)) ⇒ D ≡ A(D) ; 10, 11
13: ⇒ P(D ≡ A(D)) ; P-r
14: ⇒ D ≡ A(D) ; 12, 13, Cut.
QED
Nejen v Peanově aritmetice, nýbrž i v logice dokazatelnosti můžeme uvažovat
autoreferenční rovnice tvaru p ≡ A(p) s atomem p vyskytujícím se ve formuli A
pouze v modálním kontextu. Věta 5.3.29 zaručuje řešitelnost takových rovnic. Na
aritmetické straně to znamená, že o gödelovských autoreferenčních rovnicích můžeme
říci více než to, že mají jednoznačně určené řešení: jejich řešení lze vypočítat.
Mějme například rovnici ϕ≡Prπ(ϕ)→λ, která se vyskytla v důkazu Löbovy věty,
a počítejme její řešení, tj. hledejme modální formuli D takovou, že substituujeme-li
ji za atom p do formule p ≡ Pp → r, dostaneme formuli dokazatelnou v logice GL.
Pracnou analýzou důkazu věty 5.3.29 (a věty 5.3.28), nebo několika pokusy a s trochou
štěstí lze zjistit, že hledaná formule je formule Pr → r. To znamená, že
explicitním řešením rovnice ϕ ≡ Prπ(ϕ) → λ je aritmetická sentence Prπ(λ) → λ.
Z našich příkladů důkazů v logice GL víme, že existuje modální formule A(p),
ve které se atom p vyskytuje pouze v modálním kontextu, a přitom taková, že
formule P(p ≡ A(p)) → (¬P⊥ → ¬Pp) je dokazatelná v logice GL. Položme si
otázku, zda existuje modální formule A(p), v níž se atom p vyskytuje opět pouze
v modálním kontextu a která splňuje silnější podmínku
GL P(p ≡ A(p)) → (¬P⊥ → ¬Pp & ¬P¬p). (∗)
Pokud ano, mohli bychom užít větu o korektnosti logiky GL vůči aritmetické sémantice
spolu s větou o autoreferenci a dokázat existenci aritmetické sentence ϕ,
pro kterou platí
PA Con(π) → ¬Prπ(ϕ) & ¬Prπ(¬ϕ). (∗∗)
Měli bychom tedy alternativní (modální) důkaz klasické verze Rosserovy věty 4.5.6.
Rozmysleme si, že takto větu 4.5.6 dokazovat nelze. Kdyby totiž existovala modální
formule A splňující podmínku (∗), díky větě 5.3.29 by existovala i modální
formule D taková, že v logice GL lze dokázat formuli ¬P⊥→¬PD&¬P¬D. Taková
modální formule D ale neexistuje, viz cvičení 20. Avšak ve cvičeních 21 a 22 je ukázáno,
že Rosserovu větu lze přesto dokázat jistými úvahami o logice dokazatelnosti,
totiž využitím věty 5.3.30 o úplnosti logik GL a GLω
vůči aritmetické sémantice.
5.3.5 Aritmetická úplnost
Úplnost logik GL a GLω
vůči jejich aritmetickým interpretacím dokázal R. Solovay
v článku [86]. Hlavní metoda použitá v důkazu je autoreference v množném čísle, tj.
užití věty 4.5.11: v důkazu věty 5.3.30 vystupují sentence λ1, . . , λn, a každá z nich
je „deﬁnována tím, co tvrdí o sobě a o ostatních λi. Připadá nám pozoruhodné, že
v důkazu úplnosti modálních logik, které mají vztah k autoreferenci, se uplatňuje
5.3 Logika dokazatelnosti 439
opět autoreferenční konstrukce, a to jedna z nejzajímavějších vůbec. A je asi docela
případné zakončit náš text, ve kterém autoreference hrála dost podstatnou roli,
právě tímto důkazem.
Věta 5.3.30 (Solovay, 1975) (a) Každá PA-platná modální formule je dokazatelná
v logice GL.
(b) Každá N-platná modální formule je dokazatelná v logice GLω
.
Důkaz Zpočátku uvažujme o obou tvrzeních souběžně. Předpokládejme, že A je
modální formule, která není dokazatelná v logice GL či v logice GLω
. Chceme
dokázat, že formule A není PA-platná resp. N-platná, tj. že existuje aritmetický
překlad či takový, že PA A resp. N /|= A . Máme větu o úplnosti vůči
kripkovské sémantice: formule A má nějaký konečný kripkovský protipříklad K.
Jako obvykle můžeme předpokládat, že ten vrchol modelu K, ve kterém formule A
není splněna, je v modelu K kořenem. Dále předpokládejme, že celkový počet
vrcholů v modelu K je n, že jsou označeny 1, . . , n a že kořen má označení 1. Tedy
K = W, R, − , W = {1, . . , n}, 1 −/ A.
V (b) navíc platí, že kořen 1 je A-korektní. Model K a formuli A pokládejme
v celém důkazu za pevně dané. O modelu K můžeme mluvit i uvnitř Peanovy
aritmetiky. Například R je konečná množina dvojic, uvnitř PA je popsána konečně
mnoho podmínkami tvaru i R j a ¬(i R j). Také pravdivostní relace − je popsána
jen konečně mnoha podmínkami (alespoň pokud se týká atomů vyskytujících se
ve formuli A). Označme S(i) množinu { j ; i R j }. Množina S(i) je množina
všech vrcholů rámce {1, . . , n}, R modelu K dosažitelných z vrcholu i. Navíc
položme S(0) = {1, . . , n}.
Naším plánem je na základě rámce {1, . . , n}, R sestrojit sentence λ1, . . , λn (jejich
počet je rovný počtu vrcholů rámce) a potom z nich a z relace − sestrojit aritmetický
překlad resp. . Jak už jsme řekli, sentence λ1, . . , λn si opatříme na základě
autoreference v množném čísle. To znamená, že každou sentenci λi budeme deﬁnovat
jako výrok o rámci W, R a o číslech λ1, . . , λn. Mysleme si tedy, že máme
v ruce numerály λ1, . . , λn a v PA s jejich pomocí deﬁnujme funkci g:
g(0) = 0,
g(x + 1) =
j když Proofπ(¬λj, x) a přitom g(x) R j nebo g(x) = 0
g(x) jinak.
Zdůrazněme ještě jednou, že toto je deﬁnice funkce uvnitř Peanovy aritmetiky.
Na metamatematické úrovni jsme napsali Σ-formuli s volnými proměnnými x a y,
kterou čteme číslo y je funkční hodnota funkce g v bodě x. Uvažujme v PA o průběhu
funkce g. Možné hodnoty funkce g jsou buď číslo 0, nebo prvky 1, . . , n modelu K.
Funkce g začíná v nule. V každém okamžiku buď stojí na místě, nebo skočí do
některého vrcholu kripkovského rámce. Po prvním skoku jsou možné i další skoky,
ale vždy jen do vrcholů dosažitelných z dosavadní hodnoty. Z toho je (Peanově
440 5 Některé neklasické logiky
aritmetice) jasné, že skoků nemůže být nekonečně mnoho, a tedy že funkce g po
jisté době nabude deﬁnitivní hodnoty:
1: ∃x∀y ≥ x(g(y) = 0) ∨ . . ∨ ∃x∀y ≥ x(g(y) = n).
Domluvme se opět, že vypouštíme „PA před znakem dokazatelnosti. O deﬁnitivní
hodnotě můžeme mluvit jako o limitě. Podmínku (1) tedy můžeme přepsat na
2: lim g = 0 ∨ . . ∨ lim g = n.
Pokud se funkce g v nějakém okamžiku octne ve vrcholu i, pak tam buď zůstane,
nebo skončí v některém vrcholu z množiny S(i):
3: ∃x(g(x) = i) → lim g = i ∨ j∈S(i) lim g = j.
Tím jsme získali postačující informaci o tom, kam a jak funkce g skáče. Ptejme se
ještě, kdy či proč skáče. Skok do vrcholu i mohl nastat jen v okamžiku nalezení
důkazu sentence ¬λi:
4: Je-li i = 0, pak ∃x(g(x) = i) → Prπ(¬λi).
Je-li funkce g v nějakém okamžiku x ve vrcholu i a už tam zůstane, znamená to, že za
číslem x nebyl nalezen důkaz žádné sentence ¬λj pro j ∈ S(i). To ale znamená, že
každá taková sentence ¬λj nemá žádný důkaz, protože každá dokazatelná sentence
jistě má neomezeně velké důkazy. Takže
5: lim g = i → j∈S(i) ¬Prπ(¬λj).
Teď jsme schopni deﬁnovat sentence λ1, . . , λn:
λi ≡ lim g = i, 1 ≤ i ≤ n.
K tomu přidejme ještě sentenci λ0:
λ0 ≡ lim g = 0.
Sentence λ0 je na rozdíl od sentencí λi pro 1 ≤ i ≤ n deﬁnována přímo, bez užití
autoreference. V deﬁnicích všech sentencí λ0, . . , λn vystupují numerály λ1, . . , λn,
nikoliv numerál λ0. Sentence λi mají následující vlastnosti:
6:
n
i=0 λi ; 2
7: λi → j∈S(i) ¬Prπ(¬λj) ; 5
8: Je-li i = j, pak λi → ¬λj,
neboť funkce g nemůže mít dvě různé limity. Dále platí
9: Je-li i = 0, pak λi → Prπ(¬λi) ; 4.
O průběhu funkce g uvažujeme vlastně na třech úrovních: ve skutečnosti, uvnitř PA,
a roli hrají také některé fakty, o kterých je dokazatelné, že jsou dokazatelné.
Uvnitř PA zatím můžeme říci, že funkce g skáče modelem K ve směru relace dosažitelnosti
R, ale dost neochotně. Skok do vrcholu i může nastat pouze v případě,
je-li po ruce důkaz, že i není deﬁnitivní hodnota.
5.3 Logika dokazatelnosti 441
Je-li i listem v modelu K, pak sentence λi je ekvivalentní s ∃x(g(x) = i), což je
Σ-sentence. Není-li i listem, platí alespoň jedna implikace:
λi → ∃x(g(x) = i).
Z toho můžeme usoudit
10: λi → Prπ(∃x(g(x) = i)) ; Formalizovaná Σ-úplnost
∃x(g(x) = i) → λi ∨ j∈S(i) λj ; 3
11: Prπ(∃x(g(x) = i) → λi ∨ j∈S(i) λj) ; D1
12: λi → Prπ(λi ∨ j∈S(i) λj) ; 11, D2, 10
13: Je-li i = 0, pak λi → Prπ( j∈S(i) λj) ; 12, 9.
Podmínka (13) říká, že pokud funkce g provede vůbec nějaký skok a skončí ve
vrcholu i, pak je dokazatelné, že neskončí v i, nýbrž v některém vrcholu j dosažitelném
z i. Podmínka (7) říká, že žádné takové j není vyloučeno, a to ani
v případě, kdy funkce g žádný skok neprovede, tj. v případě, kdy i = 0. To jsou
fakty známé o průběhu funkce g uvnitř Peanovy aritmetiky. Zbývá zjistit, co se
stane ve skutečnosti.
14: N |= Prπ(¬λi) → ¬λi ; Schéma reﬂexe
Je-li i = 0, pak N |= λi → ¬λi. ; 9, 14
15: Je-li i = 0, pak N |= ¬λi.
16: N |= λ0 ; 15, 6
N |=
n
i=1 ¬Prπ(¬λi) ; 7 (pro i = 0), 16
17: Každá λi, pro 1 ≤ i ≤ n, je s PA bezesporná.
Podmínky (16) a (17) říkají, že v Peanově aritmetice nelze dokázat žádnou sentenci
¬λi pro 0 ≤ i ≤ n. Z toho a z (8) plyne, že nelze dokázat ani žádnou
sentenci λi. Všechny sentence λ0, . . , λn jsou tedy na PA nezávislé, v N platí λ0.
To je zároveň odpověď na otázku, co se stane ve skutečnosti: nikdy se nestane nic,
funkce g neopustí nulu.
Dosud zjištěné vlastnosti funkce g a sentencí λi se použijí v důkazech obou tvrzení
(a) a (b).
Víme, že aritmetický překlad je zadán svými hodnotami na výrokových atomech.
V (a) použijeme překlad , který deﬁnujeme takto: pro každý atom p zjistíme,
ve kterých vrcholech modelu K je splněn, a atom p pak přeložíme na disjunkci
příslušných sentencí λi:
p = { λi ; 1 ≤ i ≤ n & i − p }.
Překlad má vlastnosti vyjádřené v následujícím tvrzení.
442 5 Některé neklasické logiky
Sublemma A Nechť 1 ≤ i ≤ n a nechť B je modální formule. Když i − B,
pak λi → B . Když naopak i −/ B, pak λi → ¬B .
Toto sublemma dokážeme indukcí podle složitosti modální formule B. Je-li B atom
a i − B, pak B je disjunkce sentencí, mezi nimiž je λi, a tedy opravdu λi → B .
Když i −/ B, pak z (8) plyne λi → ¬B . Případ, kdy formule B je sestavena
z jednodušších formulí pomocí některé logické spojky, je přímočarý, a jeho ověření
přenecháváme čtenáři. Nechť B začíná modalitou, tj. má tvar PD. Předpokládejme
i − PD. Pak
∀j(i R j ⇒ j − D)
∀j(i R j ⇒ λj → D ) ; Indukční předpoklad
j∈S(i) λj → D
Prπ( j∈S(i) λj) → Prπ(D ) ; D1, D2
λi → Prπ(D ) ; 13.
Předpokládejme, že naopak i −/ PD. V tom případě existuje j takové, že i R j
a j −/ D. Pak
λj → ¬D ; Indukční předpoklad
Prπ(λj → ¬D ) ; D1
λi → ¬Prπ(D ) ; 7.
V obou případech jsme dokázali, co bylo třeba, neboť (PD) je sentence Prπ(D ).
Tím jsme dokončili důkaz sublemmatu A.
Z dokázaného sublemmatu okamžitě vyplývá platnost tvrzení (a): protože 1 −/ A,
máme λ1 → ¬A . Ze (17) plyne A .
V důkazu tvrzení (b) máme navíc předpoklad, že vrchol 1 modelu K je A-korektní.
Jedna z hodnot funkce g je nula, kterou jsme dosud považovali za počáteční hodnotu
nemající nic společného s modelem K. Nyní prohlašme číslo 0 za nový kořen a
každému atomu vyskytujícímu se ve formuli A v něm přidělme tutéž pravdivostní
hodnotu, kterou má ve vrcholu 1. To znamená, že jsme model K přepracovali na
model K tak, jak je znázorněno na obrázku 5.3.3. Lemma 5.3.20 říká, že nový
kořen 0 je A-korektním vrcholem modelu K a že každá podformule formule A
má ve vrcholech 0 a 1 tutéž pravdivostní hodnotu. Aritmetický překlad se nyní
deﬁnuje takto:
p = { λi ; 0 ≤ i ≤ n & i − p }.
Překlad se liší od překladu tím, že v disjunkci se někdy vyskytne i sentence λ0,
a to přesně tehdy, když tam je i sentence λ1. Pro podformule původní formule A
platí skoro stejné pomocné tvrzení jako v důkazu tvrzení (a).
Sublemma B Nechť 0 ≤ i ≤ n a nechť B je podformule formule A. Když i − B,
pak λi → B . Když naopak i −/ B, pak λi → ¬B .
5.3 Logika dokazatelnosti 443
V důkazu tohoto sublemmatu opět postupujeme indukcí podle složitosti formule B.
Stačí zabývat se pouze případem, kdy i = 0 a i − PD. Všechny ostatní případy
jsou stejné jako v důkazu sublemmatu A. Nechť tedy 0 − PD. Pak formule D je
splněna ve všech vrcholech 1, . . , n původního rámce, a díky A-korektnosti vrcholu 0
je splněna i ve vrcholu 0. Tedy
∀j(0 ≤ j ≤ n ⇒ λj → D ) ; Indukční předpoklad
n
j=0 λj → D
D ; 6.
Z posledního řádku plyne Prπ(D ), a tedy i λ0 → Prπ(D ).
Ze sublemmatu B opět téměř bezprostředně vyplývá platnost tvrzení (b): z lemmatu
5.3.20 plyne 0 −/ A, neboť 1 −/ A, ze sublemmatu B plyne λ0 → ¬A a
dále z řádku (16) plyne N /|= A . QED
Výsledky týkající se logiky dokazatelnosti, které jsme ukázali v tomto oddílu,
zdaleka nevyčerpávají problematiku aplikací modální logiky v metamatematice.
Existují další modální logiky, ve kterých se kromě modality nutnosti připouštějí
dodatečné „modality , vhodné pro popis různých autoreferenčních konstrukcí (uvozovky
jsme užili proto, že tyto dodatečné modality nemají žádný vztah k modalitám
v přirozené řeči). Například v článku [29] se zkoumají modální logiky, jejichž „jazyk
kromě logických spojek a symbolu P obsahuje ještě symboly a . Každý
z těchto symbolů je binární operátor, který je povoleno aplikovat pouze na formule
začínající symbolem P; podmínky v deﬁnici aritmetického překladu týkající
se symbolů a pak jsou E
(PA PB)∗
= ∃x(Prπ(A∗) & ∀v<x¬Prπ(B∗)),
(PA PB)∗
= ∃x(Prπ(A∗) & ∀v≤x¬Prπ(B∗)).
Symbolům a se říká symboly pro porovnávání svědků, logiky obsahující tyto
symboly jsou vhodné k popisu rosserovských konstrukcí, jako byla ta z věty 4.5.6.
Jiná užitečná možnost, jak rozšířit jazyk modální logiky, je přidat binární symbol
£ pro interpretovatelnost (ve smyslu z oddílu 3.6). Tento symbol je aplikovatelný
na všechny dvojice modálních formulí; jemu příslušná podmínka v deﬁnici
aritmetického překladu pak je (A £ B)∗
= Intp(A∗, B∗), kde Intp(x, y) je aritmetická
formule existuje interpretace teorie (π + y) v teorii (π + x). Modální logice
se symbolem £ pro interpretovatelnost axiomatických teorií se říká logika interpretovatelnosti.
Z (formalizace v PA) tvrzení 4.5.8(b) například plyne, že modální
formule ¬P⊥ → ¬(¬⊥ £ ¬P⊥) je tautologie v různých variantách logiky interpretovatelnosti.
Zájemcům o tuto problematiku doporučujeme přehledový článek
A. Vissera [96]. Zájemcům o aplikace modálních logik v metamatematice různých
teorií (jiných než Peanova aritmetika) doporučujeme kromě článku [96] také článek
[6] a práci [43].
444 5 Některé neklasické logiky
Cvičení
1. Dokažte Löbovu větu přímo, bez užití autoreference.
Návod. Aplikujte Druhou Gödelovu větu na teorii (T + ¬ϕ). Uvažte, že
sentence ¬Con(τ + ¬ϕ), která vyjadřuje její spornost, je ekvivalentní se sentencí
Prτ (ϕ).
2. Dokažte, že důkaz Löbovy věty by také šlo založit na jiné sentenci λ, která by
splňovala podmínku λ ≡ Prτ (λ → ϕ).
3. Dokažte, že formule P(p∨q)→Pp∨Pq a (Pp→Pq)→P(p→q) nejsou N-platné.
4. Dokažte v logice K4 formule P(A & B) → PA & PB, PA ∨ PB → P(A ∨ B)
a ¬P⊥ → (PA → ¬P¬A).
5. Dokažte, že pro každou z logik GL a K4 platí omezená verze věty o dedukci:
když PB A, pak PB → A.
6. Dokažte aritmetickou korektnost Löbova axiomu přímo, tj. nikoliv oklikou přes
Löbovo pravidlo.
Návod. Podobně jako důkaz Druhé Gödelovy věty byl vlastně formalizací důkazu
(klasické verze) První Gödelovy věty, lze k důkazu Löbovy věty přidat
druhou část, která je formalizací dosavadní části.
7. Dokažte pomocí vzájemné simulovatelnosti kalkulů, že gentzenovský kalkulus
pro logiku K4 lze založit na pravidle Γ, PΓ ⇒ A / PΓ ⇒ PA .
8. Dokažte, že logika vzniklá přidáním schématu P(PA ≡ A) → PA k logice K4 je
ekvivalentní s logikou GL.
Návod. Z předpokladu P(PA → A) a z daného schématu použitého na formuli
PA dokažte v logice K4 formuli PA.
9. Dokažte, že axiom L3 je v logice GL redundantní.
Návod. Užijte axiom L4 na formuli A & PA.
10. Dokažte, že v modální logice s axiomy L1 a L2 a pravidly MP, Nec a LR nelze
dokázat axiom L3, a tedy ani axiom L4.
Návod. Dokažte korektnost uvedené logiky vůči třídě všech rámců W, R takových,
že relace R−1
je fundovaná. Pak navrhněte model W, R, − , ve kterém
relace R−1
je fundovaná, ale některá instance axiomu L3 v něm neplatí. Relace
R ovšem nemůže být tranzitivní.
11. Dokažte, že přidáním axiomu ¬P⊥ → ¬P¬P⊥ k logice K4 nevznikne logika
ekvivalentní s logikou GL.
Návod. Uvažujte takovýto nekonečný rámec:
5.3 Logika dokazatelnosti 445
ro U
r ro U
r ro U
r
q
q
q
q
q
q
r
12. Dokažte, že v logice K4 nelze dokázat formuli z předchozího cvičení.
13. Dokažte, že každá konečná část ∆ množiny
Γ = {Qp0, P(p0 → Qp1), P(p1 → Qp2), . . . }
je splnitelná v (dokonce ∆-korektním) kořenu některého (dokonce konečného)
kripkovského modelu pro logiku GL, ale celá množina Γ najednou splnitelná
není.
14. Je-li jakákoliv disjunkce PA1 ∨ . . ∨PAn dokazatelná v logice GL, pak i některá
formule Ai je dokazatelná v logice GL. Dokažte s pomocí kripkovské sémantiky
logiky GL.
15. Podobně dokažte, že GL ·PA → B, právě když GL PA → PB.
16. Dokažte tvrzení z předchozích dvou cvičení důkazově teoreticky, tj. úvahou o
bezřezových důkazech.
17. Dokažte, že logika vzniklá přidáním pravidla DiR k logice K4 je uzavřená na
Löbovo pravidlo. Zdůvodněte, že všechna tři rozšíření logiky K4, totiž pomocí
Löbova axiomu, Löbova pravidla, nebo pravidla DiR, jsou spolu ekvivalentní.
Návod. Napište modální verzi důkazu Löbovy věty.
18. Pomocí „ruční simulace procedury z důkazy věty 5.3.22 zjistěte, zda sekvent
P(Pp → q) ∨ P¬(p ∨ q), ¬Pq ⇒ P(P⊥→¬p), p platí v každém kripkovském
modelu pro logiku dokazatelnosti.
19. Nechť Pn
A a Qn
A označuje formuli vzniklou z formule A pomocí n-násobné
aplikace modality P resp. Q. Nechť m je formule Qm
&Pm+1
⊥. Zdůvodněte,
že formule m platí ve vrcholu a kripkovského modelu pro logiku dokazatelnosti
právě tehdy, když hloubka vrcholu a (tj. délka nejdelší cesty začínající v a) je m.
Pro 0 ≤ j ≤ m nechť formule Em,j jsou deﬁnovány následující rekurzí:
Em,0 = m
Em,j+1 = Q( m+j & P( m−1−j → q)) & Q( m+j & P( m−1−j → ¬q)) &
& P( m+j → Em,j).
Zdůvodněte, že model, který následuje, je nejmenší protipříklad na formuli E3,3.
Dále zdůvodněte, že počet prvků minimálního protipříkladu na formuli Em,m
roste exponenciálně s m.
446 5 Některé neklasické logiky
p
p p
p p p p
p p p p p p p p
p p p p p p p p
p p p p
p p
rrr
¨¨¨B

}

}
&
&&b
&
&&b
¢
¢
¢
¢
¢
¢
¢
¢
¢
¢
¢
¢
f
fw
f
fw
f
fw
f
fw
f
fw
f
fw

0

0

0

0
t
t
t
t
t
t
t
t
T T T T T T T T
q q q q¬q ¬q ¬q ¬q
q q¬q ¬q
q ¬q
20. Zdůvodněte, že je-li A libovolná aritmetická formule, v níž se atom p vyskytuje
pouze v modálním kontextu, pak formule P(p≡A(p))→(¬P⊥→¬Pp&¬P¬p)
není dokazatelná v logice GL.
Návod. Kdyby ano, vzhledem k větě 5.3.29 by existovala i modální formule D
neobsahující atom p taková, že formule ¬P⊥ → ¬PD & ¬P¬D je dokazatelná
v logice GL. Úvahou o dvouprvkovém modelu (s kořenem a listem) zdůvodněte,
že to není pravda.
21. Z Druhé Gödelovy věty pro teorii (PA + Con(π)) plyne, že sentence Con(π)
splňuje jen první tři z následujících podmínek pro sentenci ϕ:
◦ PA ϕ
◦ PA ¬ϕ
◦ PA Con(π) → ¬Prπ(ϕ)
◦ PA Con(π) → ¬Prπ(¬ϕ).
Dokažte, že existuje sentence ϕ, která splňuje všechny čtyři.
Návod. Zdůvodněte, že P(¬P⊥ → ¬Pp) & P(¬P⊥ → ¬P¬p) → Pp ∨ P¬p je
formule nedokazatelná v logice GLω
. Věta o aritmetické úplnosti logiky GLω
dává aritmetický protipříklad ∗ na tuto formuli. Uvažujte sentenci p∗
.
22. Analyzujte důkaz věty o aritmetické úplnosti logik GL a GLω
a zdůvodněte, že
(a) Je-li i listem v rámci W, R, − , pak sentence λi je PA-ekvivalentní s jistou
Σ-sentencí.
(b) splňuje-li atom p ve W, R, − podmínku ∀a∀b(a ≤ b & a − p ⇒ b − p),
pak sentence p (i sentence p ) je PA-ekvivalentní s jistou Σ-sentencí.
Zdůvodněte, že existuje dokonce Σ-sentence ϕ, která splňuje podmínky z předchozího
cvičení.
23. Zdůvodněte úvahou podobnou jako v předchozích cvičeních, že existují Σ-sentence
θ a λ takové, že v PA nelze dokázat žádnou z implikací θ → λ, θ → ¬λ,
¬θ → λ, ¬θ → ¬λ.
Literatura
[1] A. V. Aho, J. E. Hopcroft a J. Ullman. The Design and Analysis of
Computer Algorithms. Addison-Wesley, 1974.
[2] B. Balcar a P. Štěpánek. Teorie množin. Academia, Praha, 2001.
[3] J. L. Balcázar, J. Díaz a J. Gabarró. Structural Complexity I. Springer,
1988.
[4] J. Barwise, Ed. Handbook of Mathematical Logic. North-Holland, 1977.
[5] J. Barwise. An introduction to ﬁrst-order logic. V Handbook of Mathematical
Logic [4], kap. A.1, str. 5–46.
[6] A. Berarducci a R. Verbrugge. On the provability logic of bounded
arithmetic. Annals Pure Appl. Logic 61, 1–2 (1993), 75–93.
[7] G. Boolos a G. Sambin. Provability: the emergence of a mathematical
modality. Studia Logica L, 1 (1991), 1–23.
[8] G. Boolos. The Logic of Provability. Cambridge University Press, 1993.
[9] P. Burdová. Některé sémantické metody v intuicionistické logice. Diplomová
práce, Filozoﬁcká fakulta Univerzity Karlovy, katedra logiky, 1998.
[10] S. R. Buss. Bounded Arithmetic. Bibliopolis, Napoli, 1986.
[11] S. R. Buss. Weak Formal Systems and Connections to Computational Complexity.
Lecture Notes for a Topics Course, University of California, Berkeley,
leden–květen 1988.
[12] P. Cohen. Decision procedures for real and p-adic ﬁelds. Comm. Pure Appl.
Math. xxii (1969), 131–151.
[13] S. Cook. The complexity of theorem proving procedures. V Proc. 3rd ACM
Symp. of Theory of Computing (1971), str. 151–158.
[14] D. van Dalen. Intuitionistic logic. V Gabbay and Guenthner [23], kap. III.4,
str. 225–340.
448 Literatura
[15] O. Demuth, R. Kryl a A. Kučera. Teorie algoritm˚u. Skriptum, Matematicko-fyzikální
fakulta UK, 1989.
[16] L. van den Dries. Alfred Tarski’s elimination theory for real closed ﬁelds.
J. Symbolic Logic 53, 1 (březen 1988).
[17] L. van den Dries. O-minimal structures. V Logic Colloquium ’93 (Keele,
1996), W. Hodges et al., ed., Clarendon Press, Oxford.
[18] M. Dummett. A propositional calculus with denumerable matrix. J. Symbolic
Logic 25 (1959), 97–106.
[19] H.-D. Ebbinghaus a J. Flum. Finite Model Theory. Springer, 1995.
[20] S. Feferman. Arithmetization of metamathematics in a general setting.
Fundamenta Mathematicae 49 (1960), 35–92.
[21] J. Ferrante a C. W. Rackow. The Computational Complexity of Logical
Theories. Springer, 1979.
[22] M. C. Fitting. Intuitionistic Logic, Model Theory and Forcing. North-Holland,
1969.
[23] D. Gabbay a F. Guenthner, Ed. Handbook of Philosophical Logic.
Č. 164–167 řady Synthese Library. Kluwer, Dordrecht, 1983, 1984, 1986, 1989
(čtyři díly).
[24] M. Garey a D. Johnson. Computers and Intractability: A Guide to the
Theory of NP-completeness. Freeman, San Francisco, 1978.
[25] K. Gödel. Über formal unentscheidbare Sätze der Principia Mathematica
und verwandter Systeme I. Monatshefte für Mathematik und PhysikE
37 (1931), 349–360.
[26] K. Gödel. Zum intuitionistischen Aussagenkalkül. Anzeiger Akademie der
Wissenschaften Wien, Math.-naturwissensch. Klasse 69 (1932), 65–66. Viz
též Ergebnisse eines matematischen Kolloquiums 4 (1933), 40.
[27] S. Gottwald. Mehrwertige Logik. Akademie-Verlag, Berlin, 1988.
[28] S. Gottwald. Fuzzy Sets and Fuzzy Logic. Vieweg, Wiesbaden, 1993.
[29] D. Guaspari a R. M. Solovay. Rosser sentences. Annals of Math. Logic
16 (1979), 81–99.
[30] P. Hájek a M. Hájková. On interpretability in theories containing arithmetic.
Fundamenta Mathematicae 76 (1972), 131–137.
[31] P. Hájek a P. Pudlák. Metamathematics of First Order Arithmetic. Springer,
1993.
Literatura 449
[32] P. Hájek a V. Švejdar. Matematická logika. Praha, listopad 1994. Předběžný
učební text, v elektronické podobě.
[33] P. Hájek. Logische Kategorien. Archiv für Matematische Logik und Grundlagenforschung
13 (1970), 168–193.
[34] P. Hájek. Metamathematics of Fuzzy Logic. Kluwer, 1998.
[35] G. H. Hardy a E. M. Wright. An Introduction to the Theory of Numbers.
Oxford University Press, Oxford, 1979.
[36] A. Heyting. Die formalen Regeln der intuitionistischen Logik. V Sitzungsberichte
der Preussischen Akademie der Wissenschaften zu Berlin, Math. Kl.
Preussische Akademie der Wissenschaften, Berlin, 1930, str. 42–56.
[37] D. Hofstadter. Gödel, Escher, Bach: An Eternal Golden Braid. Basic
Books, Inc., New York, duben 1979. Znovu vydáno nakladatelstvím Random
House, New York, 1989.
[38] G. Hughes a M. Cresswell. A Companion to Modal Logic. Methuen &
Co. Ltd, 1984.
[39] G. Hughes a M. Cresswell. New Introduction to Modal Logic. Routledge,
London, 1996.
[40] C. C. Chang a H. J. Keisler. Model Theory. North-Holland, 1973.
[41] A. Church. A note on the Entscheidungsproblem. J. Symbolic Logic 1
(1930), 40–41.
[42] A. Church. An unsolvable problem of elementary number theory. Amer. J.
Math. 58 (1930), 345–363.
[43] E. Jeřábek. Provability Logic of the Alternative Set Theory. Diplomová
práce, Filozoﬁcká fakulta Univerzity Karlovy, katedra logiky, 2001.
[44] N. D. Jones a W. T. Laaser. Complete problems for deterministic polynomial
time. Theoretical Comput. Sci. 3 (1976), 105–118.
[45] D. H. J. de Jongh a F. Veltman. Intensional Logic. Skriptum, Philosophy
Department, University of Amsterdam, Amsterdam, 1988.
[46] R. M. Karp. Reducibility among combinatorial problems. V Complexity
of Computer Computation, R. Miller a J. Thatcher, ed. Plenum Press, New
York, 1972, str. 85–104.
[47] R. Kaye. Models of Peano Arithmetic. Oxford University Press, 1991.
[48] L. A. S. Kirby a J. B. Paris. Accessible independence results for Peano
arithmetic. Bull. London Math. Soc. 14 (1982), 285–293.
450 Literatura
[49] S. C. Kleene. Introduction to Metamathematics. D. van Nostrand, 1952.
[50] J. Krajíček. Bounded Arithmetic, Propositional Logic, and Complexity Theory.
Č. 60 řady Encyclopedia of Mathematics and Its Applications. Cambridge
University Press, 1995.
[51] G. Kreisel a J. L. Krivine. Elements of Mathematical logic (Model Theory).
North-Holland, Amsterdam, 1971.
[52] L. Kučera. Kombinatorické algoritmy. SNTL, Praha, 1983.
[53] I. Kylar. Eliminace řez˚u v klasické predikátové logice. Diplomová práce,
Filozoﬁcká fakulta Univerzity Karlovy, katedra logiky, 2000.
[54] R. Ladner. The computational complexity of provability in systems of modal
logic. SIAM J. Comput. 6, 3 (1977), 467–480.
[55] M. H. Löb. Solution of a problem of Leon Henkin. J. Symbolic Logic 20
(1955), 115–118.
[56] J. Lukasiewicz. Selected Works. Studies in Logic and the Foundations of
Mathematics. North-Holland a PWN Warszawa, 1970.
[57] V. Mařík, O. Štěpánková, J. Lažanský et al. Umělá inteligence 4.
Vyjde v nakl. Academia.
[58] E. Mendelson. Introduction to Mathematical Logic. Van Nostrand, 1964.
[59] J. D. Monk. Mathematical Logic. Springer, 1976.
[60] V. Novák, I. Perfilieva a J. Močkoř. Mathematical Principles of Fuzzy
Logic. Kluwer, 1999.
[61] P. Odifreddi. Classical Recursion Theory. North-Holland, Amsterdam,
1989.
[62] C. H. Papadimitriou. Computational Complexity. Addison-Wesley, 1994.
[63] J. B. Paris a L. Harrington. A mathematical incompleteness in Peano
arithmetic. V Barwise [4], kap. D.8, str. 1133–1142.
[64] J. B. Paris a L. A. S. Kirby. Σn-collection schemas in arithmetic. V Logic
Colloquium ’77, A. Macintyre, L. Pacholski a J. Paris, ed., Studies in Logic
and the Foundations of Mathematics. North-Holland, Amsterdam, 1978,
str. 199–209.
[65] E. L. Post. Introduction to a general theory of elementary propositions.
Amer. J. Math. 43 (1921), 163–185.
Literatura 451
[66] M. Presburger. Über die Vollständigkeit eines gewissen Systems der Aritmetik
ganzer Zahlen, in welchem die Addition als einzige Operation hervortritt.
V Comptes Rendus du I er
Congr`es des Mathématiciens des Pays Slaves
(Warszawa, 1929), str. 92–101.
[67] P. Pudlák. On the lengths of proofs of ﬁnitistic consistency statements in
ﬁrst-order theories. V Logic Colloquium ’84 (1984), J. Barwise et al., ed.,
North-Holland, str. 165–196.
[68] P. Pudlák. Cuts, consistency statements, and interpretations. J. Symbolic
Logic 50 (1985), 423–441.
[69] P. Pudlák. The lengths of proofs. V Handbook of Proof Theory, S. R.
Buss, ed., č. 137 řady Studies in Logic and the Foundations of Mathematics.
Elsevier, 1998, kap. VIII, str. 547–637.
[70] M. O. Rabin. Decidable theories. V Barwise [4], kap. C.3, str. 595–630.
[71] H. Rogers, Jr. Theory of Recursive Functions and Eﬀective Computability.
McGraw-Hill, New York, 1967.
[72] J. B. Rosser. Extensions of some theorems of Gödel and Church. J. Symbolic
Logic 1 (1936), 87–91.
[73] C. Ryll-Nardzewski. The role of the axiom of induction in elementary
arithmetic. Fundamenta Mathematicae 39 (1952), 239–263.
[74] G. Sambin a S. Valentini. The modal logic of provability: The sequential
approach. Journal of Philosophical Logic 11 (1982), 311–342.
[75] J. R. Shoenfield. Mathematical Logic. Addison-Wesley, 1967.
[76] H. Schwichtenberg. Proof theory. V Barwise [4], kap. D.2, str. 867–896.
[77] M. Sipser. Introduction to the Theory of Computation. PWS Publishing
Company (a division of International Thomson Publishing Inc.), 1997.
[78] C. Smory´nski. The incompleteness theorems. V Barwise [4], kap. D.1,
str. 819–843.
[79] C. Smory´nski. Modal logic and self-reference. V Gabbay and Guenthner
[23], kap. II.9, str. 441–496.
[80] C. Smory´nski. Self-Reference and Modal Logic. Springer, New-York, 1985.
[81] C. Smory´nski. Hilbert’s programme. CWI Quarterly 1, 4 (1988).
[82] C. Smory´nski. Logical Number Theory I. Springer, 1991.
452 Literatura
[83] C. Smory´nski. Metamathematics of Arithmetic, Chapter III: Representability
and Semi-Representability. Nepublikovaný rukopis, circa 1978.
[84] C. Smory´nski. Nonstandard Models of Arithmetic. Poznámky k přednášce
(rukopis), 1978.
[85] A. Sochor. Klasická matematická logika. Karolinum, Praha, 2001.
[86] R. M. Solovay. Provability interpretations of modal logic. Israel J. Math.
25 (1976), 287–304.
[87] R. Statman. Intuitionistic propositional logic is polynomial-space complete.
Theoretical Comput. Sci. 9 (1979), 67–72.
[88] P. Štěpánek. Matematická logika. Skriptum, Matematicko-fyzikální fakulta
UK, Praha, 1982.
[89] V. Švejdar a K. Bendová. On inter-expressibility of logical connectives
in Gödel fuzzy logic. Soft Computing 4, 2 (2000), 103–105.
[90] V. Švejdar. On provability logic. Nordic Journal of Philosophical Logic 4,
2 (2000), 95–116.
[91] G. Takeuti. Proof Theory. North-Holland, Amsterdam, 1975.
[92] A. Tarski, A. Mostowski a R. M. Robinson. Undecidable Theories.
North-Holland, Amsterdam, 1953.
[93] S. Tennenbaum. Non-archimedean models for arithmetic. Notices of the
AMS 270 (1959).
[94] A. S. Troelstra a H. Schwichtenberg. Basic Proof Theory. Cambridge
University Press, 1996.
[95] A. S. Troelstra. Aspects of constructive mathematics. V Barwise [4],
kap. D.5, str. 973–1052.
[96] A. Visser. An overview of Interpretability Logic. Logic Group Preprint
Series 174, Department of Philosophy, Utrecht University, Utrecht, 1997.
[97] B. L. van der Waerden. Algebra I, II. Springer, 1971, 1967.
[98] A. J. Wilkie a J. B. Paris. On the scheme of induction for bounded
arithmetical formulas. Annals Pure Appl. Logic 35 (1987), 261–302.
[99] A. J. Wilkie. Model completeness results for expansions of the real ﬁeld by
restricted Pfaﬃan functions and the exponential function. J. of the AMS 9
(1996), 1051–1094.
[100] L. A. Zadeh. Fuzzy sets. Information and Control 8, 3 (1965), 338–353.
Rejstřík
(τ + y), 304
(. .).., 92
(T + ϕ) nebo T, ϕ, 161
=, viz rovnítko
[F](z), 304
|. .|, viz mohutnost, délka, nebo
absolutní hodnota
ℵ0, 169
→n, →e, 218
∗, 92
, , 17
P, 417
◦, 84
=n, 236
!, 83
∆0(Γ), 339
Q, 417
·−, 87
↓, 21
, 67, 85, 87, 91
≡, 19, 20, 47, 138, 148, 368
∃!, 229
⇒, 396
∀, ∃, viz kvantiﬁkátory
−, 368, 384
ϕ H
D, 406, 407
Γ(T), 309
. . , 301
£, 270
. . , 67
≤log
m , 127
≤m, 102
O, 36, 66
|, 89, 280
. . , 92
|=, 14, 16, 142, 147, 168
µ, 85
ω, 215
n, viz numerály
, 88
π(z), 305
n, e, 218
 ¡, 40
⇒, ⇔, 19
·P, 432
Σn, Πn, viz formule Σn a Πn
Σ+
n , Π+
n , viz formule Σ+
n a Π+
n
, 84
√
. ., 247
˜, 92
→, ¬, &, ∨, viz logické spojky
, ⊥, 19, 21, 47, 48, 77, 138, 200, 417,
425
x, 83, 151
ϕ( ˙x1, . . , ˙xn), 333
ϕ(x1, . . , xn), 152
ϕ[a1, . . , an], 145
, 30
e(x/a), 142
tD
[e], 142
Σn, Πn, 104–107, 132
(, [[, ), ]], 22, 27, 214, 244, 396
A1–A7, 30, 157, 204, 261, 303, 379, 398
abeceda, 50
absolutní hodnota, 246, 283
algebraické termy a formule, 247
algoritmus, 11, 51, 90, 97, 115, 124,
454 Rejstřík
140, 250, 257, 272, 316, 371,
380, 431
amalgamace (kripkovských modelů),
374, 382, 391
aritmetická hierarchie, 105–107
aritmetický jazyk, 139, 141, 144, 275,
285, 292, 352, 415
aritmetický protipříklad, 420
aritmetický překlad, 418
aritmetizace, 300
atom, 13, 73
automorﬁsmus, 265, 274
autoreference, 331, 348, 361, 415–417,
422, 432, 434, 436, 438, 444
axiom, 9, 41, 137, 264, 318
logický, 161, 302
rovnosti, 167
speciﬁkace, 157
vlastní nějaké teorie, 161
výrokový, 29, 30
axiom extenzionality, 298
axiom prelinearity, 398, 407
axiom výběru, 27, 28, 175
axiomatická teorie, viz teorie
B1 a B2, 157, 204, 261, 303, 341, 388,
407
Belluce, 395
Bernays, 417
BG, 407
booleovská funkce, 20
booleovský výraz, 49
Boolos, 417
Brouwer, 366, 367
BΣn, BΠn, 320
celočíselný logaritmus, viz
cesta (v grafu), 31, 118, 208, 445
CNFSat, 116, 134, 135
Cohen, 11, 240
Con(τ), Con(π), 304–308, 344, 349, 350,
352, 353, 358, 363, 419, 436
coNP, 132, 381, 403
cyklus (v grafu), 118
časové třídy (úloh a funkcí), 115
D1–D3, viz podmínky D1–D3
de Morganovy zákony, 17
deﬁnice pravdy, 339, 342, 344, 349
deﬁniční obor, 83
deﬁnovatelný prvek struktury, 264, 346
dekvotační schéma, 343, 349
dělení se zbytkem, viz dělitelnost
dělitelnost, 10, 81, 237, 238, 280, 281,
283, 293, 295, 308
délka (důkazu, formule, sekventu nebo E
množiny formulí), 36, 37, 39,
122, 132, 180, 186, 374
délka (sledu nebo cesty v grafu),
118–120, 124, 175, 191, 209
délková funkce, viz
derivability conditions, viz podmínky
D1–D3
derivace, 243
Diagn(. .), Diage(. .), 220, 226
diagonalizace (viz též autoreference),
346, 348
diagram, 220
disjunktivní normální tvar, 18, 21, 233,
239
Dn1 a Dn2, 173
DNFSat, 116, 133
DNO, 173, 213, 214, 216, 225, 241, 256,
258, 263
DNS (double negation shift), 389, 394
DO, 212, 214, 216, 227, 228, 230, 254,
258, 267, 269, 270, 274, 285,
286
dobré uspořádání, 207
Dom, 83
DOS, 230, 237, 256–258, 266
dosazení konstanty, 87
Dosažitelnost, 118
van den Dries, 254
důkaz, 10, 30, 156, 206, 272, 303, 328,
367
bezřezový, 43, 46, 190, 377, 379,
392, 430, 433, 445
Rejstřík 455
regulární, 191
stromový a důkaz-posloupnost, 31,
41, 47, 186
v kalkulu G nebo G∀, 398
v kalkulu GK, 41, 183, 184
v kalkulu HK, 30, 157
důsledek, 9, 160
v intuicionistické logice, 386
v klasické predikátové logice, 147
v klasické výrokové logice, 16
dynamická datová struktura, 91
E1–E5, 167, 168, 181, 261, 303, 343
Ehrenfeucht, 223
eliminovatelnost řezů, 46–48, 191, 199,
343, 377, 388, 394, 395, 430
enumerace (funkcí a množin), 99
Eukleidův algoritmus, 81, 283
ex falso (quodlibet), 367, 379
expanze, 208, 220, 229, 254, 287
faktorizace, 166
ﬁltr, 25, 26, 28
ﬁnitní tvrzení a důkazy, 353, 355
FLOG, 115, 120, 127
FMP (ﬁnite model property), 377, 389,
430
FOR, 85
formalizace, 172, 175, 292, 307, 322,
332, 337, 356
formální numerály, 332
formule, 9, 209, 257
∆0, 309
Γ-konzervativní, 363
Σn, Πn, 309
Σ+
n , Π+
n , 340
PA-platná či N-platná, 418
absolutní, 217, 322, 346
aritmetická, 139, 149, 152
atomická, 138
dokazatelná, 160
ekvivalentní, 16, 231, 386
existenční, 150, 218, 254
harropovská, 392, 394, 395
hornovská, 116, 134
induktivní, 218
intuicionisticky logicky platná, 385,
389
jazyka, 138
kvantiﬁkovaná výroková, 77
logicky platná, 15, 28, 137, 328,
365, 389
logicky platná ve fuzzy logice, 407
modální, 417
negativní, 391, 394, 395
nezávislá, 160
omezená, 309
otevřená, 139, 217, 218
platná v aritmetické interpretaci,
419
platná v kripkovském modelu, 370,
427
platná ve fuzzy struktuře, 407
platná ve struktuře, 147
postranní, 42
predikátová, 73, 137, 138
predikátová, která je tautologií,
157
prenexní, viz prenexní
principální, 42
regulární, 191
splněná ohodnocením ve struktuře,
143
splněná ve vrcholu kripkovského
modelu, 368
splnitelná, 15, 403
univerzální, 150, 218, 221, 254
uzavřená, viz sentence
vstupní, 42
výroková, 13, 73, 260
vyvratitelná, 160
FP, 114, 120
FPartR, 85
FPR, 85
fragmenty Peanovy aritmetiky, 321
Frechetův ﬁltr, viz ﬁltr
FSPACE(f), 115
FTIME(f), 114
456 Rejstřík
funkce
částečná, 83
částečně rekurzívní, 83, 85, 275
charakteristická množiny, 87
(obecně) rekurzívní, 85
počitatelná, 65
polynomiálně počitatelná, 115
primitivně rekurzívní, 85, 314
totální, 83
univerzální, 98
základní, 85, 96
fuzzy relace, 405
G-algebra, 399
standardní, 396
GB, 175, 262, 353
Gen-A, Gen-E nebo Gen, viz
generalizace
generalizace, 157, 183, 185, 211, 221,
304, 306, 387, 388, 407, 410,
420
GL nebo GLω
, viz logika dokazatelnosti
Gödel, 162, 293, 395, 404
Gödelova β-funkce, 298
Gödelova-Bernaysova teorie množin, viz
GB
Gödelovy věty o neúplnosti, 12, 176,
318, 327, 330, 336, 365, 415
Gordan, 353
Gottwald, 396
graf
acyklický, 118, 175, 182
neorientovaný, 24, 118, 224
orientovaný, 31, 118, 175, 208
silně souvislý, 208
souvislý, 224
graf (funkce), 111, 112, 272, 314,
330–332, 345
grupa, 224
G-Sat, G-Taut, 403
Hájek, 269, 289, 351
Henkin, 415, 417
henkinovské konstanty a axiomy, 162,
170, 409
Heyting, 366, 367, 395
Hilbert, 137, 275, 353, 417
Hilbertův program, 12, 353
hloubka (důkazu nebo formule), 191,
377
hodnost (řezová důkazu), 191
homomorﬁsmus, 166, 217
HornSat, 116, 119, 131, 134
hrana (grafu), 24, 118
hygiena, 9, 51
hypotéza kontinua, 11
Chang, 395
Churchova teze, 97, 115, 316
Churchova věta, 330
IAdd, 235, 237–239, 252, 254–256, 258,
265, 274
I∆0, IΣn, 320, 346, 351
Immermanova-Szelepcsényiho věta, 131
Ind, viz indukce
index (funkce nebo množiny), 99
indukce, 152, 276, 278, 284, 290, 305,
335
neparametrická, 279
omezená, 320
inﬁmum, 225, 406
instance schématu, 30
instance úlohy, 50
interpolace, 21, 48, 202, 205, 227, 436
interpretace, 266, 267, 268, 269, 275,
381, 395, 443
Int-Taut, 370, 374, 380, 394, 405
intuicionistická tautologie, 370, 380, 405
jazyk, 138, 140, 206, 216, 318
jazyk (jako množina slov), 79
de Jongh, 432
K, K0, 100
kalkulus, 29, 37, 132
hilbertovský (fregovský), 30, 420
Rejstřík 457
sekventový (gentzenovský), 40,
337, 376, 379, 424
(silně) korektní, 29, 37, 38, 398
(silně) úplný, 29, 38, 39
kalkulus GJ
predikátová varianta, 386
výroková varianta, 376
kalkulus GK, 343, 376, 390
predikátová varianta, 182
výroková varianta, 41
kalkulus GKe, 203
kalkulus GKT , 48
kalkulus HJ, 407
predikátová varianta, 388
výroková varianta, 379
kalkulus HK, 343, 379, 409
predikátová varianta, 157, 257
výroková varianta, 30
kalkulus HKe, 167, 344
kalkulus pro logiku G či G∀, 398, 407
kardinální čísla, 169, 210
Kaye, 289
K4, 420
klauzule, 18, 128, 134, 135
hornovská, 116
Kleene, 367
Kleeneho číslo, viz index
kódová tabulka, 58, 69, 257
kódování posloupností, 91, 257, 292,
298, 347
kolaps aritmetické hierarchie, 106, 318
Kolmogorov, 366
kompaktnost, 22, 25, 37, 45, 162, 165,
206, 210, 271, 288, 292, 387,
393, 431, 445
koncová značka, 58, 59, 65, 66, 74
konﬁgurace, 67, 97, 121, 126
koncová, 68
odvozená, 68, 98
počáteční, 68
konjunktivní normální tvar, 18
konkatenace, 50, 299
konstruktivní důkaz, 366, 367
konzervativní rozšíření, viz rozšíření
teorie
Korec, 256, 265
korektnost, silná korektnost, 29, 34, 37,
38, 159–162, 168, 376, 387,
399, 428, 438
kořen (polynomu), 241, 242
kořen (v grafu), 31, 41, 118, 369, 426,
428
Krajíček, 13, 37, 40, 47, 190
Kreisel, 9, 366
Kripke, 367
Krivine, 9
kvantiﬁkátory, 13, 19, 137, 235, 309,
383, 405, 416
kvantiﬁkovaná výroková formule, viz
formule
Ladner, 374
Leibniz, 49, 368
Lh, 92, 294
limita, 243, 440
limita řetězu, 222
list, 31, 41, 118, 120, 369, 371, 426, 427
literál, 18, 129, 237, 255
LNP, 278, 279, 281, 282, 285
LO, 172, 211, 230, 234, 240, 270, 273
LO1–LO3, 172, 230, 240, 266
Löb, 415, 417
Löbův axiom či pravidlo, 422, 445
LOG, 115, 122, 125, 127, 130
logaritmický prostor, 115
logické konstanty, viz , ⊥
logické spojky, 13, 14, 19, 21, 58, 73,
74, 77, 137, 366, 368, 383, 396,
405, 416
logické symboly, 13
logické „zákony , 17
logický důsledek, viz důsledek
v klasické predikátové logice
logika
dokazatelnosti, 417, 423
druhého řádu, 210
(Gödelova) fuzzy, 395, 413
458 Rejstřík
intermediární, 398
interpretovatelnosti, 443
intuicionistická, 367, 380, 395–398,
405, 426
klasická, 365, 367, 380, 395, 398
modální, 374, 417
neﬁnitní, 210
predikátová, 137, 328
vícehodnotová, 395, 404
výroková, 13
Lukasiewicz, 395
Maeharova metoda, 202
makra, 62
minimalizace, 84, 112
množina
Γ-deﬁnovatelná, 313
Γ-těžká, 131
Σn, Πn, 104, 316, 364
Σn- či Πn-kompletní, 106, 327,
329, 330, 345, 346
Σn- či Πn-univerzální, 106
aritmetická, 317
deﬁnovatelná, 264, 284, 313, 316,
351, 358
deﬁnovatelná v kripkovském
modelu, 391
efektivně nerekurzívní, 109
kompletní, 103
kompletní vůči logaritmickým
převodům, 131, 380
kreativní, 110
m-převeditelná, 102, 110, 258, 327,
330
množiny efektivně neoddělitelné,
110
množiny rekurzívně neoddělitelné,
112
nejvýše spočetná, 169
(obecně) rekurzívní, 88, 259, 359,
418
parametricky deﬁnovatelná, 358
primitivně rekurzívní, 88, 259, 313,
316, 346
převeditelná logaritmickým
převodem, 127, 431
rekurzívně spočetná, 87, 124, 259,
313, 316, 327, 359, 418
standardní, 358
úplně uspořádaná, 406
množina předpokladů, 16, 148, 153
sporná (bezesporná), 34
modality, 417, 443
model, 160, 168, 169, 258, 264, 283,
285, 409
standardní (aritmetiky), 283, 317
model (kripkovský), 368, 426
generovaný vrcholem, 370
modus ponens, 30, 157, 187, 306, 336,
397, 404
mohutnost, 140, 169, 210, 213, 285, 287,
288, 368
Moisil, 395
Morleyova věta, 215
možné světy, 368
MP, viz modus ponens
N, N, 36, 50, 141, 152, 170, 211, 212,
256, 258, 265, 272, 275, 283,
286, 419
Násobení, 49, 50, 133
násobení (výpočet součinu), 55, 66, 67
Nec (rule of necessitation), 420, 424
neformální důkazy a algoritmy, 43, 158,
172, 231
největší společný dělitel, viz dělitelnost
Nezávislá množina, 119
NLOG, 125, 127, 130
NLOG-kompletní úloha, 131, 132
Novák, 413
NP, 125, 127, 130, 133, 381, 403
NP-kompletní úloha, 131, 136, 403
NPSPACE, 125, 127
NRn,i a ξn,i, 246, 250, 254
numerály, 144, 170, 177, 231, 235, 283,
302, 324, 332, 361
obarvení grafu, 24
Rejstřík 459
obor hodnot, 83
Odifreddi, 49, 115
odvození, 10
odvozovací pravidlo, 29
ohodnocení proměnných, 142, 337
omezená indukce, viz indukce
omezená kvantiﬁkace, 88, 309
omezená minimalizace, 90
OR, 88, 100, 105, 364
ordinální rekurze, viz rekurze
otevřená množina, 25
px, p(x), 91
P, 114–116, 122, 125, 127, 130
P-kompletní úloha, 131, 133
PA−
, 289
PA, 275, 276, 292
PA-Taut či N-Taut (viz též formule
PA-platná či N-platná), 418,
430, 433
Papadimitriou, 127
paradox lháře, 348
Paris, 307, 351
párovací funkce, 293
Pavelka, 52, 413
perzistence, 368, 427
Piercova šipka, 21
písmo
bezpatkové, 172, 243, 332
strojopisné, 51, 333, 343
počítač RASP, 52
podgraf, 24
podmíněné odčítání, viz ·−
podmínka EVC, 183
podmínkové bity, 54–56, 59, 62, 63, 67
podmínky BHK, 366
podmínky D1–D3, 336, 349, 356, 362,
416
podmínky pro dokazatelnost, viz
podmínky D1–D3
podmínky T1 až T9 (viz též Tarského
deﬁnice), 143, 284, 324, 385,
406
podstruktura, 156
n-elementární či elementární, 218,
346
podteorie, 228, 310
polynom, 178, 241–243, 290
polynomiální čas, 114
polynomiální prostor, 115
polynomiální simulovatelnost, viz
simulovatelnost
Post, 395
potenční množina, 25
Prτ (. .), Proofτ (. .), 300, 304, 418, 443
PR, 88, 131, 313, 346
pravdivostní funkce, 396, 399
pravdivostní hodnota (formule ve fuzzy
struktuře), 406, 407
Pravdivostní hodnota výrokové
formule, 72, 74, 75, 79, 94,
115, 123, 134
pravdivostní hodnoty, 14, 365, 395, 399
pravdivostní ohodnocení, 14, 418
pravdivostní relace (kripkovského
modelu), 368, 426
pravdivostní tabulky log. spojek, 14
pravidlo, 289
autoreference, 422, 432
generalizace, viz generalizace
kritické, 376, 424
kvantiﬁkátorové, 183
Löbovo, viz Löbův axiom či
pravidlo
oslabení, 42
řezu, viz řez
se sdíleným kontextem, 379
(silně) korektní, 29, 35, 37, 38, 376
speciﬁkace, 183
strukturální, 43, 183
výrokové, 43, 183
pravidlo modus ponens, viz modus
ponens
premisa, 14
prenexní formule či normální tvar, 150,
204, 218, 219, 387
prenexní operace, 152, 365
Presburger, 254
460 Rejstřík
princip nejmenšího prvku, viz LNP
princip vyloučeného třetího, viz tertium
non datur
Problém zastavení, 80, 100, 115
program, 328
nedeterministický, 122
počítající funkci, 65
pracující v čase, 66, 114
pracující v prostoru, 68
projekce, 100
proměnná, 73, 300
ProofT (. .), 259
prostorové třídy (úloh a funkcí), 115
protipříklad, 184
kripkovský, 370, 385
Prvočíselnost, 49, 50, 79, 82, 90
prvočísla, 91, 281, 284, 287, 291, 314,
317, 320, 358
přejmenování vázané proměnné, 152
převeditelnost, 102, 127
přidání jalové proměnné, 87
přirozená čísla, 36, 257, 352
přirozená deﬁnice (π nebo zf), 304, 344,
351, 353
PSPACE, 115, 122, 125, 127, 130, 374,
380, 430, 431
PSPACE-kompletní úloha, 131, 136,
381, 394, 433, 434
Pudlák, 37, 199, 289, 307, 351
Q, Q, 142, 219, 226, 241, 256, 286
Q, 275, 276, 292
Q1–Q9, 172, 266, 276, 278, 283, 289,
345, 352, 353
QBF, 76, 77, 79, 82, 95, 115, 122, 128,
131, 136, 381, 433
R, R, 142, 213, 219, 239, 241, 254, 256,
258
R1–R16, 179, 240, 241, 243, 256
Rabin, 240
rámec (kripkovský), 368, 383, 426
Ramseyova věta, 352
random access, RASP, RAM, 53, 62
RCF, 241–243, 246, 252–254, 258, 263
realizace (symbolů), 140
Rec, 105
redukt, 208, 220, 226, 258, 291
Ref(. .), 161
rekurze, 83, 142, 263, 381
ordinální, 12, 23, 39, 267
primitivní, 83, 84, 86, 87, 112, 272,
292, 314, 337
zobecněná primitivní (ordinální),
93, 102, 260
rekurzívní volání (podprogramu), 69,
75, 76, 259, 374
relace dosažitelnosti, 368, 426
relativní bezespornost, 268
reziduum, 397
rezoluce, 134
Rng, 83
Rolleova věta, 244
Rose, 395
Rosser, 110, 329, 330, 395
rovnice, 347, 355, 364, 434–436, 438
rovnítko, 138, 140, 166, 169
rozšíření struktury, 156, 217, 222, 223
rozšíření teorie, 161, 162, 228, 230, 272
konzervativní, 228, 246, 254
RS, 88, 100, 313
Ryll-Nardzewski, 356
řetěz (elementární), 221, 227
řez (jako podmnožina struktury), 321
řez (pravidlo řezu), 43, 182, 425
řezy podstatné a nepodstatné, 203
S, 139, 141, 144, 152, 230, 276
s-podformule, 190, 343, 344
2Sat, 116, 129, 131, 132, 134, 135
3Sat, 116, 128, 129, 131, 135, 136
Sat, 15, 72, 76, 79, 95, 114–116, 119,
122–125, 128, 129, 131, 133,
403
Satn(. .), Trn(. .), 342, 344, 347, 349, 364
Savický, 19
Savitchova věta, 127
Rejstřík 461
Scott, 395
segment, 321
sekvent, 40, 343, 370, 371, 424
ﬁnální, 41
iniciální, 41
intuicionisticky logicky platný, 385,
389
intuicionisticky tautologický, 370
logicky platný, 184, 389
platný ve struktuře, 184
regulární, 191
tautologický, 44, 48, 204
uzavřený, 372
sémantika (n-hodnotová či konečná),
404
sentence, 139, 159, 160, 162, 211, 234,
260, 324
nezávislá, 211, 327
Seq, 92, 294
Sgall, 13
sgn(. .), 245
Shoenﬁeld, 293
schéma, 30, 262
schéma kolekce, 310
schéma reﬂexe, 424, 441
schéma vydělení, 296
simulovatelnost (polynomiální) kalkulů,
46–48, 185, 343, 388, 425, 444
Skolemův paradox, 176, 353
sled, 118, 208
Smory´nski, 275, 330, 417, 430
smyčka (v grafu), 118
sněží-sněží, viz dekvotační schéma
Solovay, 430, 438, 439
SPACE(f), 115
spojka ekvivalence, viz ≡
spor, 32, 304, 367
SSy(. .), 358, 364
standardní a nestandardní prvky
(modelu), 286
standardní (Scottova) množina, viz
množina
Statman, 381
strom, 31, 118, 369
struktura, 140, 152, 272, 337, 383, 405
deﬁnovatelná ve struktuře, 269
kripkovská, 383
rozhodnutelná a nerozhodnutelná,
258
struktury elementárně
ekvivalentní, 211, 226, 255
struktura (fuzzy), 405
bezpečná, 407
Sturmova věta, 244
substituce
formulí, 20, 37, 157, 420
termů do formulí nebo termů, 145,
181, 261, 302, 305, 333
substituce (jako operace s funkcemi),
84, 112, 135, 272, 315
SUCC, 170, 212, 214, 224, 233, 255, 258,
266, 267, 269, 270, 273, 276,
289
supremum, 225, 256, 406
svědek, 101, 110, 329–331, 443
svět matematiky, 175, 318
symboly
funkční, 137, 297, 299
logické a mimologické, 138
predikátové (relační), 137
t-norma, 413
T1 až T9, viz podmínky T1 až T9
tabulka ASCII, 58
tabulková metoda, 16, 28, 113, 114, 116
Takeuti, 47
Tarského deﬁnice, 143, 206, 338, 365,
406
Tarského-Vaughtova podmínka, 346
Tarski, 240, 254, 348
Taut, 15, 72, 76, 77, 79, 95, 114, 115,
119, 122, 128, 131, 371, 380,
403
tautologický důsledek, viz důsledek
v klasické výrokové logice
v predikátové logice, 158, 165
tautologie, 15, 28, 113, 153, 162, 165,
187, 371, 394, 420
462 Rejstřík
intuicionistická, viz intuicionistická
v predikátové logice, 157
[[0, 1]]G-tautologie, 397
těleso, 179, 182, 224
teorie, 139, 140, 160, 216, 257, 275, 419
κ-kategorická, 213, 226
Σ-korektní, 326, 328, 330, 350, 356
abelovských grup, 224, 235
celočíselného sčítání, 235
diskrétního uspořádání, viz DO
grup, 139
hustého lineárního . . . , viz DNO
interpretovatelná v jiné teorii, 267,
270, 353, 357, 363
komutativních těles, 176, 235, 240,
243
konečně axiomatizovatelná, 175,
224, 262, 270, 272, 275, 289,
320, 347, 356
konzistentní, viz bezesporná
korektní, 326
množin, 139, 175, 275, 292, 307,
318
následníka, viz SUCC
neostrého lineárního uspořádání,
173
obsahující jinou teorii, 310, 326
ostrého lineárního uspořádání, viz
LO
ostrého uspořádání, 160
podstatně nerozhodnutelná, 330
připouštějící eliminaci
kvantiﬁkátorů, 228, 254
reálně uzavřených těles, viz RCF
rekurzívně axiomatizovatelná, 262,
274, 318, 326, 327, 351
relativně bezesporná vůči jiné
teorii, 268
rozhodnutelná a nerozhodnutelná,
258, 264, 272, 288, 327, 328
sporná a bezesporná, 161, 306, 328
struktury, 174
úplná, 211, 215, 228, 272, 288, 318,
327, 328
uspořádaných těles, 240, 241
teorie důkazů, 354
teorie nad logikou G nebo G∀, 398, 408
bezesporná, 409
henkinovská, 409
úplná, 400, 409
term, 138, 230, 260, 300
substituovatelný za proměnnou,
145
uzavřený, 139
tertium non datur, 17, 367
Th(. .), 174, 210, 211
Thm(. .), 161
Thmn(. .), 220
Tichonovova věta, 12, 24
TIME(f), 114
topologie, 12, 25, 28, 393
Tot, 108
třída (struktur), 175
axiomatizovatelná (elementární),
206, 272
konečně axiomatizovatelná, 223
třída (úloh nebo funkcí), 114
Turingův predikát, 99
Turingův stroj, 81, 97
úloha, 50, 257, 380
Γ-těžká, 380
algoritmicky počitatelná, 51
kompletní vůči logaritmickým
převodům, viz množina
počitatelná v čase, 66
počitatelná v prostoru, 68
přijímatelná, 80, 81, 98, 100, 124
rozhodnutelná, 79, 81, 98, 100, 371
rozhodnutelná v čase či prostoru,
79
rozhodnutelná v polynomiálním
čase, 115
rozhodovací, 79
ultraprodukt, 223
Unb, 105, 113
univerzální uzávěr, 161, 186, 302
úplná aritmetika, 283
Rejstřík 463
úplnost, silná úplnost, 34, 37–39, 45,
161, 162, 168, 206, 210, 271,
324, 377, 387, 390, 394, 409,
411, 430, 431
uspořádaná množina, 25, 225
uzavřená množina, 25
uzel (grafu), viz vrchol
Var, 138, 142, 260
Vaught, 346
věta
Bezoutova, 283
Craigova (Craigův trik), 262
Craigova o interpolaci, viz
interpolace
Druhá Gödelova (viz též Gödelovy
věty), 12, 336, 350, 351, 352,
416, 419, 422, 444, 446
Hilbertova-Ackermannova, 199, 217
Löbova, 415, 434, 435, 438, 444
Lo´sova-Tarského, 221
Löwenheimova-Skolemova, 169,
210, 285, 288
o Σ-úplnosti, 324
o autoreferenci, 348, 361
o dedukci, 31, 38, 39, 159, 306,
398, 409, 420
o eliminovatelnosti řezů (viz též
eliminovatelnost řezů), 46, 199
o formalizované Σ-úplnosti, 332,
336
o kompaktnosti (viz též
kompaktnost), 22, 206
o normální formě, 98
o parametrech, 107
o projekci, 99
o reprezentovatelnosti funkcí
v Robinsonově aritmetice, 331
o střední hodnotě, 244
o středním sekventu, 204
o úplnosti kalkulu pro logiku G
nebo G∀, 402, 411
o úplnosti kalkulu GJ, 377
o úplnosti kalkulu GK, 44, 185
o úplnosti kalkulu HK, 34, 161
o úplnosti kalkulu HKe, 168
Postova, 100, 113, 132, 263, 327,
330, 360, 362
První Gödelova (viz též Gödelovy
věty), 318, 327, 349, 352, 415,
419, 422, 425, 444
Robinsonova o bezespornosti, 205,
226
Rosserova, 329, 352, 355, 436, 438
s-n-m, viz věta o parametrech
Tarského o nedeﬁnovatelnosti
pravdy, 349
Tennenbaumova, 360
Vaughtova, 215
větvení, 90
vícehodnotová sémantika (viz též
sémantika), 38
Visser, 269, 365, 443
Vlasáková, 284
vlastnost konečných modelů, viz FMP
vnoření, 217
n-elementární či elementární, 218,
226, 265, 273
volný (vázaný) výskyt proměnné, 139,
261, 302
Vopěnka, 175
vrchol (grafu), 31, 118
vstup programu, 65
vstupní páska, 58
vyplývání (viz též důsledek), 9
výpočet programu, 68, 97, 121, 123, 124
výpočtový model, 51, 81, 83, 90, 97
výrokový atom, viz atom
výstup programu, 65
výstupní páska, 58
vývojový diagram, 97
weakening rule, 42
Wilkie, 254, 307, 351
Z, Z, 142, 213, 236, 254, 256, 258, 265,
286
Zadeh, 396
464 Rejstřík
zákon sporu, 17
zásobník, 57
závěr (implikace), 14
Zermelova-Fraenkelova teorie množin,
viz ZF
ZF, 175, 176, 210, 262, 267, 268, 270,
292, 353, 419
ztotožnění proměnných, 87
Nakladatelství Academia Vás zve do tří svých exkluzivních knihkupectví s literární kavárnou a
galerií — mají otevřeno 7 dní v týdnu a nabízejí největší výběr kvalitní literatury v centru Prahy,
Brna a Ostravy:
• Václavské nám. 34, 110 00 Praha 1, tel. 224 223 511–13,
e-mail knihy.vaclavskenam@academia.cz,
• Náměstí Svobody 13, 602 00 Brno, tel. 542 217 954–56, e-mail knihy.brno@academia.cz,
• Zámecká 2, 702 00 Ostrava, tel. 596 114 578, 580, e-mail knihy.ostrava@academia.cz.
Další knihkupectví Academia:
• Národní třída 7, 110 00 Praha 1, tel. 224 240 547, e-mail: knihy.narodni@academia.cz,
• Na Florenci 3, 110 00 Praha 1 tel. 224 814 621, e-mail knihy.naﬂorenci@academia.cz.
Knihy z nakladatelství Academia si můžete objednat na adrese:
ACADEMIA — expedice
Rozvojová 135, 165 02 Praha 6
tel. 296 780 510
e-mail expedice@academia.cz
www.academia.cz
RNDr. VÍTĚZSLAV ŠVEJDAR, CSc.
LOGIKA
neúplnost, složitost a nutnost
Vydala Academia
nakladatelství Akademie věd České republiky
Legerova 61, 120 00 Praha 2
s podporou Akademie věd České republiky
Jazyková revize: doc. RNDr. Vladimír Petkevič, CSc.
Graﬁcká úprava a sazba systémem LATEX: autor
Návrh obálky: Robin Brichta
Redaktorka publikace: Ing. Jitka Zykánová
Vydání 1., Praha 2002
Ediční číslo 1571
Tisk SERIFA, s. r. o., Jinonická 80, Praha 5
ISBN 80-200-1005-X