Logická forma Typovaný formalismus Slovesné a jiné valence PLIN037 Sémantika a počítače OP VK Mezi bohemistikou a informatikou www. p roj e kt- i n o va. cz Zuzana Nevěřilová xpopelkOfi.muni.cz Centrum zpracování přirozeného jazyka, B203 Fakulta informatiky, Masarykova univerzita 5. března 2014 Logická forma Typovaný formalismus Slovesné a jiné valence PLIN037 Sémantika a počítače Předmět PLIN037 Sémantika a počítače je podpořen projektem OP VK Mezi bohemistikou a informatikou. Inovace vysokoškolské výuky češtiny v kontextu počítačového zpracování přirozeného jazyka (INOVA.CZ). www. p roj e kt- i n o va. cz 1*HJL Ů (i) 1 fond V ČR EVROPSKÁ UNIE MLÁDEŽE A TĚLOVÝCHOVY ' pro konhur«ic«cl»pna>t 4jř4JVA INVESTICE DO ROZVOJE VZDĚLÁVÁNI Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma Typovaný formalismus Slovesné a jiné valence Co studuje sémantika? • sémantické relace: synonymie, antonymie, hyperonymie, meronymie ... • taxonomické a kolektivní nadřazené koncepty • vyplývání, kontradikce, parafráze • vágnost - slovo může být užito v různých kontextech • víceznačnost - slovo má víc významů (a různé gramatické vlastnosti) • prototypy • konotace - „subtilní aspekty významu" • kolokace, ustálená slovní spojení Logická forma Typovaný formalismus Slovesné a jiné valence Význam, kontext a logická forma NP PRON VP NP /\ /\ V V PRON NP Syntaktická analýza já jsemvypnula ten počítač Logická forma Typovaný formalismus Význam, kontext a logická forma Slovesné a jiné valence NP VP NP I /\ /\ PRON V V PRON NP Syntaktická analýza Logická forma já jsemvypnula ten počítač VYPNOUT(, ) Logická forma Typovaný formalismus Význam, kontext a logická forma Slovesné a jiné valence NP VP NP I /\ /\ PRON V V PRON NP c . i .. i , já jsemvypnula ten počítač byntakticka analýza J Logická forma VYPNOUT(, ) Finální reprezentace znalostí vypnout("Zuzana", "Lenovoč. 123456") Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma Syntaktická analýza Sémantická interpretace Logická forma Kontextuální interpretace (komunikační situace) Finální reprezentace znalostí Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma predikátová logika prvního řádu: • (n-ární) predikát P(x): pro objekt reprezentovaný proměnnou x platí P býtdoma(pepa): Pepa je doma. • operátory: V, A, -> -i býtdoma(pepa): Pepa není doma. • implikace -i pršetQ =4> -izmoknout(x) Nebude-li pršet, nezmoknem. • kvantifikátory: 3, V 3x : býtdoma(x): Někdo je doma. Vx : -i býtdoma(x): Nikdo není doma. Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu • sloveso je predikát • vlastnost je predikát • jedinec je proměnná • třída je proměnná • operátory: a, nebo, ale ... • kvantifikátory: všichni, nikdo, někdo, některý ... Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Cvičení: 1. Petr i Linda bydlí v Brně. (bydlet(x,y)) 2. Někteří studenti na seminář nepřišli. (přijít(x,y)) 3. Někdo má rád holky, jiný zase vdolky. (mít_rád(x,y)) 4. Někdo přišel, ale někdo ne. 5. Oslovil jsem ji, protože se mi líbila. (oslovit(x,y), líbit(x,y)) Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Řešení: 1. Petr i Linda bydlí v Brně. (bydlet(x,y)) bydlet(Petr, Brno) A bydlet(Linda, Brno) 2. Někteří studenti na seminář nepřišli. (přijít(x,y)) Bstudent : -^přijít(student, seminář) 3. Někdo má rád holky, jiný zase vdolky. (mít_rád(x,y)) 3xi :rád(xi, holka) A 3x2 :rád(x2, vdolek) 4. Někdo přišel, ale někdo ne. 3xi ■přijít(x1,y) A 3x2 : ->přijít(x2,y) 5. Oslovil jsem ji, protože se mi líbila. (oslovit(x,y), líbit(x,y)) líbit(x,y) oslovit(x,y) Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Problém: víceznačnost přirozeného jazyka Každý kluk vlastní mobil. 3m\/k : vlastnit(k, m) \/k3m : vlastnit(k, m) Každou hodinu zemře jeden Američan na rakovinu. \/h3a : zemřít(a, h) 3aV/j : zemřít(a, h) Logická forma Typovaný formalismus Převod věty na logickou formu Slovesné a jiné valence Problém: spojky a logické spojky • „a" není vždy A (Honza kopl a balón přistál v brance.) • „ale" je A (Někdo přišel na seminář, ale ne všichni.) • „nebo" není vždy V: Bydlím buď v Praze, nebo v Brně. Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Problém: nedostatek kvantifikátorů všichni, nikdo, každý: V někdo, aspoň jeden, některý: 3 pár, málo, hodně, skoro všichni, většina, ... neuvedené kvantifikátory: lidé = všichni lidé? Někdo má rád všechny holky, jiný má rád všechny vdolky. Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Problém: negace a kvantifikátory Všichni kluci brečí. V/c :brečet(k) Někteří kluci brečí. 3k :brečet(k) Zádní kluci nebrečí. -d/c :brečet(k) Ne všichni kluci brečí. -■V/c :brečet(k) Logická forma Typovaný formalismus Převod věty na logickou formu Slovesné a jiné valence Problém: ne všechny části věty mají ekvivalent v PL1 nejen, v podstatě, mimochodem ... prací věty, rozkazovací věty Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Problém: logická forma neodráží realitu K obědu bude jízdní kolo s kusem betonu. Logická forma Typovaný formalismus Převod věty na logickou formu Slovesné a jiné valence Problém: ne všechny věty jsou prvního řádu Lhát se nemá. Slovo myš je jednoslabičné. Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma: typovaný formalismus milovat(x (jednotlivec), y (jednotlivec)) bydlet(x (jednotlivec), y (místo)) bydlet(Praha, teta) Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma: sloveso jako predikát na sloveso je možné pohlížet jako na n-ární predikát (milovat(x,y), bydlet(x,y), smátse(x), ...) také na vlastnosti je možné pohlížet jako na predikáty (býtmodrý(x), ...) valenční slovníky: Vallex, VerbaLex Logická forma Typovaný formalismus Slovesné a jiné valence 1 Allen, J. (1995). Natural Language Understanding (2nd ed.). Benjamin-Cummings Publishing Co., Inc., Redwood City, CA, USA.