Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze PLIN037 Sémantika a počítače OP VK Mezi bohemistikou a informatikou www.projekt-inova.cz Zuzana Nevěřilová xpopelk@f i.muni.cz Centrum zpracování přirozeného jazyka, B203 Fakulta informatiky, Masarykova univerzita 5. března 2015 Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Co studuje sémantika? • sémantické relace: synonymie, antonymie, hyperonymie, meronymie . .. • taxonomické a kolektivní nadřazené koncepty • vyplývání, kontradikce, parafráze • vágnost - slovo může být užito v různých kontextech • víceznačnost - slovo má víc významů (a různé gramatické vlastnosti) • prototypy konotace - „subtilní aspekty významu" • kolokace, ustálená slovní spojení Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Význam, kontext a logická forma NP VP NP I /\ /\ PRON V V PRON NP Syntaktická analýza ja jsemvypnula ten počítač Logická forma Typovaný formalismus Slovesné a jiné valence Význam, kontext a logická forma Parafráze NP VP NP I /\ /\ PRON V V PRON NP Syntaktická analýza Logická forma ja jsemvypnula ten počítač VYPNOUT(, ) Logická forma Typovaný formalismus Slovesné a jiné valence Význam, kontext a logická forma NP VP NP I /\ /\ PRON V V PRON NP r ^ i ^ i ' ľ iá jsemvypnula ten počítač Syntaktická analýza J Jr r Logická forma VYPNOUT(, ) Finální reprezentace znalostí vypnout(" Zuzana" , "Lenovo č. 123456") Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma Syntaktická analýza Sémantická interpretace Logická forma Kontextuální interpretace (komunikační situace) Finální reprezentace znalostí Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma predikátová logika prvního řádu: (n-ární) predikát P(x): pro objekt reprezentovaný proměnnou x platí P býťdoma(pepa): Pepa je doma. • operátory: V, A, -> -i býťdoma(pepa): Pepa není doma. • implikace =4> -i pršet() =4> -izmoknout(x) Nebude-li pršet, nezmoknem. • kvantifikátory: 3, V 3x : býťdoma(x): Někdo je doma. Vx : -i býťdoma(x): Nikdo není doma. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu • sloveso je predikát • vlastnost je predikát • jedinec je proměnná • třída je proměnná • operátory: a, nebo, ale ... • kvantifikátory: všichni, nikdo, někdo, některý ... Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Cvičení: 1. Petr i Linda bydlí v Brně. (bydlet(x,y)) 2. Někteří studenti na seminář nepřišli. (přijít(x,y)) 3. Někdo má rád holky, jiný zase vdolky. (míťrád(x,y)) 4. Někdo přišel, ale někdo ne. 5. Oslovil jsem ji, protože se mi líbila. (oslovit(x,y), líbit(x,y)) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Řešení: 1. Petr i Linda bydlí v Brně. (bydlet(x,y)) bydlet(Petr, Brno) A bydlet(Linda, Brno) 2. Někteří studenti na seminář nepřišli. (přijít(x,y)) Bstudent : -přijít(x2, y) 5. Oslovil jsem ji, protože se mi líbila. (oslovit(x,y), líbit(x.y)) líbit(x,y) =5- oslovit(x, y) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: víceznačnost přirozeného jazyka Každý kluk vlastní mobil. 3m\/k : vlastnit(k, m) \/k3m : vlastnit(k, m) Každou hodinu zemře jeden Američan na rakovinu. \/h3a : zemřít(a, h) 3a\/h : zemřít(a, h) Logická forma Typovaný formalismus Převod věty na logickou formu Slovesné a jiné valence Problém: spojky a logické spojky • ,,a" není vždy A (Honza kopl a balón přistál v brance.) • „ale" je A (Někdo přišel na seminář, ale ne všichni.) • „nebo" není vždy V: Bydlím bud' v Praze, nebo v Brně. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: nedostatek kvantifikátorů všichni, nikdo, každý: V někdo, aspoň jeden, některý: El pár, málo, hodně, skoro všichni, většina, ... neuvedené kvantifikátory: lidé = všichni lidé? Někdo má rád všechny holky, jiný má rád všechny vdolky. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: negace a kvantifikátory Všichni kluci brečí. V/c :brečet(k) Někteří kluci brečí. 3k :brečet(k) Žádní kluci nebrečí, -d/c :brečet(k) Ne všichni kluci brečí. -■V/c :brečet(k) Logická forma Typovaný formalismus Převod věty na logickou formu Slovesné a jiné valence Parafráze Problém: ne všechny části věty mají ekvivalent v PL1 nejen, v podstatě, mimochodem . .. prací věty, rozkazovací věty Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Problém: logická forma neodráží realitu K obědu bude jízdní kolo s kusem betonu. Logická forma Typovaný formalismus Slovesné a jiné valence Převod věty na logickou formu Problém: ne všechny věty jsou prvního řádu Lhát se nemá. Slovo myš je jednoslabičné. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a spojky Pl = Sam pracuje. P2 = Sam vydělává peníze. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a spojky PI = Sam pracuje. P2 = Sam vydělává peníze. • Sam pracuje a vydělává peníze. • Sam pracuje, aby vydělal peníze. • Sam pracuje, a tím vydělává peníze. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a řády PI = Sam pracuje. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a řády Pl = Sam pracuje. • Max řekl, že Sam pracuje. • Ida slyšela, jak Max řekl, že Sam pracuje. • Majka chtěla, aby Ida slyšela, jak Max řekl, že Sam pracuje. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a jejich relativizace PI = Sam pozoruje kočku. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a jejich relativizace Pl = Sam pozoruje kočku. • Sam pozoruje kočku, která honí myš. • Sam pozoruje kočku, která honí myš, která snědla chleba. • Sam pozoruje kočku, která honí myš, která snědla chleba, který zbyl od včerejška. • ... Logická forma Typovaný formalismus Slovesné a jiné valence Logická forma: typovaný formalismus milovat(x (jednotlivec), y (jednotlivec)) bydlet(x (jednotlivec), y (místo)) bydlet(Praha, teta) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma: sloveso jako predikát na sloveso je možné pohlížet jako na n-ární predikát (milovat(x,y), bydlet(x,y), smáťse(x), ...) také na vlastnosti je možné pohlížet jako na predikáty (býťmodrý(x), . ..) valenční slovníky: Vallex, VerbaLex Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Parafráze (1) Wonderworks Ltd. constructed the new bridge. (2) The new bridge was constructed by Wonderworks Ltd. (3) Wonderworks Ltd. is the constructor of the new bridge. Příklad z [Androutsopoulos and Malakasiotis, 2009] Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Parafráze "approximate conceptual equivalence among outwardly different material." Beaugrande and Dressier (1981, page 50) in [Bhagat and Hovy, 2013] sémantická ekvivalence, ale pragmatické rozdíly Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Hranice parafráze (1) Wonderworks Ltd. constructed the new bridge. (2) The new bridge was constructed by Wonderworks Ltd. (3) Wonderworks Ltd. is the constructor of the new bridge. Příklad z [Androutsopoulos and Malakasiotis, 2009] Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Cvičení najděte 20 dvojic parafrází: • ve vlastních textech v novinových článcích • v překladech • v testech čtenářských dovedností • v titulkovaných pořadech Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze i Allen, J. (1995). Natural Language Understanding (2nd ed.). Benjamin-Cummings Publishing Co., Inc., Redwood City, CA, USA. [5 Androutsopoulos, I. and Malakasiotis, P. (2009). A survey of paraphrasing and textual entailment methods. CoRR, abs/0912.3747. 1 Bhagat, R. and Hovy, E. (2013). What is a paraphrase? Computational Linguistics, 39(3):463-472.