Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze PLIN037 Sémantika a počítače Zuzana Nevěřilová xpopelk@fi.muni.cz Centrum zpracování přirozeného jazyka, B203 Fakulta informatiky, Masarykova univerzita 7. března 2019 Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Co studuje sémantika? • sémantické relace: synonymie, antonymie, hyperonymie, meronymie . . . • taxonomické a kolektivní nadřazené koncepty • vyplývání, kontradikce, parafráze • vágnost – slovo může být užito v různých kontextech • víceznačnost – slovo má víc významů (a různé gramatické vlastnosti) • prototypy • konotace – „subtilní aspekty významu“ • kolokace, ustálená slovní spojení Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Význam, kontext a logická forma Syntaktická analýza S NP PRON já VP V jsem V vypnula NP PRON ten NP počítač Logická forma VYPNOUT(, ) Finální reprezentace znalostí vypnout("Zuzana", "Lenovo č. 123456") Význam, kontext a logická forma Syntaktická analýza S NP PRON já VP V jsem V vypnula NP PRON ten NP počítač Logická forma VYPNOUT(, ) Finální reprezentace znalostí vypnout("Zuzana", "Lenovo č. 123456") 2019-03-07 PLIN037 Sémantika a počítače Logická forma Význam, kontext a logická forma Jednou z možností, jak popsat význam věty genericky, bez ohledu na kontext, je její logická forma. Na jedné straně se zdá, že nemůžeme význam popsat bez znalosti kontextu. Často nám stačí jen „jazykový“ kontext, situační nepotřebujeme, abychom větě rozuměli. Kdyby tato možnost vůbec neexistovala (a byli bychom odkázáni vždy jen na kontext), měly by věty jako Já jsem vypnula ten počítač. smysl, jen pokud bychom věděli, o jakém počítači mluvíme. Pokud tedy vezmeme za své, že věta Já jsem vypnula ten počítač. má nějaký smysl bez ohledu na situaci, můžeme si dovolit mluvit o její logické formě. Větě také rozumíme proto, že víme něco o světě a máme nějakou představu, co znamená vypnout a počítač. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma Syntaktická analýza Logická forma Finální reprezentace znalostí Sémantická interpretace Kontextuální interpretace (komunikační situace) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma predikátová logika prvního řádu: • (n-ární) predikát P(x): pro objekt reprezentovaný proměnnou x platí P být_doma(pepa): Pepa je doma. • operátory: ∨, ∧, ¬ ¬ být_doma(pepa): Pepa není doma. • implikace ⇒ ¬ pršet() ⇒ ¬zmoknout(x) Nebude-li pršet, nezmoknem. • kvantifikátory: ∃, ∀ ∃x : být_doma(x): Někdo je doma. ∀x : ¬ být_doma(x): Nikdo není doma. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu • sloveso je predikát (koupit) • vlastnost je predikát (koupený) • jedinec je proměnná (Alík) • třída je proměnná (pes) • operátory (a, nebo, ale) • kvantifikátory (všichni, nikdo, někdo, některý) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Cvičení: 1. Petr i Linda bydlí v Brně. (bydlet(x,y)) 2. Někteří studenti na seminář nepřišli. (přijít(x,y)) 3. Někdo má rád holky, jiný zase vdolky. (mít_rád(x,y)) 4. Někdo přišel, ale někdo ne. 5. Oslovil jsem ji, protože se mi líbila. (oslovit(x,y), líbit(x,y)) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Možná řešení: 1. Petr i Linda bydlí v Brně. (bydlet(x,y)) bydlet(Petr, Brno) ∧ bydlet(Linda, Brno) 2. Někteří studenti na seminář nepřišli. (přijít(x,y)) ∃student : ¬přijít(student, seminář) 3. Někdo má rád holky, jiný zase vdolky. (mít_rád(x,y)) ∃x1 :rád(x1, holka) ∧ ∃x2 :rád(x2, vdolek) 4. Někdo přišel, ale někdo ne. ∃x1 :přijít(x1, y) ∧ ∃x2 : ¬přijít(x2, y) 5. Oslovil jsem ji, protože se mi líbila. (oslovit(x,y), líbit(x,y)) líbit(x, y) ⇒ oslovit(x, y) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: víceznačnost přirozeného jazyka Každý kluk vlastní mobil. ∃m∀k : vlastnit(k, m) ∀k∃m : vlastnit(k, m) Každou hodinu zemře jeden Američan na rakovinu. ∀h∃a : zemřít(a, h) ∃a∀h : zemřít(a, h) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: spojky a logické spojky • „a“ není vždy ∧ (Honza kopl a balón přistál v brance.) • „ale“ je ∧ (Někdo přišel na seminář, ale ne všichni.) • „nebo“ není vždy ∨: Bydlím buď v Praze, nebo v Brně. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: nedostatek kvantifikátorů všichni, nikdo, každý: ∀ někdo, aspoň jeden, některý: ∃ pár, málo, hodně, skoro všichni, většina, . . . neuvedené kvantifikátory: lidé = všichni lidé? Někdo má rád všechny holky, jiný má rád všechny vdolky. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: negace a kvantifikátory Všichni kluci brečí. ∀k :brečet(k) Někteří kluci brečí. ∃k :brečet(k) Žádní kluci nebrečí. ¬∃k :brečet(k) Ne všichni kluci brečí. ¬∀k :brečet(k) Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: ne všechny části věty mají ekvivalent v PL1 nejen, v podstatě, mimochodem . . . přací věty, rozkazovací věty Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: logická forma neodráží realitu (není potřeba znalost světa) K obědu bude jízdní kolo s kusem betonu. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Převod věty na logickou formu Problém: ne všechny věty jsou prvního řádu Lhát se nemá. Slovo myš je jednoslabičné. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a spojky P1 = Sam pracuje. P2 = Sam vydělává peníze. • Sam pracuje a vydělává peníze. • Sam pracuje, aby vydělal peníze. • Sam pracuje, a tím vydělává peníze. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logické formule a řády P1 = Sam pracuje. • Max řekl, že Sam pracuje. • Ida slyšela, jak Max řekl, že Sam pracuje. • Majka chtěla, aby Ida slyšela, jak Max řekl, že Sam pracuje. • . . . Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma: typovaný formalismus milovat(x (jednotlivec), y (jednotlivec)) bydlet(x (jednotlivec), y (místo)) bydlet(Praha, teta) Logická forma: typovaný formalismus milovat(x (jednotlivec), y (jednotlivec)) bydlet(x (jednotlivec), y (místo)) bydlet(Praha, teta) 2019-03-07 PLIN037 Sémantika a počítače Typovaný formalismus Logická forma: typovaný formalismus Jeden z typovaných formalismů je transparentní intenzionální logika (TIL). Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Logická forma: sloveso jako predikát na sloveso je možné pohlížet jako na n-ární predikát (milovat(x,y), bydlet(x,y), smát_se(x), . . . ) také na vlastnosti je možné pohlížet jako na predikáty (být_modrý(x), . . . ) valenční slovníky: Vallex, VerbaLex Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Parafráze (1) Wonderworks Ltd. constructed the new bridge. (2) The new bridge was constructed by Wonderworks Ltd. (3) Wonderworks Ltd. is the constructor of the new bridge. Příklad z [Androutsopoulos and Malakasiotis, 2009] Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Parafráze “approximate conceptual equivalence among outwardly different material.” Beaugrande and Dressler (1981, page 50) in [Bhagat and Hovy, 2013] sémantická ekvivalence, ale pragmatické rozdíly Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Hranice parafráze (1) Wonderworks Ltd. constructed the new bridge. (2) The new bridge was constructed by Wonderworks Ltd. (3) Wonderworks Ltd. is the constructor of the new bridge. Příklad z [Androutsopoulos and Malakasiotis, 2009] Hranice parafráze (1) Wonderworks Ltd. constructed the new bridge. (2) The new bridge was constructed by Wonderworks Ltd. (3) Wonderworks Ltd. is the constructor of the new bridge. Příklad z [Androutsopoulos and Malakasiotis, 2009] 2019-03-07 PLIN037 Sémantika a počítače Parafráze Hranice parafráze Pohlížet na parafráze optikou logické formy (tj. parafráze jsou věty, jejichž logická forma je ekvivalentní) je příliš přísné. Srovnej s definicí plné synonymie, o které řada odborníků tvrdí, že neexistuje (kdyby existovala, bylo by jedno ze slov zbytečné a přestalo by se používat). Lidé vyhodnotí jako parafráze věty, které tvrdí podobnou věc, nevíme ale, jak moc tvrzení mohou být rozdílná, aby se o nich stále dalo mluvit jako o parafrázích. Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Cvičení najděte 20 dvojic parafrází: • ve vlastních textech • v novinových článcích • v překladech • v testech čtenářských dovedností Logická forma Typovaný formalismus Slovesné a jiné valence Parafráze Allen, J. (1995). Natural Language Understanding (2nd ed.). Benjamin-Cummings Publishing Co., Inc., Redwood City, CA, USA. Androutsopoulos, I. and Malakasiotis, P. (2009). A survey of paraphrasing and textual entailment methods. CoRR, abs/0912.3747. Bhagat, R. and Hovy, E. (2013). What is a paraphrase? Computational Linguistics, 39(3):463–472.