PLIN041 Vývoj počítačové lingvistiky Kybernetika Strojová lingvistika Mgr. Dana Hlaváčková, Ph.D. Norbert Wiener • 1894–1964, americký matematik a filozof, zakladatel kybernetiky • Cybernetics or the Control and Communication in the Animal and the Machine, 1948 (Kybernetika aneb Řízení a sdělování u organismů a strojů) • v 11 letech začal studovat na vysoké škole matematiku, v 15 letech bc. titul, vystudoval filozofii, ale disertace (v 17 letech) souvisela s matematickou logikou, Harvard (zoologie), Cambridge • učil filozofii na Harvardu a matematiku na MIT, pracoval v oblasti balistiky • u studentů znám chabým způsobem přednášení, vtipy a roztržitostí • teorie pravděpodobnosti a náhodné procesy (Wienerův bílý šum) • dodnes je udělována Wienerova cena za aplikovanou matematiku Norbert Wiener • snažil se vstoupit do armády za 1. sv. v. (odmítán kvůli slabému zraku), přijat až na konci války jako prostý voják • účastnil se prací v oblasti balistiky • mezi válkami se oženil a měl dvě dcery • za 2. sv. v. – střely na velkou vzdálenost – automat (servomechanismus) – 1) zasáhnout cíl, 2) odpovědět na otázku (zpětná vazba) • na konci války – 1. radarem řízená střela (navádění během letu), pak se věnoval 2. typu automatů (informace si pamatují) • zformuloval teorii informace nezávisle na Shanonovi a Weaverovi • po válce – kybernetika Norbert Wiener • kybernetika zkoumá stroje i živé organismy (pomezní disciplína) • éra kybernetických strojů, počítače, analogie s lidským mozkem (zpětná vazba na podněty z okolí u živých organismů i strojů) • vynutila si teorii informace • informatika, umělá inteligence, neuronové sítě • na východě kybernetika nejdříve buržoazní pavěda – přijata na konci 50. let První počítače • Charles Babbage – angl. matematik, filozof a vynálezce – mechanický programovatelný stroj (děrné štítky pro řízení tkalcovských strojů) – pol. 19. st. • 0. generace – elektromechanické, využívají relé (40. léta) – Konrad Zuse (německý inženýr) – Z1 (1938), kolíčková paměť na 16 čísel, Z2 a Z3 – 1941, první použitelný počítač, 2600 relé, dvojková soustava – Howard Aiken (USA) – Mark 1, IBM, 1944 předán Harvardu, následoval Mark 2, 1947 předán námořnictvu, 13 tis. relé – SAPO (Ant. Svoboda) Ústřední ústav matematický První počítače • 1. generace – elektronky (1945–1951), pouze 1 operace, poruchové, nízká vypočetní rychlost • ENIAC (1944–1955) – pro americkou armádu, turingovsky úplný, 18 tis. elektronek, poruchovost, 150 m2, 40 t, chlazen 2 leteckými motory • MANIAC – John von Neumann, 1945 (vodíková bomba) • 2. generace – tranzistory (1952–1965) • zmenšení rozměrů, zvýšení rychlosti, nižší energetické nároky – dávkové zpracování (COBOL, FORTRAN, ALGOL) – pronajímání strojového času • české počítače EPOS 1 a EPOS 2 • 3. generace – integrované obvody, (1965–1980) – sálové, 1 skříň, minipočítače, paralelní zpracování (multitasking) – IBM System 360, 1965, začíná sériová výroba • 4. generace – mikroprocesory (od 1981) • PC, DOS, zmenšování rozměrů, zvyšování operační rychlosti Strojová lingvistika • automatické zpracování informací a textu • uložení a opětovné nalezení informace – bibliografické údaje, kartotéky, knihovnické automatizované systémy – klasifikace, indexování • informace o obsahu (získávání informací, Information Retrieval) 70.–80. léta ČSSR • MOZAIKA – Zdeněk Kirschner, MFF UK, automatická extrakce terminologie • SEMAN – sémantický analyzátor, Vladimír Smetáček, přirozený jazyk + sémantické rysy; tvorba tezauru (poloautomatizovaná), extrakce klíčových slov • korektory překlepů, dělení slov