Dasher Pavel Rychlý Centrum zpracování přirozeného jazyka Fakulta informatiky Masarykova univerzita, Brno pary@fi.muni.cz 9 autoři: David MacKay, David Ward • Cambridge University; freeware • podpora pro vysoce efektivní textový vstup za použití jiných prostředků než standardní počítačové klávesnice 9 zadávání textu na obrazovce pomocí polohovacího zařízení (myš, joystick ...) » používá pravděpodobnostní prediktivní jazykový model o stále se ladí (technologie zůstává stejná) O Dasheru 9 Dasher je zdarma 9 open-source software 9 podléhá požadavkům GNU Generel Public License o abeceda pro více než 150 jazyků • možnost nastavení barvy písma 9 systém se učí a nabízí kombinace písmen, které jsou užívanější Pavel Rychlý jaro 2014 3 / 28 o asistivní technologie (postižení - bez rukou, s jednou rukou...) o PDA a mobilní telefony o složité jazyky (např. japonština) File Edit Options Control Prediction Help • písmena v abecedním pořadí, každé písmeno je v obdélníku » obdélník s vybraným písmenem obsahuje opět úplnou abecedu, ze které lze vybrat 2.symbol atd. o základní myšlenka: písmena s větší pravděpodobností jsou ve větším obdélníku • o konkrétním rozložení se rozhoduje na základě jazykového modelu Inverznľ' aritmetické kódovaní o aritmetické kódovaní (komprese textu): kódové slovo je číslo z intervalu (0,1), postupným kódovaním symbolu se intervaly zjemňují v poměru pravděpodobnosti výskytu znaku • v Dasheru reprezentuje ypsilonová souřadnice celý interval (0,1), kde každý symbol abecedy má přiřazen segment délky odpovídající pravděpodobnosti jeho výskytu v daném kontextu Jazykový model 9 jazykové modely aproximující přirozený jazyk využívají statistické metody a jsou založeny na odhadech frekvence výskytu sekvencí slov o nej používanější jsou n-gramové modely (bigramy, trigramy), které určují pravděpodobnost výskytu určitého slova se znalostí n-1 okolních slov 9 n-gramové modely je potřeba natrénovat z korpusu PPM (Prediction by Partial Match) 9 jazykový model použitý v Dasheru se neomezuje jen na koncept slov 9 spojuje informace o n-gramech s pravděpodobnostmi výskytu jednotlivých symbolu ze slovníku » kontext 4-5 symbolu o Standard letter-based PPM (podle částečné shody počítá pravděpodobnost) 9 Word-based model (slovník s četností slov) » Mixture model (PPM/dictionary) Jazykový model (3) o jazykový model se učí v čase (učí se nové uživatelovy výrazy a obraty) 9 vše, co napíšeme, se automaticky ukladá do souboru jako další trénovací data 9 import trénovacích dat jednoduše načtením souboru » zdroj dat pro češtinu: Ustav Českého národního korpusu FF UK o jakékoliv abecedy: např. i LaTeX, C, IPA o ostatní software - 2 módy: běžné psaní a doplňování slov (uživatel mezi nimi musí přepínat) d Dasher tyto režimy nerozlišuje Druhy vstupních metod o počítačová myš 9 touchpad 9 touchscreen 9 eyetracker 9 headmouse 9 dech 9 tlačítka o ... Pavel Rychlý jaro 2014 12 / 28 Myš, touchpad, touchscreen File Edit Options Help Dasher is great | Rychlost vstupu s použitím myši: po 10 minutách tréninku 5-15 slov/min., po hodině 15-25 slov/min., zkušení uživatelé 40 slov za minutu ukázka Dasheru video: ipaq 4 □ ► 4 fi? ► 4 Pavel Rychlý jaro 2014 13/ Pavel Rychlý jaro 2014 14 / 28 Eye Dasher • rychlost vstupu: po deseti minutách tréninku 7 slov/min., po hodině 20 slov/min., zkušení uživatelé 30 slov za minutu • eyetracking bez Dasheru, jen s virtuální (on-screen) klávesnicí: 15 slov/min., error-rate 5x vyšší • poslední položka. Pavel Rychlý jaro 2014 15 / 28 Eye Dasher - Uživatelská přívětivost d vstup za pomoci virtuální (on-screen) klávesnice je diskrétní (čekání na vypršení časovače, popř.mrknutí) 9 Dasher poskytuje spojitý vstup » video: eye_dasher Headmouse 9 IR kamera 9 reflexivní body 9 cena: 150-300 USD Pavel Rychlý jaro 2014 17 / 28 o přímá úměra mezi objemem plic a hodnotou ypsilonové souřadnice a jednodimenzionální (nelze zpět) • proto: Control mode • Control area (Stop, Pause, Move, Delete) • video: breath_dasher Button Dasher 3 směry o dopředu nahoru • dopředu dolů • zpět asher vs. rozpoznávání řeči • nepoužitelnost systémů pro automatické rozpoznávání řeči v hlučném prostředí d i u nejlepších rozpoznávačů asi 5 % chyb (náročná editace chyb) Speech Dasher 9 1. krok: standardní rozpoznávání řeči 9 2. krok: kontrola a oprava rozpoznané promluvy pomocí Dasheru 9 rychlejší než oprava s použitím samostatného rozpoznávání řeči (speciální příkazy) o rychlejší než samostatný Dasher 9 video: speech_dasher Další možnosti - Swype o vyvinuto společností Nuance Communications 9 psaní nepřerušovaným tahem na klávesách QWERTY 9 odhadování slov pomocí prediktivního slovníku (můžeme doplňovat i vlastní slova) • větší přesnost pro delší slova (krátká obvykle více možností interpretace tahu na obrazovce) 9 zápis bez diakritiky, nabízené varianty s diakritikou o zvládá i jednoduchou interpunkci (i smajlíky) 9 aplikace je schopna učit se z Facebooku, Gmailu, Twitteru... 9 dostupný i v češtině 9 možnost diktování v angličtině pomocí modulu Dragon Dictation 9 video http://www.youtube.com/watch?v=SJ-RAefCG_c Další možnosti -SwiftKey o zdarma pro Android (pro iOS pouze v angličtině) • učí se pomocí předchozí textové komunikace (SMS, Gmail, texty v RSS, přizpůsobuje se i písmenům, která opakovaně mačkáte mírně mimo) 9 více jazyků (i více zároveň) o oprava překlepů » predikce příštího slova (nabízí nejpravděpodobnější varianty následujících slov) Pavel Rychlý jaro 2014 24 / 28 SwiftKey (2) 9 kvalitní slovníky (odpovídají trendům v komunikaci) 9 lze psát ve stylu Swype (tažením) - pod funkcí Flow 9 lze zapnout funkce diktování v angličtině 9 video: http://www.youtube.com/watch?v=kA5Horw_SDE Pavel Rychlý jaro 2014 25 / 28 Další možnosti -Slidell 9 podobné klávesnici Swype - psaní tažením mezi znaky « nižší požadavky na přesnost psaní 9 kvalitní slovníky (možnost doinstalovat další) 9 dopočítává varianty slov, které chtěl uživatel napsat 9 automatické doplňování mezer a velkých písmen (bohužel chybové) 9 video: http://www.youtube.com/watch?v=Tp_7bWuvQwQ Další možnosti -GO Keyboar 9 predikce v mnoha jazycích 9 možnost změny skinů a pozadí 9 možnost importu jmen a SMS do slovníku 9 podpora zadávání textu Swype stylem 9 video: http://www.youtube.com/watch?v=XQRRvSwpmWc Další možnosti 9 Perfect keyboard o TouchPal keyboard o Google keyboard o Siine Shortcut keyboard o ... Pavel Rychlý jaro 2014 28 / 28