2020
Anonymizér osobních dat v online konverzacích
SOTOLÁŘ, Ondřej a Jaromír PLHÁKZákladní údaje
Originální název
Anonymizér osobních dat v online konverzacích
Název anglicky
Personal Data Anonymization Software for Electronic Communication
Autoři
SOTOLÁŘ, Ondřej (203 Česká republika, domácí) a Jaromír PLHÁK (203 Česká republika, garant, domácí)
Vydání
2020
Další údaje
Jazyk
čeština
Typ výsledku
Software
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/20:00116046
Organizační jednotka
Fakulta informatiky
Klíčová slova česky
anonymizace;osobní dat;citlivá data;rozpoznání osobních dat
Klíčová slova anglicky
anonymization;personal data;personal data recognition;GDPR;sensitive data
Technické parametry
Multiplatformní, open-source řešení. Zdrojové kódy jsou dostupné na https://gitlab.fi.muni.cz/irtis/irtis-anonymizer.
Změněno: 23. 7. 2020 10:27, RNDr. Jaromír Plhák, Ph.D.
V originále
Softwarové řešení využívá existujícího nástroje pro rozpoznávání pojmenovaných entit (NameTag) společně s nově navrženými pravidly pro rozpoznávání a spojování pojmenovaných entit do větších celků, nazvaných entity osobních dat. SW umožňuje jejich anonymizaci pomocí nahrazení entit osobních údajů jinými údaji, které zachovají původní, přirozené vyznění textu.
Anglicky
This software provides a novel rule-based approach to the anonymization of personal data in unstructured text written in Czech language. It uses available machine-learning methods, like named-entity recognition, and improve their performance by grouping multiple entities into larger units based on the theory of tabular data anonymization. This solution, personal data entities are detected, classified, and anonymized. Moreover, the resulting texts keep the original word forms after their replacement with gazetteer values.