R 2020

Anonymizér osobních dat v online konverzacích

SOTOLÁŘ, Ondřej a Jaromír PLHÁK

Základní údaje

Originální název

Anonymizér osobních dat v online konverzacích

Název anglicky

Personal Data Anonymization Software for Electronic Communication

Autoři

SOTOLÁŘ, Ondřej (203 Česká republika, domácí) a Jaromír PLHÁK (203 Česká republika, garant, domácí)

Vydání

2020

Další údaje

Jazyk

čeština

Typ výsledku

Software

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/20:00116046

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

anonymizace;osobní dat;citlivá data;rozpoznání osobních dat

Klíčová slova anglicky

anonymization;personal data;personal data recognition;GDPR;sensitive data

Technické parametry

Multiplatformní, open-source řešení. Zdrojové kódy jsou dostupné na https://gitlab.fi.muni.cz/irtis/irtis-anonymizer.
Změněno: 23. 7. 2020 10:27, RNDr. Jaromír Plhák, Ph.D.

Anotace

V originále

Softwarové řešení využívá existujícího nástroje pro rozpoznávání pojmenovaných entit (NameTag) společně s nově navrženými pravidly pro rozpoznávání a spojování pojmenovaných entit do větších celků, nazvaných entity osobních dat. SW umožňuje jejich anonymizaci pomocí nahrazení entit osobních údajů jinými údaji, které zachovají původní, přirozené vyznění textu.

Anglicky

This software provides a novel rule-based approach to the anonymization of personal data in unstructured text written in Czech language. It uses available machine-learning methods, like named-entity recognition, and improve their performance by grouping multiple entities into larger units based on the theory of tabular data anonymization. This solution, personal data entities are detected, classified, and anonymized. Moreover, the resulting texts keep the original word forms after their replacement with gazetteer values.