Znaky v XML dokumentech
Specifikace povoluje na určitých místech v XML dokumentech (např.
název elementu, obsah atributu...) jen některé znaky.
Vzhledem k internacionalizaci a nutnosti zvládnout i exotické
jazyky je třeba znát, co se čím myslí.
Musíme rozlišovat:
-
znakové sady (množiny znaků s pořadovými
čísly), tj. přiřazení ordinální hodnoty znaku (např. Unicode)
a
-
kódování znaků (z dané sady), např.
UTF-8, tj. ordinální hodnota znaku se kóduje do posloupnosti
bajtů