|
|
Exista alternative pentru tratarea pentru o gama de scripturi. De exemplu, cu setul de caractere Unicod, puteti reprezenta ambele caractere in acelasi set. De fapt, Unicode contine intr-un singur set marea majoritate a acaracterelor de care ve-ti avea nevoie. Chiar daca valoarea 233 reprezinta é caracterul Chirilic щ acum are punctiul de cod cu valoarea de 1097. Acest numar este prea mare pentru a fi reprezentat printr-un singur bite. Daca folositi codificarea caracterelor pentru text Unicode numita UTF-8,щ va fi reprezentat pe doi biti, dar punctul de cod al valorii nu reprezinta valorile celor doi biti lipite impreuna - ci presupune decodificari mai complexe. Alte caractere Unicode fac refernita la unul, trei sau chiar patru biti in codificarea UTF-8.
|