Communication Langagiere Unix
Communication Langagiere Unix
Communication Langagiere Unix
utilisant Unicode.
Q2) Si on fait un document html, cela sera mieux de spcifier dans meta-charset le
type d'encodage qu'on veut l'utiliser. Sinon, le browser peut interprter de manire
fausse les caractres et en plus il doit essayer de deviner le type d'encodage et c'est
vrai qu'il y a des fois quand le browser n'arrive pas a faire cela. Il y a aussi l'encodage
souvent spcifi dans les headers http pour savoir comment afficher le contenu qu'il
reoit aprs la requte HTTP.
Q3)Il y a cette possibilit parce-que certains encodages on t faits a l'aide d'autres
encodages en ajoutant des caractres spcifiques pour certaines langues. Par exemple,
ici on peut reprsenter les caractres accentus avec l'encodage turkish car le type
d'encodage qui supporte les caractres spcifiques a ce pays est ISO/IEC 8859-9 qui
est identique a ISO/IEC 8859-1 avec quelques exceptions.ISO/IEC 8859-1 contient les
caractres accentus spcifiques franaises et cela rend possible leur reprsentation
correcte.
Exercice 9 : analyse des encodages
Q1) Le mot d, en UTF -8, a 4 caractres qui sont encods en utilisant 7 bytes, 1
byte pour le d et 2 bytes pour les autres 3 lettres. Sa reprsentation en hexadcimal est
la suivante : 64C3A9C3A7C3A0
Q2) Gre a la reprsentation hexadcimale 47 72 C3 BC C3 9F 65.
Nous avons 5 caractres et 7 bytes. G, r, e sont reprsents chacun avec 1 byte et ,
avec 2 bytes.
Exercice 10: encodage et place occupe
Q1) En nombre d'octets utilise, iso8859-1 est plus efficace car chaque caractre est
stock sur un octet lorsque en UTF-8 la reprsentation d'un caractre peut avoir entre
1 et 4 octets.
Q2)Le caractre du dbut a 2 bytes dans la reprsentation UTF-8, avec une
reprsentation hexadcimale : C3A9 et 1 byte en Iso 8859 -1, avec la reprsentation
hexadcimale : E8.
Exercice 11 : conversion vers lUTF-8
Q1) Pour convertir on a utilis la commande :
iconv -f WINDOWS-1256 -t UTF-8
testAR.win