Codage des caractères et multi-linguisme : de l’ASCII à UNICODE et ISO/IEC-10646
Cahiers GUTenberg, no. 20 (1995), pp. 1-53.

Après avoir rappelé les notions de glyphe et de caractère, nous étudions les normes classiques d’échange de caractères, telles qu’Ascii ou ISO-latin-1. Puis, nous décrivons Unicode, une norme de codage 16-bits qui a comme but de représenter tous les caractères des langues vivantes pour permettre l’échange sans problèmes de textes rédigés dans les langues parlées des différentes parties du monde. ISO/IEC-10646 est une généralisation à quatre octets — dont les 2 premiers octets coincident avec ceux d’Unicode — qui permet aussi la représentation de caractères spéciaux et anciens en les codant sur 32 bits.

After revieiwing the difference between glyphs and characters, we discuss character exchange standards, like Ascii and ISO-Latin-1. Then we turn our attention to Unicode, a 16-bit encoding standard that will eventually represent the characters of all living languages and thus will make it possible to exchange without problems texts written in the languages spoken in various parts of the world. ISO/IEC-10646 is a 4-byte generalisation–the first two bytes coinciding with Unicode–but whose full 32-bits wide encoding space allows the representation of special or ancient characters.

@article{CG_1995___20_1_0,
     author = {Andr\'e, Jacques and Goossens, Michel},
     title = {Codage des caract\`eres et multi-linguisme~: de {l{\textquoteright}ASCII} \`a {UNICODE} et {ISO/IEC-10646}},
     journal = {Cahiers GUTenberg},
     pages = {1--53},
     publisher = {Association GUTenberg},
     number = {20},
     year = {1995},
     language = {fr},
     url = {http://www.numdam.org/item/CG_1995___20_1_0/}
}
TY  - JOUR
AU  - André, Jacques
AU  - Goossens, Michel
TI  - Codage des caractères et multi-linguisme : de l’ASCII à UNICODE et ISO/IEC-10646
JO  - Cahiers GUTenberg
PY  - 1995
SP  - 1
EP  - 53
IS  - 20
PB  - Association GUTenberg
UR  - http://www.numdam.org/item/CG_1995___20_1_0/
LA  - fr
ID  - CG_1995___20_1_0
ER  - 
%0 Journal Article
%A André, Jacques
%A Goossens, Michel
%T Codage des caractères et multi-linguisme : de l’ASCII à UNICODE et ISO/IEC-10646
%J Cahiers GUTenberg
%D 1995
%P 1-53
%N 20
%I Association GUTenberg
%U http://www.numdam.org/item/CG_1995___20_1_0/
%G fr
%F CG_1995___20_1_0
André, Jacques; Goossens, Michel. Codage des caractères et multi-linguisme : de l’ASCII à UNICODE et ISO/IEC-10646. Cahiers GUTenberg, no. 20 (1995), pp. 1-53. http://www.numdam.org/item/CG_1995___20_1_0/