UTF-8 est un codage de caractères qui décrit chaque point de code Unicode en utilisant une séquence d'octets de un à quatre octets. Il est rétrocompatible avec ASCII tout en prenant en charge la représentation de tous les points de code Unicode.

UTF-8est un character-encodingqui peut décrire l'ensemble des points de code unicode en séquences d'octets de un à quatre octets.

UTF-8 est l'encodage de caractères le plus utilisé et il est recommandé de l'utiliser sur Internet. Il s'agit du codage de caractères standard sur linuxet d'autres systèmes d'exploitation récents de type unix. Il a été conçu pour être rétrocompatible avec asciitout en prenant en charge la représentation de tous les points de code Unicode.

L'algorithme de codage des points de code en UTF-8 est décrit dans RFC 3629.

Tags associés