Passer en locale UTF-8 sous Debian

Le but de cette note est de modifier le jeu de caractères par défaut sous Debian pour passer en UTF-8.

L'avantage de l'UTF-8 est qu'il permet la représentation d'un nombre beaucoup plus important de caractères : 90 000 aujourd'hui, contre 256 pour l'ISO-8859-1 (ou ISO-latin1) utilisé par défaut.

La manipulation pour changer le jeu de caractères par défaut est très simple et passe par la commande dpkg-reconfigure. Cette commande permet de reconfigurer un paquet après qu'il soit installé. Ici, nous allons reconfigurer le paquet locales :

~$dpkg-reconfigure locales

Dans la liste déroulante, vérifier que le jeu de caractères fr_FR.UTF-8 UTF-8 est coché :

[ ] fr_CA ISO-8859-1
[ ] fr_CA.UTF-8 UTF-8
[ ] fr_CH ISO-8859-1
[ ] fr_CH.UTF-8 UTF-8
[*] fr_FR ISO-8859-1
[*] fr_FR.UTF-8 UTF-8
[*] fr_FR.UTF-8@euro UTF-8
[*] fr_FR@euro ISO-8859-15
[ ] fr_LU ISO-8859-1
[ ] fr_LU.UTF-8 UTF-8
[ ] fr_LU@euro ISO-8859-15

Après avoir validé, on peut choisir le jeu de caractère par défaut. Sélectionner fr_FR.UTF-8 :

Aucun
fr_FR
fr_FR.UTF-8
fr_FR.UTF-8@euro
fr_FR@euro

Après validation, il faut se déconnecter et reconnecter. On peut alors vérifier le jeu de caractères par défaut qui est maintenant UTF-8 avec la commande locale :

~$locale
LANG=fr_FR.UTF-8
LC_CTYPE="fr_FR.UTF-8"
LC_NUMERIC="fr_FR.UTF-8"
LC_TIME="fr_FR.UTF-8"
LC_COLLATE="fr_FR.UTF-8"
LC_MONETARY="fr_FR.UTF-8"
LC_MESSAGES="fr_FR.UTF-8"
LC_PAPER="fr_FR.UTF-8"
LC_NAME="fr_FR.UTF-8"
LC_ADDRESS="fr_FR.UTF-8"
LC_TELEPHONE="fr_FR.UTF-8"
LC_MEASUREMENT="fr_FR.UTF-8"
LC_IDENTIFICATION="fr_FR.UTF-8"
LC_ALL=