Convertisseur Unicode

Qu'est-ce que le convertisseur Unicode ?

Cet outil convertit texte en code points Unicode et inversement. Inspectez bytes UTF-8/UTF-16. Gère français, chinois, emojis. Essentiel pour déboguer problèmes d'encodage.

Comment utiliser l'outil

Écrivez/collez texte.
Voir code points (format U+XXXX) instantanément.
Obtenez aussi représentation de bytes UTF-8 et UTF-16.
Inverse : convertir code points en texte.

Usages principaux

Déboguer mismatch d'encodage
Inspecter bytes d'emoji
Comprendre stockage de texte en BD
Échappement de caractères en intégration API

Questions fréquemment posées

Qu'est-ce qu'Unicode ?

Unicode donne un code numérique unique pour chaque langue, script, emoji du monde. Plus de 140,000 caractères — français, chinois, arabe, emojis, symboles mathématiques. UTF-8 est son encodage — utilisé sur 98% d'internet.

Différence entre UTF-8 et UTF-16 ?

UTF-8 : longueur variable (1-4 bytes), compatible ASCII — standard web. UTF-16 : 2 ou 4 bytes — interne Windows, strings de Java, JavaScript. UTF-32 : fixe 4 bytes — moins populaire. Sur le web préférez toujours UTF-8.

Qu'est-ce qu'un code point ?

Chaque caractère Unicode a un nombre unique. Exemple : 'A' = U+0041, 'è' = U+00E8, '😀' = U+1F600. Écrits en hex avec préfixe U+. Cet outil convertit entre caractère ↔ code point ↔ bytes UTF-8.

Que sont les paires surrogate ?

BMP (Plan Multilingue Basique, U+0000 à U+FFFF) a 65,536 caractères. Les caractères au-dessus (emojis, scripts antiques) sont représentés avec 2 paires surrogate en UTF-16. Les strings JavaScript sont en UTF-16 — la longueur d'un emoji est 2.

Qu'est-ce que le convertisseur Unicode ?

Comment utiliser l'outil

Usages principaux

Questions fréquemment posées

Outils associés