Stax

Convertisseur Unicode

Convertissez du texte en points de code Unicode et vice versa. Inspectez les octets UTF-8/UTF-16.

U+0048 U+0065 U+006C U+006C U+006F U+0020 U+1F30D
\u{48}\u{65}\u{6C}\u{6C}\u{6F}\u{20}\u{1F30D}

Qu'est-ce que le convertisseur Unicode ?

Cet outil convertit texte en code points Unicode et inversement. Inspectez bytes UTF-8/UTF-16. Gère français, chinois, emojis. Essentiel pour déboguer problèmes d'encodage.

Comment utiliser l'outil

  1. Écrivez/collez texte.
  2. Voir code points (format U+XXXX) instantanément.
  3. Obtenez aussi représentation de bytes UTF-8 et UTF-16.
  4. Inverse : convertir code points en texte.

Usages principaux

  • Déboguer mismatch d'encodage
  • Inspecter bytes d'emoji
  • Comprendre stockage de texte en BD
  • Échappement de caractères en intégration API

Questions fréquemment posées

Qu'est-ce qu'Unicode ?
Unicode donne un code numérique unique pour chaque langue, script, emoji du monde. Plus de 140,000 caractères — français, chinois, arabe, emojis, symboles mathématiques. UTF-8 est son encodage — utilisé sur 98% d'internet.
Différence entre UTF-8 et UTF-16 ?
UTF-8 : longueur variable (1-4 bytes), compatible ASCII — standard web. UTF-16 : 2 ou 4 bytes — interne Windows, strings de Java, JavaScript. UTF-32 : fixe 4 bytes — moins populaire. Sur le web préférez toujours UTF-8.
Qu'est-ce qu'un code point ?
Chaque caractère Unicode a un nombre unique. Exemple : 'A' = U+0041, 'è' = U+00E8, '😀' = U+1F600. Écrits en hex avec préfixe U+. Cet outil convertit entre caractère ↔ code point ↔ bytes UTF-8.
Que sont les paires surrogate ?
BMP (Plan Multilingue Basique, U+0000 à U+FFFF) a 65,536 caractères. Les caractères au-dessus (emojis, scripts antiques) sont représentés avec 2 paires surrogate en UTF-16. Les strings JavaScript sont en UTF-16 — la longueur d'un emoji est 2.

Outils associés