Stax

محول Unicode

تحويل النص إلى نقاط رمز Unicode والعكس.

U+0048 U+0065 U+006C U+006C U+006F U+0020 U+1F30D
\u{48}\u{65}\u{6C}\u{6C}\u{6F}\u{20}\u{1F30D}

ما هو محول Unicode؟

أداة لتحويل بين أنظمة Unicode encoding المختلفة (UTF-8، UTF-16، UTF-32، Hex). أساسي لـ debugging encoding issues، تحليل الملفات الثنائية، URL encoding، فهم كيف تخزن النصوص العالمية.

أنظمة Unicode

  1. UTF-8: 1-4 bytes، شائع للويب
  2. UTF-16: 2-4 bytes، Windows، JavaScript
  3. UTF-32: 4 bytes ثابت، سريع لكن كبير
  4. Hex: تمثيل 16-base
  5. Decimal: code points

أحرف شائعة

  • A = U+0041 = 0x41
  • أ = U+0627 = 0xD8 0xA7
  • 中 = U+4E2D = 0xE4 0xB8 0xAD
  • 😀 = U+1F600 = 4 bytes
  • اختلاف بين languages

حالات الاستخدام

Debug encoding issues (mojibake). تحليل ملفات ثنائية. فهم URL encoding (%XX). معالجة emoji في JS (length issues). رموز خاصة في الكود. كل المعالجة محلياً، النص لا يرفع. آمن لـ النصوص السرية، logs، debugging.

الأسئلة الشائعة

ما هو Unicode؟
معيار عالمي لترميز كل أحرف اللغات. 144,000+ حرف. UTF-8 الأكثر شيوعاً (متغير الطول 1-4 bytes). يدعم: عربي، صيني، يابانية، rumois، ratos، حتى hieroglyphs مصرية. الإنترنت كله يعمل بـ UTF-8.
ما الفرق بين UTF-8، UTF-16؟
UTF-8: متغير 1-4 bytes. ASCII compatible. شائع للويب. UTF-16: 2-4 bytes. شائع في Windows، JavaScript. UTF-32: 4 bytes ثابت. كبير لكن سريع للوصول. اختر UTF-8 افتراضياً - 95% من المواقع تستخدمه.
كيف أتعامل مع emoji؟
Emojis = Unicode characters. 😀 = U+1F600. كل emoji قد تأخذ 4 bytes في UTF-8. تطبيقاتك يجب تدعم Unicode كاملاً. JavaScript: استخدم 'string'.length الذي يحسب code units، ليس characters - استخدم Array.from(str).length للـ emojis الصحيحة.
هل يمكن تحويل بين encodings؟
نعم - أداتنا تحول بين UTF-8، UTF-16، UTF-32، Hex، Decimal. مفيد لـ debugging encoding issues، تحليل الملفات الثنائية، URL encoding. كل المعالجة محلياً، آمن للنصوص السرية.

أدوات ذات صلة