Stax
Tools

Unicode Converter

Convert text to Unicode code points and back. Inspect UTF-8/UTF-16 bytes.

U+0048 U+0065 U+006C U+006C U+006F U+0020 U+1F30D
\u{48}\u{65}\u{6C}\u{6C}\u{6F}\u{20}\u{1F30D}

Unicode コンバーター & 文字インスペクター — 任意の文字をコードポイントとエスケープシーケンスにデコード

Unicode は、国際的なテキスト、絵文字、数学記号、地球上のあらゆる文字体系をすべてのソフトウェアで一貫して機能させるユニバーサル標準です。しかし、コードで Unicode を扱うには、正確なコードポイント(U+XXXX)、UTF-8 バイトシーケンス、またはプログラミング言語に正しいエスケープフォーマットを知ることが必要です。このツールは 3 つのワークフローすべてをカバーします:テキストを Unicode コードポイントに変換、コードポイントをテキストにデコード、そして各文字の詳細情報を表示。

Text → Unicode モードでは、任意のテキストを入力または貼り付けると、各文字の Unicode コードポイントが U+XXXX フォーマットで、10 進数値、UTF-8 バイトシーケンス、Unicode ブロックカテゴリとともに即座に表示されます。ボタンを使ってエスケープフォーマットを切り替えて、JavaScript(\u{XXXX})、CSS(\XXXX)、HTML(&#xXXXX;)、または Python(\uXXXX)のエスケープシーケンスをコピー準備完了で取得できます。Unicode → Text モードでは、スペースまたはカンマで区切られた任意のフォーマット(U+0041、0041、または単に 41)のコードポイントを入力し、読み取り可能な文字にデコードします。

国際化(i18n)に取り組む開発者は、文字列が別のブロックからの似た文字ではなく正しい Unicode 文字を含んでいることを確認するために使います — これは PDF やドキュメントからテキストをコピーする際のバグの一般的な原因です。セキュリティ研究者は、視覚的に似た異なる Unicode ブロックの文字が詐欺的な URL やユーザー名を作成するために使われるホモグリフ攻撃を検査するために使います。フロントエンド開発者は、疑似要素で特殊文字を挿入するための正しい CSS content 値を取得するために使います。Python と JavaScript 開発者は、ファイルのエンコーディングに依存することなく、ソースコードに非 ASCII 文字を安全に埋め込む必要がある場合に使います。

ソフトウェアエンジニアは、誤った UTF-8/UTF-16 の前提により文字が文字化けして表示されるエンコーディングの問題をデバッグする際に使います。ローカリゼーションスペシャリストは、翻訳されたテキストが対象言語に正しくエンコードされた文字を含んでいることを確認するために使います。Web 開発者は、グリフを持たないかもしれないフォントに依存せずに使用したい矢印、通貨記号、数学演算子などの特殊記号の HTML エンティティや CSS エスケープコードを取得するために使います。

すべての Unicode 分析と変換は、JavaScript の組み込み文字列 API を使用してブラウザ内で完全に実行されます — テキスト入力や文字データはどのサーバーにも送信されません。

よくある質問

What is a Unicode code point?
A Unicode code point is a unique number assigned to every character in the Unicode standard. It is written as U+XXXX (e.g., U+0041 for 'A'). There are over 1.1 million possible code points.
How do I convert Unicode code points back to text?
Switch to 'Unicode → Text' mode and enter code points separated by spaces or commas. You can use U+0041, 0041, or just 41 — the tool accepts all formats.
What escape formats are supported?
The tool outputs JavaScript (\u{XXXX}), CSS (\XXXX), HTML (&#xXXXX;), and Python (\uXXXX or \UXXXXXXXX) escape sequences. Select the format with the buttons next to the Escaped field.
What does the character inspector show?
For each character in your text, the inspector shows the glyph, Unicode code point (U+XXXX), decimal value, UTF-8 byte sequence (hex), and Unicode block/category.
Does this support emoji and non-BMP characters?
Yes. The tool handles the full Unicode range including emoji, CJK characters, Devanagari, Arabic, and supplementary plane characters (U+10000 and above) using JavaScript's codePointAt API.

関連ツール