Conversor Unicode

Converta texto em sequências de escape Unicode e decodifique escapes Unicode, entidades HTML e texto internacional de volta para uma forma legível. Útil para JavaScript, JSON, localização, depuração e conteúdo multilíngue.

Entrada

0 caract. · 0 bytes

Testar:

Resultado

✓ Conversão em pontos de código Unicode ✓ Suporte a emoji e texto multilíngue ✓ Suporta os formatos U+XXXX e \uXXXX ✓ Processamento local no navegador

Exemplos

Codificar texto com acentos

Entrada Ação café coração

Saída \u0041\u00e7\u00e3\u006f\u0020\u0063\u0061\u0066\u00e9\u0020\u0063\u006f\u0072\u0061\u00e7\u00e3\u006f

Converta cada caractere para sua representação de escape Unicode, incluindo letras ASCII, espaços, cedilha e caracteres acentuados.

Decodificar texto escapado de API

Entrada Total do pedido: \u20ac99 \u2014 status: \u2713

Saída Total do pedido: €99 — status: ✓

Decodifique símbolos escapados comumente encontrados em respostas de API, logs, strings JSON e arquivos de localização.

Decodificar entidades HTML

Decodifique entidades HTML comuns e referências numéricas de caracteres de volta para texto legível.

Codificar texto com emoji

Entrada Olá ☕ 😀

Saída \u004f\u006c\u00e1\u0020\u2615\u0020\ud83d\ude00

Converta texto, símbolos e emoji em sequências de escape Unicode. Caracteres fora do Basic Multilingual Plane podem aparecer como pares substitutos UTF-16.

Como a codificação Unicode funciona

Unicode atribui um ponto de código único a caracteres, símbolos, sistemas de escrita e emoji de muitos sistemas de escrita. Por exemplo, a letra latina A é U+0041, o sinal de euro € é U+20AC, a marca de verificação ✓ é U+2713, e muitos emoji são representados por pontos de código fora do Basic Multilingual Plane.

Sequências de escape Unicode tornam esses caracteres representáveis em código-fonte, strings JSON, arquivos de configuração e ferramentas de depuração. Formatos comuns incluem escapes no estilo JavaScript \uXXXX, notações mais longas de ponto de código e entidades HTML.

Este conversor pode transformar texto legível em sequências de escape e decodificar Unicode escapado ou entidades HTML de volta para texto normal.

Unicode e segurança

A conversão Unicode não é criptografia. Ela apenas muda a forma como o texto é representado e normalmente pode ser revertida sem senha ou chave secreta.

Escapes Unicode são úteis para compatibilidade, código-fonte, localização e depuração, mas não protegem informações sensíveis.

Usos comuns do Unicode

A conversão Unicode é comumente usada em JavaScript, JSON, APIs, arquivos de localização, sites multilíngues, depuração de texto e código-fonte quando caracteres especiais precisam ser representados com segurança.

Desenvolvedores costumam usar escapes Unicode para inspecionar caracteres invisíveis, depurar texto quebrado, preservar strings multilíngues, trabalhar com emoji e representar com segurança caracteres que podem ser difíceis de digitar ou exibir diretamente.

Unicode, ASCII e UTF-8

ASCII é um conjunto de caracteres mais antigo que cobre apenas 128 caracteres básicos, principalmente letras inglesas, dígitos, pontuação e códigos de controle. Unicode é muito mais amplo e pode representar caracteres de muitos idiomas, símbolos e emoji.

UTF-8 é uma forma de codificar texto Unicode como bytes. Unicode define o que cada caractere significa, enquanto UTF-8 define como esses caracteres são armazenados ou transmitidos em forma binária.

Escapes Unicode e entidades HTML

Escapes Unicode como \u041F são comuns em JavaScript, JSON e código-fonte. Entidades HTML como © ou © são comumente usadas em documentos HTML.

Ambos os formatos podem representar caracteres indiretamente, mas são usados em contextos diferentes. Escapes Unicode são comuns em linguagens de programação, enquanto entidades HTML são projetadas para marcação web.

FAQ

Unicode é um padrão universal de codificação de caracteres que oferece suporte a texto de quase todos os idiomas e sistemas de símbolos.

Ele converte texto comum em sequências de escape Unicode e decodifica sequências Unicode de volta para texto legível.

Sim. Unicode inclui emoji, símbolos, caracteres matemáticos e muitos sistemas de escrita internacionais.

Não. ASCII suporta apenas caracteres ingleses básicos, enquanto Unicode suporta milhares de caracteres de muitos idiomas.

Não. O conversor funciona inteiramente no navegador e processa os dados localmente.

Caracteres fora do Basic Multilingual Plane, como muitos emoji, usam pares substitutos na codificação UTF-16.

Sim. A ferramenta suporta sequências Unicode comuns no estilo JavaScript, como \\uXXXX.

Uma sequência de escape Unicode representa um caractere usando notação de código, como \u0041 para A, \u20ac para o sinal de euro € ou \u2713 para a marca de verificação ✓.

Unicode define pontos de código de caracteres, enquanto UTF-8 é um formato de codificação que armazena texto Unicode como bytes.

Sim. O conversor pode decodificar entidades HTML comuns e referências numéricas de caracteres de volta para texto legível.

Muitos emoji ficam fora do Basic Multilingual Plane. Em UTF-16, esses caracteres são representados como duas unidades de código chamadas par substituto.

Ferramentas relacionadas

Conversor Unicode

Codificador e descodificador Base64

Codificador e decodificador Hex online

Codificar e decodificar URL online

Conversor binário online

Conversor ASCII

Decodificador JWT online

Conversor Unicode

O que é Unicode?

O que o Conversor Unicode faz?

Esta ferramenta suporta emoji?

Unicode é o mesmo que ASCII?

Meu texto é enviado para um servidor?

Por que alguns caracteres Unicode são representados por dois códigos?

Posso decodificar strings Unicode de JavaScript?

O que é uma sequência de escape Unicode?

Qual é a diferença entre Unicode e UTF-8?

Esta ferramenta pode decodificar entidades HTML?

Por que emoji às vezes aparecem como pares substitutos?

Codificador e descodificador Base64

Codificador e decodificador Hex online

Codificar e decodificar URL online

Conversor binário online

Conversor ASCII

Decodificador JWT online