⚪
Cryptography
  • Inicio
  • Encoding / Codificación
    • Introducción
    • Binary
    • Hexadecimal (Base16)
    • ASCII
    • Unicode & UTF
    • Base64
    • URL encoding
  • Hashing
    • Introducción
    • Suma de verificación (checksum)
    • Passwords
    • Salt
  • Encriptación / Cifrado
    • Sustitución
    • Simétrico
    • Asimétrico
Con tecnología de GitBook
En esta página
  • Descripción
  • Conversiones

¿Te fue útil?

  1. Encoding / Codificación

Unicode & UTF

Descripción

Unicode es un estándar que define un número, o punto de código único, para cada carácter. Otra forma de decir esto es que cada carácter se asigna a un valor único. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad y unicidad.

Unicode Transformation Format (UTF) es una forma de codificar estas asignaciones Unicode. Las formas más comunes de UTF son UTF-8, que usa 8 bits o unidades de 1 byte, y UTF-16, que usa 16 bits o unidades de 2 bytes.

UTF-8 fue diseñado para ser compatible con ASCII. Los primeros 128 caracteres de Unicode son idénticos a los caracteres ASCII y UTF-8 utiliza un solo byte con los mismos valores binarios para representarlos. Por ejemplo, el caracter A (mayúscula) está codificada en UTF-8 como 41 y también está codificada en ASCII Hex como 41.

Conversiones

Conversión de archivo ASCII a UTF-8.

iconv -f ASCII -t UTF-8 <file> -o <output-file>
AnteriorASCIISiguienteBase64

Última actualización hace 2 años

¿Te fue útil?