Unicode & UTF
Descripción
Unicode es un estándar que define un número, o punto de código único, para cada carácter. Otra forma de decir esto es que cada carácter se asigna a un valor único. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad y unicidad.
Unicode Transformation Format (UTF) es una forma de codificar estas asignaciones Unicode. Las formas más comunes de UTF son UTF-8, que usa 8 bits o unidades de 1 byte, y UTF-16, que usa 16 bits o unidades de 2 bytes.
UTF-8 fue diseñado para ser compatible con ASCII. Los primeros 128 caracteres de Unicode son idénticos a los caracteres ASCII y UTF-8 utiliza un solo byte con los mismos valores binarios para representarlos. Por ejemplo, el caracter A
(mayúscula) está codificada en UTF-8 como 41 y también está codificada en ASCII Hex como 41.
Conversiones
Conversión de archivo ASCII a UTF-8.
Última actualización
¿Te fue útil?