Código alfanumérico: Guia Completa

Las primeras computadoras se usaban solo con fines informáticos, es decir, solo se usaban como dispositivos informáticos. Pero las computadoras ahora se usan para algo más que números, se usan para representar nombres, direcciones, descripciones de cosas y más.

Estos datos se representan mediante letras y símbolos en la computadora, que es un sistema numérico y solo puede manejar 1 y 0. Entonces, para manejar letras y símbolos, se utilizan códigos alfanuméricos.

Los códigos alfanuméricos, también conocidos como códigos de caracteres, son códigos binarios que se utilizan para representar datos alfanuméricos.

Estos códigos están informatizados y permiten escribir datos alfanuméricos en un formato que se pueda comprender y procesar, incluyendo letras del alfabeto, números, símbolos matemáticos y signos de puntuación.

Con el uso de estos códigos, podemos conectar dispositivos de entrada y salida como teclados, monitores e impresoras a la computadora.

Se han inventado varias técnicas de codificación para representar la información alfanumérica como una serie de unos y ceros.

Los códigos alfanuméricos más antiguos que se conocen son el código Morse, utilizado en el telégrafo, y el código Hollerith de 12 dígitos, utilizado cuando se utilizaban tarjetas perforadas como medio de entrada y salida de datos. Con el desarrollo de nuevos medios, las tarjetas perforadas han desaparecido por completo y los códigos de Hollerith se han vuelto obsoletos.

En la actualidad, los códigos ASCII y EBCDIC son los dos códigos alfanuméricos más utilizados. Los códigos ASCII son muy populares y se utilizan en todas las computadoras personales y estaciones de trabajo, mientras que los códigos EBCDIC se utilizan principalmente en sistemas mainframe. Además, UNICODE se desarrolló para superar la limitación de la codificación de caracteres limitada en los códigos ASCII y EBCDIC.

Índice

Tipo de código alfanumérico

Tipo de código alfanumérico

Código Morse

Inventado por Samuel FB Morse en 1837, el código Morse fue el primer código alfanumérico utilizado en telecomunicaciones.

Utiliza secuencias estandarizadas de elementos cortos y largos para representar letras, números y caracteres especiales para un mensaje determinado. Los elementos cortos y largos pueden estar formados por sonidos, marcas, pulsos, pulsaciones on-off, comúnmente conocidos como puntos y rayas. Ejemplo: La letra "A" consta de un punto y un guión.

El número 5 consta de 5 puntos consecutivos. El código Morse internacional trata un guión como tres puntos. Para ver los detalles de la tabla de códigos Morse, puede consultar La Internet buscador.

Debido a la longitud variable de los caracteres del código Morse, el código Morse no se puede adaptar a los circuitos de automatización. En la mayoría de las comunicaciones electrónicas se utilizan códigos Baudot y ASCII.

El código Morse tiene aplicaciones limitadas. Se utiliza para comunicarse mediante cables telegráficos, circuitos de radio. Los pilotos y controladores de tráfico aéreo también los utilizan para transmitir sus identidades y otra información.

Código Hakata

Los códigos Baudot son otro código alfanumérico popular utilizado a principios de la década de 1860. Fue inventado en 1870 por el ingeniero francés Émile Baudeaux. Es un código de 5 unidades (es decir, utiliza cinco elementos para representar un alfabeto). Además, a diferencia del código Morse, todos los símbolos tienen la misma duración. Esto permitió que el telégrafo transmitiera el alfabeto romano y los signos de puntuación, así como señales de control.

Código horacio

En 1896, Herman Hollerith formó una compañía llamada Tabulating Machine Company. La empresa desarrolló una serie de máquinas para la tabulación mediante tarjetas perforadas. Después de varias fusiones, esta empresa formó IBM, Inc.

Por lo general, nos referimos a las tarjetas perforadas que se usan en los sistemas informáticos como tarjetas Hollerith, y el código de 12 dígitos que se usa en las tarjetas perforadas se llama códigos Hollerith.

Las cadenas Hollerith son secuencias de caracteres de 12 bits; se codifican como dos caracteres ASCII, cada uno de los cuales contiene 6 bits. El primer carácter contiene las marcas 12, 0, 2, 4, 6, 8 y el segundo carácter contiene las marcas 11, 1, 3, 5, 7, 9. Intercala los dos caracteres para obtener los 12 bits originales.

Puedes leer: Desarrollo de Software en Querétaro: Testeo y Consultoría

Para que los caracteres se puedan imprimir en terminales ASCII, el bit 7 siempre se establece en 0 y el bit 6 se denomina complemento del bit 5. Estos dos bits se ignoran cuando se leen tarjetas de Hollerith.

Hoy en día, el código Hollerith está obsoleto, ya que las tarjetas perforadas en su mayoría están obsoletas y se reemplazan por otros medios de almacenamiento.

Código Estándar Americano para Intercambio de Información (ASCII)

El Código Estándar Estadounidense para el Intercambio de Información (ASCII), pronunciado "as-kee", es un código de 7 dígitos basado en el alfabeto inglés. Los códigos ASCII se utilizan para representar datos alfanuméricos en la entrada/salida de la computadora.

Históricamente, ASCII se desarrolló a partir de códigos telegráficos. Se publicó por primera vez como estándar en 1967. Siguieron actualizaciones, con muchos lanzamientos, la más reciente en 1986. Como es un código de siete dígitos, puede representar casi 128 caracteres. Estos incluyen 95 caracteres imprimibles, incluidas 26 letras mayúsculas (de la A a la Z), 26 letras minúsculas (de la a a la z), 10 números (0 a 9) y 33 caracteres especiales como símbolos matemáticos, caracteres de espacio, etc. También define códigos para 33 caracteres obsoletos no imprimibles, excepto retornos de carro y/o saltos de línea.

La siguiente tabla enumera los códigos ASCII de 7 bits para los 95 caracteres imprimibles.

El formato de código ASCII de cada carácter es X₆'X, X₄, X₃, X₂, X_yo'X₀ donde cada X es 0' o 1. Por ejemplo, la letra D se codifica como.1000100. Para comodidad de la lectura, dejamos el siguiente espacio: 1000100.

Asimismo, de la tabla anterior, vemos que la letra 'A' tiene una X₆X₅X₄de 100 y X₃X₂X_yoX_ode 0001 (A). Del mismo modo, la X del número "9"₆X₅X₄El valor es 011, X₃X₂X_yoX₀ es 1001, por lo que el código ASCII-7 para el número 9 es 0111001.

Algunos ejemplos más son:

Como se muestra en la Tabla 3.4, el código ASCll-7 de "d" es 1100100.

Como se muestra en la Tabla 3.4, el código ASCll-7 de "+" es 0101011.

También se desarrolló una versión de ocho bits del código ASCII, conocida como US ASCII-8 o ASCII-8. Dado que utiliza 8 bits, esta versión de ASCII puede representar hasta 256 caracteres.

La siguiente tabla enumera algunos códigos ASCII-8.

Cuando se introdujeron los códigos ASCII-7, muchas computadoras consideraron los octetos (o bytes) como la unidad de información más pequeña. Este código de ocho bits se utiliza a menudo como bit de paridad para detectar errores en las líneas de comunicación. Las máquinas que no usan un bit de paridad generalmente tienen el octavo bit establecido en O. En este caso, el formato del código ASCII es X₇X₆X₅X₄X₃X₂X_yoX₀'. En el caso de códigos ASCII-7, X7 siempre será cero si se elige esta representación para representar caracteres. Por lo tanto, el código ASCII-7 de ocho dígitos para 'A' es 01000001 y 4' es 00101011.

Ejemplo 1: Con un teclado ASCII-7, cada pulsación de tecla produce el equivalente ASCII del carácter especificado. Suponga que escribe IMPRIMIR X. ¿Cuál es la salida de un teclado ASCII-7?

Solución: La secuencia es la siguiente:

ASCII-7 equivalente de P = 101 0000

Equivalente ASCII-7 de R = 101 0010

ASCII-7 equivalente de I = 1001010

N = 100 ASCII-7 equivalente a 1110

ASCII-7 equivalente de T = 1-010100

ASCII-7 equivalente de espacio = 010 0000

ASCII-7 equivalente de X = 101 1000

Entonces, la salida producida es 1010000101001010010101001110101010001000001011000. La salida en hexadecimal es 50 52 49 4E 54 30 58.

Puedes leer: Dimensiones: Conceptos y tipos de dimensiones en análisis de datos.

Ejemplo 2: Una computadora envía un mensaje a otra computadora usando un bit de paridad impar. Este es el mensaje en código ASCII-8.

1011 0001

1011 0101

1010 0101

1010 1110

¿Qué significan estos números?

Solución: Después de convertir el número de 8 dígitos al código ASCII-8 equivalente, obtenemos las palabras 1011 0001 (Q), 10110101 (U), 10100101 (E), 1010 0101 (E), 1010 1110 (N).

Entonces, en la traducción, obtenemos QUEEN como salida.

Código de intercambio decimal codificado en binario extendido (EBCDIC)

El código de intercambio decimal codificado en binario extendido (EBCDIC), pronunciado "ebi-si disk", es otro código común utilizado por las computadoras para transferir datos alfanuméricos. Es un código de 8 dígitos en el que los números (0-9) están representados por códigos BCD 8421, precedidos por 1111. Dado que es un código de 8 bits, puede representar casi 23 (= 256) caracteres diferentes, que incluyen letras mayúsculas y minúsculas y varios otros símbolos y comandos.

EBCDIC fue diseñado por IBM Corporation. Entonces, básicamente lo usan varios modelos de IBM.

En este código, no usamos secuencias binarias directas para representar caracteres como ASCII. Como es un código de 8 bits, es fácil dividirlo en grupos de 4 y representarlo en hexadecimal. Al utilizar la notación del sistema numérico hexadecimal, la cantidad de bits utilizados para representar varios caracteres y caracteres especiales en el código EBCDIC se reduce de uno a cuatro.

Así que si queremos mirar la memoria La representación interna en código binario de 8 bits se puede reducir a 2 dígitos hexadecimales, que es más fácil de decodificar.

La tabla anterior enumera los códigos EBCDIC para ciertos caracteres.

Lea la tabla anterior mientras lee el gráfico. Suponga que desea buscar el código EBCDIC para la letra "A". Para este caso, X₃X₂X_yoX₀El valor del bit es 0001, X₇X₆X₅X₄El valor del bit es 1100.

Por lo tanto, el código EBCDIC para la letra "A" es 11000001(A). Asimismo, el código EBCDIC para "B" es 11000010(B).

El código EBCDIC "=" es 01111110.

El código EBCDIC para "$" es 0101 1011.

Unicode

Las codificaciones ASCII y EBCDIC y sus variantes que hemos estudiado tienen algunas limitaciones.

1. Estas codificaciones no tienen una cantidad suficiente de caracteres para codificar datos alfanuméricos en todas las formas, alfabetos e idiomas. Por tanto, no permiten el tratamiento informático multilingüe.

2. Estas codificaciones no son compatibles. Por ejemplo, el código 7A (hexadecimal) significa la letra minúscula 'Z' en ASCII y el punto y coma ';' en el código EBCDIC.

Para superar estas limitaciones, UNICODE, también conocido como Código Universal, fue desarrollado conjuntamente por el Consorcio Unicode y la Organización Internacional de Normalización (ISO). Unicode es un código de 16 bits, por lo que puede representar 65536 caracteres diferentes. Es el esquema de codificación de caracteres más completo, que permite codificar texto en todas las formas e idiomas para su uso en computadoras. Además del soporte multilingüe, también admite un conjunto completo de notación matemática y técnica, lo que simplifica enormemente cualquier intercambio de información científica.

UNICODE tiene muchos usos

1. Cada vez se utiliza más para el procesamiento interno y almacenamiento de texto. Windows NT y sus descendientes, Java y Mac OS siguen a Unicode como la única codificación de caracteres interna.

2. Desde HTML 4.0, todas las recomendaciones del Consorcio World Wide Web utilizan Unicode como el conjunto de caracteres del documento.

3. Unicode ha resuelto parcialmente el problema de salto de línea al intentar leer archivos de texto en diferentes plataformas. Define una serie de caracteres reconocidos como terminadores de línea.

Actualmente, los principales líderes de la industria informática como Microsoft, Apple, Oracle, Sun, SAP y otros han adoptado Unicode en sus productos.

Si quieres conocer otros artículos parecidos a Código alfanumérico: Guia Completa puedes visitar la categoría Tecnología.

Ana Castro

Entradas Relacionadas 👇👇