Medidas de información (bit, byte)


Bit
Un elemento biestable (con dos posibles estados) en el que se distinguen dos valores claramente diferenciados es una variable binaria. Con propósitos de representación, se escribirán los dos posibles valores de la variable binaria vendrá dado por un dígito binario que valdrá 0 ó 1.
Como el término dígito binario es algo largo de escribir, se abrevia con la palabra Bit, que proviene de la contracción de la expresión inglesa BInary digiT y que además de inglés significa trocito. Decir que se tiene un bit será, pues, una manera corta de decir que se tiene una variable binaria, un dígito binario, que puede tomar el valor 0 ó el valor 1. Se puede codificar cualquier alfabeto de partida en binario, o sea, mediante bits. Cuantos más símbolos contenga el alfabeto, más número de bits harán falta para codificarlo, pero en definitiva no hay información que no se pueda codificar en binario. La prueba es que hoy día, tanto la información visual como la auditiva de alta fidelidad se codifica en binario.
Byte

Como el bit es una unidad de medida tan pequeña, se acostumbra usar unidades de magnitud superior. El byte es el conjunto de 8 bits. Así, en lugar de decir que un mensaje tiene 32 bits, se puede decir que tiene 4 bytes (1 byte = 8 bits).
En la memoria de un computador, un byte suele ser la unidad de direccionamiento, es decir, es posible referirse a cada byte mediante un número que es su dirección. Los bytes de la memoria se numeran así: el primer byte es el 0, el segundo es el 1, etcétera.
Un byte puede almacenar 8 dígitos binarios, es decir, dos dígitos hexadecimales. El número de valores posibles que se pueden almacenar es de 28=256.
Los bits de un byte se numeran de derecha a izquierda del 0 al 7, es decir, se corresponden con los exponentes de las potencias de base 2. La agrupación de los 4 bits (superiores o inferiores) de un byte se llama nibble. Por tanto, un byte contiene 2 nibbles. El que corresponde a los bits 0 a 3 se llama nibble inferior, y el de los bits 4 a 7 se llama nibble superior. El nibble es una unidad de trabajo mucho más cómoda que el bit. En cada nibble se almacena un dígito hexadecimal.

Caracter

Es la unidad de información en el nivel del alfabeto humano. Un carácter es, de echo, cualquier símbolo del alfabeto usado como alfabeto normal. Constituye una buena medida de información en términos directamente aplicables a textos expresados en el alfabeto humano.
Los caracteres se pueden clasificar en:
  • Alfabéticos: Letras y algún otro carácter similar.
  • Numéricos: Los dígitos numéricos del 0 al 9.
  • Especiales: Todos los restantes (signos de puntuación, signos monetarios, signos de operaciones aritméticas, etcétera).
Normalmente, en un computador, para representar un carácter se usa el tamaño de 1 byte.

Múltiplos (K, M y G)

Cuando las cantidades de información por medir son grandes, se utilizan múltiplos de las unidades relacionadas:
  • La K es un factor de multiplicación de 210=1.024.  Así que 1 Kbit =1.024 bits y 1 Kbyte = 1.024 bytes = 8.192 bits. Se toma el valor de 1.024 en vez de 1.000, precisamente por ser 1.024 una potencia de 2 y, en consecuencia, un valor mucho más conveniente para máquinas que trabajan en sistema binario.
  • La M es la abreviatura de Mega y representa el factor de multiplicación 220 = 1.048.576.
  • La G es abreviatura de Giga y representa el factor de multiplicación 230 =1.073.740.824.
Representación de números naturales. Código binario natural. Coincide con el sistema de numeración binario:
0  000  1  001
2  010  3  011
4  100  5  101
6  110  7  111
Códigos BCD

Con estos códigos se representa cada dígito decimal (por separado) con un número determinado de bits (como mínimo, 4). Eso es lo que quieren decir las siglas BCD: Binary Code Decimal, o Decimal Codificado en Binario. Codificando cada dígito decimal con 4 bits, usando directamente el código binario natural, se tiene el código BCD natural. Con otros tipos de codificaciones para cada dígito se tendrán otros códigos BCD, como el código 5421, en el que cada dígito se codifica con 4 bits a los que se les asignan los pesos 5-4-2-1, o el código Aitken, en el que se codifica cada dígito decimal con 4 bits a los que se les asignan los pesos 2-4-2-1.

Representación de números enteros





Se tienen fundamentalmente dos opciones: signo-magnitud. Con esta representación se reserva un bit para almacenar el signo del número entero (ejemplo, 0 * positivo, 1 * negativo) y el resto para la magnitud del número (su valor absoluto).
Exceso a un entero Z. Con esta representación se suma al entero Z el número por representar, y luego se representa en binario. Por ejemplo, para representar el número -3 en exceso a 8, se hace:
-3+8 =5 * -310 = 0101exc-8
3.1.5 representación de números reales.

Se tienen también dos opciones: representación en coma fija. Se tendrá un número fijo de bits para representar la parte decimal (entera) del número, y otro número fijo de bits para representar la parte fraccionaria. Se tendrá que llegar a un convenio para decidir el número de bits usados para cada una de esas partes. También se tendrá que reservar un bit para el signo del número.
Un ejemplo: si se dispone de un byte para representar cada número real, podría se el siguiente: 1 bit de signo, 4 bits para la parte entera y 3 para la parte fraccionaria.
Representación en coma flotante. Se basa en el principio matemático de que cualquier número real N que esté una base b se puede expresar como N = MbE, donde M recibe el nombre de mantisa y E es un exponente. Gracias a esta propiedad, el problema de representar el número N se reduce a representar M y E (no hace falta representar b, ya que se supone conocida). Por ejemplo, se puede aplicar lo anterior para el número 38,410:
38,8 = 384*10-1 = 0,384*102 = 3,84*101 = 3840*10-2...

Como se ve, no existe una representación única de la forma N =M*bE. En realidad, existen infinitas. Se opta siempre por una de las dos primeras mostradas: mantisa entera sin ceros a la derecha o mantisa fraccionaria sin ceros tras el punto (son los dos modos normalizados que se usan). Si se dispone de n bits para la mantisa y q bits para el exponente (n=p+q). Por ejemplo, si se dispone de 16 bits para cada número, y se usa 6 para el exponente (uno de ellos también para el signo de la mantisa) y se quiere representar el número -3,510, se haría:
-3,510=-11,12 =-0,111*1010

Como se ve, lo primero que se hace es pasar el número a binario, y luego se obtiene una de las dos representaciones normalizadas. En este caso se ha supuesto que se trabaja con mantisa fraccionaria sin ceros tras el punto.

Ventajas del sistema binario

Como ya se ha comentado, el sistema con el que trabajan los computadores es el sistema binario. Las razones para ello son las siguientes: toda la circuitería lógica necesaria para procesar la información en binario (decodificadores, etcétera) es relativamente sencilla de diseñar y está sumamente estudiada. La aritmética de base 2 es la más fácil de implementar.
Las reglas de suma, resta, multiplicación y división son las más breves y simples a la hora de construir un circuito lógico que las cumpla. Al disponer de sólo dos símbolos (0 y 1), las tablas son muy simples:

        +    x 
0  0  0    0
0  1  1    0
1  0  1    0
1  1  10  1

La circuitería que "recuerda" estas tablas es simple; la circuitería que "recordará" las tablas para, por ejemplo, base 10, tendría que ser forzosamente voluminosa y costosa en su construcción.
Existe multitud de dispositivos biestables (con 2 estados) que se pueden emplear para almacenar información codificada en binario. Se trata de disponer de una variable física en la que se distingan dos valores de referencia suficientemente diferenciados como para evitar estados ambiguos. Por ejemplo: corriente eléctrica (voltaje): distinguir entre 10 ó más niveles de voltaje es delicado y car; distinguir entre pasa/no pasa corriente es muy económico y concede un amplio margen de tolerancia. Intensidad de luz: luz apagada/luz encendida. Perforación en papel o cartulina.
Sentido de magnetización: distinguir entre distintos valores de campo magnético es complicado; distinguir entre magnetización Norte-Sur y su contraria Sur-Norte es mucho más fácil y fiable.

Comentarios

Entradas populares