Convertir Señales Analogicas en Digitales: Implementación de Soluciones de Telefonía Ip
Convertir Señales Analogicas en Digitales: Implementación de Soluciones de Telefonía Ip
Convertir Señales Analogicas en Digitales: Implementación de Soluciones de Telefonía Ip
1. MUESTREO
Toda la tecnología digital (audio, video) está basada en la técnica de muestreo (sampling en
inglés). El muestreo digital convierte el voltaje en números (0s y 1s) los cuales pueden ser
fácilmente representados y vueltos nuevamente a su forma original.
RAZÓN DE MUESTREO
1 Hz = 1/seg
24,000 = 24 kHz - 24,000 muestras por segundo. Una muestra cada 1/24,000 de segundo.
30,000 = 30 kHz - 30,000 muestras por segundo. Una muestra cada 1/30,000 de segundo.
¿Qué razón de muestreo es la suficiente para que al ser digitalizada una señal analógica y al
realizar el proceso contrario, digital-analógico, la señal sea idéntica (o casi idéntica) a la original?
La teoría del muestreo define que para una señal de ancho de banda limitado, la frecuencia de
muestreo, fm, debe ser mayor que dos veces su ancho de banda medida en Hertz.
fm > 2·B
Supongamos que la señal a ser digitalizada es la voz, el ancho de banda de la voz es de 4,000 Hz
aproximadamente. Entonces, su razón de muestreo será 2*B= 2*(4,000 Hz), es igual a 8000 Hz,
equivalente a 8,000 muestras por segundo (1/8000). Entonces la razón de muestreo de la voz debe
ser de al menos 8000 Hz, para que pueda regenerarse sin error.
2. CUANTIZACIÓN
Por ejemplo el audio digital [MP3, WAV] tienen dos características bien importantes, el muestreo
(tiempo) y la cuantización (nivel).
Para hacer esto, la amplitud de la señal de audio es representada en una serie de pasos discretos.
Cada paso está dado entonces por un número en código binario que digitalmente codifica el nivel
de la señal. La longitud de la palabra determina la calidad de la representación. Una vez más, una
palabra más larga, mejora la calidad de un sistema de audio (comparando una palabra de 8 bits
con una de 16 bits o 32 bits).
El bit de resolución de un sistema define el rango dinámico del sistema. 6 dB es ganado por cada
bit (se utiliza una escala logarítmica porque la sensibilidad que presenta el oído humano a las
variaciones de intensidad sonora sigue una escala aproximadamente logarítmica, no lineal. Por ello
el belio (B) y su submúltiplo el decibelio (dB), resultan adecuados para valorar la percepción de los
sonidos por un oyente.)
Por ejemplo:
CODIFICACIÓN
A continuación se presenta una tabla donde se representan los números del 0 al 7 con su
respectivo código binario. Como se ve, con 3 bits, podemos representar ocho estados o niveles de
cuantización.
0 000
1 001
2 010
3 011
4 100
5 101
6 110
7 111
La digitalización de la voz resuelve el primer problema, ya que es más fácil enviar un valor
numérico por el cable a cualquier distancia sin que esta se degrade o presente ruido. El segundo
problema se resuelve con TDM (multiplexacion por división de tiempo), permitiendo a la red de voz
enviar múltiples conversaciones al mismo tiempo, ya que las conversaciones han sido digitalizadas,
el numero de valores son transmitidos en periodos específicos de tiempo. La siguiente figura
muestra como se envían 3 conversaciones simultáneas por un canal digital.
En estados Unidos, se utilizan conexiones digitales de voz con la PSTN, estas conexiones
llamadas T1 están constituidas con 24 canales separados cada uno por 64Kbps, conocidos como
Digital Signal 0 (DS0). Cada uno de estos canales soporta una llamada de voz.
Cada trama T1 tiene un bit de trama (F), (1bit + 192bits) = 193 bits
Las líneas digitales T1 envían 8000 de estos 193 bits cada minuto (por el modelo de voz Nyquist se
requieren 8000 muestras cada segundo para reconstruir adecuadamente la señal de voz). Esta es
la razón de porque las líneas T1 tienen un ancho de banda de 1.544Mbps (193 bits por trama *
8000 tramas por segundo) = 1.544.000 bps o 1.544Mbps.
También hay mecanismos de señalización que usan los enlaces, por ejemplo en Colombia, el E1,
al igual que los T1, estos se diferencian en que los enlaces E1 tienen 32 canales, utilizados así:
Algunos sistemas de voz permiten el ahorro en el consumo de ancho de banda al utilizar técnicas
de compresión en la voz antes de ser enviada a través de la red. El método de compresión hace
que varié el tamaño del encabezado del paquete de datos y la calidad del audio.
Los codecs utilizados para la compresión de la voz permiten comprimir el numero de las muestras
que se envían a través de la red haciendo que se use menos ancho de banda, esto es posible
porque al tomar una muestra de voz humana 8000 veces en un segundo produce muchas
muestras que son muy idénticas unas con otras, es decir, que muchas de las muestras tomadas
sonaran iguales.
Por ejemplo, algunos codecs de compresión como el G.729, está habilitado para reducir el ancho
de banda hasta en 8Kbps para cada llamada, desafortunadamente, al reducir el ancho de banda, la
calidad de la voz se ve impactada por este proceso de compresión.
Para medir la calidad de los codecs de voz, se creó un sistema de medida conocido en ingles
como Mean Opinion Score (MOS). La siguiente tabla muestra el resultado del sistema MOS para
calificar algunos de los codecs de compresión de voz utilizados.
Al momento de seleccionar un códec de voz para ser usado en una red, se debe tener en cuenta lo
siguiente respecto al códec:
Paso 1: Determinar el ancho de banda requerido por el códec de audio: Para encontrar la
cantidad de ancho de banda requerido por el códec de audio, se determina el tamaño (en bytes)
del audio contenido en cada paquete. El tamaño de la muestra es un intervalo de tiempo específico
del audio, para la mayoría de codecs de audio, el tamaño de la muestra es de 20 milisegundos
(ms) por defecto.
Se puede usar la siguiente fórmula para determinar el tamaño del paquete de voz:
Bytes_Per_Packet = 1280 / 8
Bytes_Per_Packet = 160
Aquí otro ejemplo de una llamada usando el códec G.729 con una muestra de tamaño 20 ms
Bytes_Per_Packet = 160 / 8
Bytes_Per_Packet = 20
Paso 2: Determinar el encabezado del nivel del modelo OSI del enlace de datos, red y
transporte: Después de encontrar la cantidad de voz contenida en cada paquete, se calcula a
continuación la cantidad de datos contenidos en el encabezado de cada paquete, los siguientes
valores representan la cantidad de bytes del encabezado de cada nivel:
Ethernet: 20 bytes
Frame Relay: 4–6 bytes
Point-to-Point Protocol (PPP): 6 bytes
Para los niveles de transporte y red del modelo OSI, los valores serán:
IP: 20 bytes
Como todos los paquetes de voz usan RTP, UDP, e IP, se puede entonces usar 40 bytes de datos
por paquete en los niveles de red y transporte.
Paso 3: Sumar otros encabezados: Por ejemplo, si se está usando VoIP sobre una conexión
VPN, los siguientes son los valores de los encabezados basados en este tipo de VPN
GRE/L2TP: 24 bytes
MPLS: 4 bytes
IPsec: 50–57 bytes
Paso 4: Sumar todo lo obtenido en los pasos 1, 2 y 3: En este paso se usa la siguiente
ecuación:
Por ejemplo, si se está usando el códec G.729 con 20 ms de tamaño de la muestra en una red
Ethernet, el tamaño del paquete podría darse así:
20 bytes (Paso 1)
-----------------------
Ahora, para encontrar el número de paquetes por segundo, se debe tener en cuenta que cada
paquete contiene una muestra de tamaño 20 ms, y como 1 segundo equivale a 1000 milisegundos,
se toman los 1000 ms / 20 ms = 50 ms. Esto indica que se tomaran 50 paquetes por segundo para
generar un segundo de audio. Con esta información ya se puede encontrar la cantidad de ancho
de banda por llamada.
Paso 5: Mejorar la eficiencia en la red de voz: Para poder ahorrar aun más ancho de banda en
la red de voz, se deberán tener en cuenta dos aspectos más; la Voice Activity Detection (VAD),
actividad en la detección de voz, y la compresión en el encabezado cRTP.
VAD permite al dispositivo de red encargado de enviar la voz, detectar cuando hay silencios en una
conversación VoIP. Al enviar los datos utilizando el protocolo RTP (este protocolo es el
responsable de enviar el flujo continuo de voz por la red), se observa que entre el 35% y 40% de
una llamada telefónica es silencio. Activando VAD se puede ahorrar este ancho de banda.
La compresión de la cabecera RTP, generalmente llamada cRTP, envía el paquete de voz y luego
le saca la información redundante resultando en que los 40 bytes de información que hay en la
cabecera IP/RTP/UDP se comprime a aproximadamente de 2 a 5 bytes. El impacto de este ahorro
en el ancho de banda depende del códec que se utilice, por ejemplo, usando el códec G.711 el
impacto de comprimir las cabeceras de información será menos notorio que si se usara el códec
G.729, ya que la compresión brinda cerca del 40% de ahorro en el ancho de banda cuando se
utiliza el códec G.729.
EJERCICIOS:
Encontrar el ancho de banda de una llamada que usa el códec G.711 con un tamaño de la
muestra de 30 ms si se está transmitiendo la voz sobre una red Ethernet.
Encontrar el ancho de banda de una llamada que usa el códec G.729 con un tamaño de la
muestra de 20 ms si se está transmitiendo la voz sobre una red Frame Relay.
Encontrar el ancho de banda de una llamada que usa el códec iLBC con un tamaño de la
muestra de 15 ms si se está transmitiendo la voz sobre una red PPP mediante una
conexión VPN la cual usa para transportar trafico una conexión MPLS.
Pregunta Proyecto:
Determinar el requerimiento de ancho de banda entre la sede principal y cada una de las oficinas si
se dan las siguientes caracteristicas
CODEC: G.726
cRTP: habilitado
VPN: IPsec