Normas Codificacion de Audio
Normas Codificacion de Audio
Normas Codificacion de Audio
OBJETIVOS
Conocer el estado del arte en codificacin de audio Presentar las principales normas usadas actualmente y sus aplicaciones Clasificar dichas normas atendiendo a diferentes criterios
CONTENIDO
Introduccin a la codificacin de audio Primeras normas Dcada de los 80 Dcada de los 90 Situacin actual Resumen y conclusiones
PARMETROS DE UN CODIFICADOR
CALIDAD OFRECIDA RELACIN DE COMPRESIN RETARDO REQUERIMIENTOS HARDWARE (COSTE): COMPLEJIDAD, MEMORIA.
INTRODUCCIN
ESTNDARES DE CALIDAD
CALIDAD CALIDAD TELEFNICA TELEFNICA RADIO AM RADIO AM REPORTING REPORTING RADIO FM RADIO FM COMPACT DISC COMPACT DISC PRODUCCIN PRODUCCIN BANDWIDTH BANDWIDTH 300-3400 Hz 300-3400 Hz 7 Khz 7 Khz 105 Khz 105 Khz 15 Khz 15 Khz 20 Khz 20 Khz 20 Khz 20 Khz Fmuestreo Fmuestreo 8 Khz 8 Khz 16 Khz 16 Khz 22,05 24 Khz 22,05 --24 Khz 32 Khz 32 Khz 44,1 Khz (*) 44,1 Khz (*) 48 Khz 48 Khz
INTRODUCCIN
PRIMERAS NORMAS
Transmisin telefnica digital Europa y USA siguen caminos diferentes Codificacin PCM CCITT Norma G.711 (1971) Aparicin de los ordenadores personales, desarrollo de Arpanet, satlites, fibra ptica A finales de los 70 aparece el compact disc
PRIMERAS NORMAS
G.711 (CD)
TRANSMISOR
Entrada Analgica
x(t)
Filtro Antisolapamiento
x(nTs)
Muestreo Cuantificacin Robusta Codificador Binario 64 Kbps
Cdigo
ndice
RECEPTOR
ndice Cdigo Decodificador Binario Cuantificador Inverso
xq(nTs)
Filtro Interpolador
xr(t)
PRIMERAS NORMAS
DCADA DE LOS 80
Proliferacin del uso del PC En 1984 aparece el primer DSP Normas de codificacin ms eficientes G.721, J.41 y J.42, NICAM y G.722
DECADA DE LOS 80
G.721
s[n] x[n]
G711- 1
+
xe[n]
e[n]
Q Adaptativo
i[n]
c[n]
Q- 1 Adaptativo
eq [n]
Xr [n]
DECADA DE LOS 80
J.41 y J.42
J.42
Codificacin Codificacin Calidad Calidad Ancho de Banda Ancho de Banda Frec. muestreo Frec. muestreo Bits/muestra Bits/muestra Rgimen binario Rgimen binario Retardo Retardo Complejidad Complejidad Fecha aprobacin Fecha aprobacin PCM PCM Radio AM Radio AM 7 Khz 7 Khz 16 Khz 16 Khz 12 12 192 (3x64) Kbps 192 (3x64) Kbps Despreciable Despreciable Mnimo Mnimo Ao 1.984 Ao 1.984
DCADA DE LOS 80
J.41
PCM PCM Radio FM Radio FM 15 Khz 15 Khz 32 Khz 32 Khz 12 12 384 (6x64) Kbps 384 (6x64) Kbps Despreciable Despreciable Mnimo Mnimo Ao 1.984 Ao 1.984
NICAM
Codificacin Codificacin Calidad Calidad Ancho de Banda Ancho de Banda Frec. muestreo Frec. muestreo Bits/muestra Bits/muestra Rgimen binario Rgimen binario Retardo Retardo Complejidad Complejidad Fecha aprobacin Fecha aprobacin
DCADA DE LOS 80
PCM PCM Radio FM Radio FM 15 Khz 15 Khz 32 Khz 32 Khz 10 10 728 Kbps (estreo) 728 Kbps (estreo) 32 muestras (1 ms) 32 muestras (1 ms) Mnimo Mnimo Abril-87 Abril-87
G.722
16 Kbps
CODIFICADOR ADPCM BANDA SUPERIOR (4-8 Khz) CODIFICADOR ADPCM BANDA INFERIOR (0-4 Khz)
Fs = 16 Khz 14 bits/muestra
MUX
64, 56 48 Kbps
48, 40 32 Kbps
DCADA DE LOS 80
G.722
CALIDAD DEL AUDIO EN FUNCIN DE LA VELOCIDAD DE TRANSMISIN USANDO LA NORMA G.722 (7 Khz) EXCELENTE 5 BUENA 4 VOZ MUSICA
48
64
DCADA DE LOS 80
DCADA DE LOS 90
Proliferacin de aplicaciones multimedia Aumento espectacular de las prestaciones HW Proliferacin de Internet Radio y televisin Digital Codificacin perceptual (calidad subjetiva) G.728, MPEG-1, MPEG-2, MPEG-2 AAC, MPEG-4
DCADA DE LOS 90
G.728
Entrada PCM 64 Kbps Ley A o Ley Conversin a PCM uniforme Buffer formacin vectores
Filtro de Sntesis
- +
Mnimo MSE
Salida 16 Kbps
ndice VQ
DCADA DE LOS 90
MPEG
Moving Picture Experts Group Vdeo, audio y sistema Considera transmisin y almacenamiento Define la trama y funcionamiento del decodificador Codificacin perceptual
DCADA DE LOS 90
MPEG-1
ISO/IEC 11172-3 Hasta dos canales de audio Varios modos (mono, dual, estreo y joint estreo) Tres niveles (capas) de codificacin: Capa 1: DCC Capa 2: DAB Capa 3: MP3 Tres frecuencias de muestreo (32, 441 y 48 Khz) Varios regmenes binarios de salida
DCADA DE LOS 90
MPEG-1
FM
Receptores fijos SNR 50 dB Saturacin del espectro Multitrayecto
DAB
Receptores Mviles Calidad CD Nuevas bandas COFDM (SF) Proteccin errores
DCADA DE LOS 90
MPEG-1
FPB 1 FPB 2 x(n) 32:1 32:1 32:1
Cuantificador 1 Cuantificador 2
Trama AUDIO
FPB 32
Cuantificador 32
MODELO PSICOACSITCO
INFORMACION LATERAL
DCADA DE LOS 90
MPEG-1
5 C A 4 L I 3 D A D 2 (MOS) 1
128 192 2x128 2x120 Bit Rate en Kbit/s para una seal estreo
DCADA DE LOS 90
MPEG-2
ISO/IEC 13818-3 Orientado a televisin digital Ampliacin de MPEG-1: Hasta cinco canales de audio (L,R,C,Ls,Rs) Tres nuevas frecuencias de muestreo (16, 2205 y 24 Khz) Se mantienen las 3 capas de MPEG-1 Compatible con MPEG-1
DCADA DE LOS 90
MPEG-2 AAC
ISO/IEC 13818-7 Alta calidad a 64 Kbps Hasta 48 canales de audio 3 niveles de complejidad (estndar, baja complejidad y frecuencia de muestreo escalable) Frecuencias de muestreo desde 8 hasta 96 Khz Se rompe la compatibilidad con MPEG-1 y MPEG-2
DCADA DE LOS 90
MPEG-4
ISO/IEC 14496-3 Orientado a multimedia interactva Tres tipos de codificadores segn bit rate:
Paramtrico (2-4, 4-16 Kbps) CELP (6-24 Kbps) MPEG-2 AAC (16-64 Kbps)
Escalabilidad a varios niveles (bit rate, ancho de banda y complejidad) Trabaja con objetos media (MPEG-7)
DCADA DE LOS 90
MPEG-4: Versin 2
MPEG-4-versin 2 aade funciones a la versin 1: Mayor proteccin ante errores (reordenacin de las palabras cdigo de Huffman para AAC). Parametrizacin de las propiedades acsticas de una escena, permitiendo presentacin de sonido 3D mejorado, modelado acstico del recinto, etc. Codificacin de audio de bajo retardo para transmisin de audio en comunicaciones bidireccionales. Escalabilidad de bit rate en pasos pequeos (granular). Codificacin paramtrica, pudiendo modificar la escala temporal y el pitch durante la decodificacin.
SITUACIN ACTUAL
MPEG-7: Caractersticas
MPEG-7, denominado MCDI (Multimedia Content Description Interface), ofrece herramientas para describir contenidos multimedia. MPEG-7 est en proceso de definicin, y se espera que exista una versin definitiva para finales del 2003, que permita su posterior estandarizacin. Pretende manejar de forma rpida y eficiente informacin audiovisual (imgenes, grficos, modelos 3D, audio, voz, vdeo, escenarios, ...) para su acceso en internet, libreras digitales, etc. A diferencia de los estndares anteriores, orientados a la codificacin eficiente, MPEG-7 se dirige hacia la bsqueda de informacin audiovisual a partir de descripciones. Si MPEG-4 plantea un cierto nivel de abstraccin (codificacin de objetos), MPEG-7 va a nivel de abstraccin superior (codificacin del conocimiento).
SITUACIN ACTUAL
MPEG-7: Caractersticas
MPEG-7 fija los siguientes objetivos: Definicin de un conjunto de descriptores, esquemas de descripcin y sus relaciones para tratar informacin multimedia diversa. Definicin de un lenguaje especial, llamado DDL (Description Definition Language). Representacin codificada de las descripciones para, por ejemplo, almacenamiento eficiente o acceso rpido de informacin audiovisual. MPEG-7 estandariza la descripcin de informacin audiovisual, pero no su extraccin, permitiendo la incorporacin de nuevos algoritmos de extraccin de caractersticas. MPEG-7 usar los estndares anteriores (MPEG-1 -2 -4) mediante referencias a partes concretas de ellos.
SITUACIN ACTUAL
MPEG-7: Aplicaciones
Acceso a informacin audiovisual en libreras digitales (catlogos de imgenes, diccionarios musicales, ) Servicios de directorio multimedia (pginas amarillas) Seleccin de medios de difusin (canales de radio, TV, ) Edicin multimedia (servicio de noticias electrnicas) Servicios culturales (museos de historia, galeras de arte, etc) Bsqueda de informacin periodstica. Gestin de recursos naturales (remote sensing) y aplicaciones biomdicas Servicios de investigacin (reconocimiento de caractersticas humanas) Entretenimiento (bsqueda de un juego, karaoke) y compras. Archivos de radio, vdeo y cine.
SITUACIN ACTUAL
1.990
MPEG-1 1992 NICAM (728 Kbps,estreo) 1987 J.41 (384 Kbps) 1984 CD (1,5 Mbps)
G.711 1.980 (64 Kbps) 1971 300-3.400 Hz (Telefnica) 7 Khz (AM) 105 Khz 15 Khz (Reporting) (FM)
CONCLUSIONES