Vacilar: Dither: ruido visual en la visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es el tramado
El tramado es una forma de ruido aplicada intencionalmente que se utiliza para aleatorizar el error de cuantificación, evitando patrones a gran escala, como bandas de color en las imágenes. El tramado se utiliza habitualmente en el procesamiento de datos de audio y vídeo digitales y, a menudo, es una de las últimas etapas de la masterización de audio en un CD.
Cómo se beneficiará
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Tramado
Capítulo 2: Convertidor analógico a digital
Capítulo 3: Rango dinámico
Capítulo 4: Relación señal-ruido
Capítulo 5: Medios tonos
Capítulo 6: Comparación de grabación analógica y digital
Capítulo 7: Artefacto de compresión
Capítulo 8: Muestreo (procesamiento de señal)
Capítulo 9: Cuantización (procesamiento de señal)
Capítulo 10: Escala de grises
(II) Respondiendo a las principales preguntas del público sobre el tramado.
(III) Ejemplos del mundo real sobre el uso del tramado en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos para cualquier tipo de Dither.
Autores relacionados
Relacionado con Vacilar
Títulos en esta serie (100)
Visión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeometría proyectiva: Explorando la geometría proyectiva en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Antialiasing: Mejora de la claridad visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconocimiento de voz audiovisual: Avances, aplicaciones y conocimientos Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesAlgoritmo de dibujo lineal: Dominar técnicas para la representación de imágenes de precisión Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de datos: Liberando la eficiencia en visión por computadora con compresión de datos Calificación: 0 de 5 estrellas0 calificacionesRepresentación de alto rango dinámico: Desbloqueando el espectro visual: técnicas avanzadas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSensores Automotrices y Análisis de Ondas de Osciloscopio Calificación: 0 de 5 estrellas0 calificacionesEliminación de líneas ocultas: Revelando lo invisible: secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesReconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesEl arte del revelado Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPerfil de color: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesGráfico de trama digital: Revelando el poder de los gráficos rasterizados digitales en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesIluminación global: Visión avanzada: conocimientos sobre la iluminación global Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Guía para seres pensantes Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesKlara y el Sol Calificación: 5 de 5 estrellas5/5Máquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Metodología de la programación Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Arquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesPHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesComputación en la nube: Estrategias de cloud computing en las empresas Calificación: 0 de 5 estrellas0 calificacionesChatGPT Guía Para Principiantes Cómo Usar la Inteligencia Artificial Generativa de OpenAI en tu Vida Calificación: 0 de 5 estrellas0 calificacionesMonetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5¿Cómo piensan las máquinas?: Inteligencia artificial para humanos Calificación: 5 de 5 estrellas5/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Programación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesDiseño de algoritmos y su programación en C Calificación: 0 de 5 estrellas0 calificacionesEstructuras de Datos Básicas: Programación orientada a objetos con Java Calificación: 5 de 5 estrellas5/5El modelo para ganar dinero de ChatGPT para emprendedores Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Vacilar
0 clasificaciones0 comentarios
Vista previa del libro
Vacilar - Fouad Sabry
Capítulo 1: Tramado
El tramado es un tipo de ruido deliberado que se utiliza para aleatorizar el error de cuantificación, evitando así patrones a gran escala, como las bandas de color en las fotografías. El tramado se emplea comúnmente en el procesamiento de datos digitales de audio y video, y con frecuencia es uno de los pasos finales en la masterización de audio para un CD.
Normalmente, el tramado se utiliza para transformar una imagen en escala de grises a blanco y negro, de modo que la densidad de puntos negros en la imagen resultante se aproxime al nivel de gris medio de la imagen original.
… Una de las primeras [aplicaciones] de tramado se produjo en la Segunda Guerra Mundial.
Los bombarderos utilizaban computadoras mecánicas para la navegación y el cálculo de la trayectoria de las bombas.
Curiosamente, estas computadoras (cajas que contienen cientos de engranajes y engranajes) funcionaban con mayor precisión a bordo del avión y estaban menos sólidamente establecidas.
Los ingenieros notaron que la vibración de la aeronave minimizaba el error causado por las partes móviles pegajosas.
En lugar de moverse en tirones rápidos, debes moverte suavemente, se movieron con mayor consistencia.
Se incluyeron motores vibratorios en miniatura en las computadoras, el término dither
se derivó del verbo del inglés medio didderen
, que significa sacudir
. Hoy en día, cuando se toca un medidor mecánico para mejorar su precisión, los diccionarios modernos definen el tramado como un estado mental profundamente ansioso, confuso o agitado.
En cantidades minúsculas, Dither hace que un sistema digital sea más analógico en el sentido positivo de la palabra.
— Ken Pohlmann, Principios del audio digital
Poco después de la Segunda Guerra Mundial, el término tramado se publicó en la literatura sobre computación analógica y armamento de accionamiento hidráulico.
El tramado se aplica en numerosos campos que incluyen el procesamiento y el análisis digital. Estas aplicaciones incluyen audio digital, video digital, fotografía digital, sismología, radar y sistemas de pronóstico meteorológico que requieren procesamiento de señal digital.
La cuantificación produce error. Si esta inexactitud está asociada con la señal, entonces el resultado puede ser cíclico o predecible. En algunos dominios, particularmente aquellos en los que el receptor es sensible a tales distorsiones, los errores cíclicos dan lugar a artefactos no deseados. La introducción de tramado en estas áreas transforma el error en ruido aleatorio. La industria del audio es un buen ejemplo de ello. El oído humano actúa de manera similar a una transformada de Fourier en el sentido de que detecta distintas frecuencias.
En un sistema analógico, la señal es continua, mientras que en un sistema digital PCM, la amplitud de la señal está confinada a uno de un conjunto fijo de valores o números. Este método se conoce como cuantización. Cada valor codificado es un paso discreto; Si una señal se cuantifica sin tramado, habrá distorsión de cuantificación asociada con la señal de entrada original... Para evitar esto, la señal es difuminada
, un procedimiento que matemáticamente elimina los armónicos y otras distorsiones altamente indeseables y los reemplaza con un nivel constante y fijo de ruido.
Durante el proceso de producción, a menudo se utiliza un mayor número de bits para representar cada muestra; Esto debe reducirse a 16 bits para crear un disco compacto.
Hay numerosas formas de lograr esto. Uno puede, por ejemplo, descartar los bits adicionales; Esto se conoce como truncamiento. Además, se pueden redondear los bits sobrantes al valor más cercano. Cada una de estas estrategias, sin embargo, produce fallas que son predecibles y calculables. El tramado sustituye estas imprecisiones por un nivel de ruido continuo y fijo.
Ejemplos de ejemplo de audio de truncamiento de 6 bits
Sinusoide de 16 bits
reducido a seis bits
reducido a 6 bits
¿Tiene problemas para reproducir estos archivos? Consulte el soporte multimedia.
Tomemos, por ejemplo, una forma de onda con los siguientes valores:
1 2 3 4 5 6 7 8
Si la forma de onda se reduce en un 20%, se obtienen los siguientes valores:
0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4
Si se acortan estos valores, los datos resultantes son los siguientes:
0 1 2 3 4 4 5 6
Si, en cambio, estos valores se redondean, se obtienen los siguientes datos:
1 2 2 3 4 5 6 6
La técnica de disminuir la amplitud de cualquier forma de onda original en un 20 por ciento da como resultado errores consistentes. Considere una onda sinusoidal que, para una porción, cumple con los parámetros antes mencionados. Como se muestra en el ejemplo anterior, cada vez que el valor de la onda sinusoidal alcanza 3,2, el resultado acortado sería incorrecto en 0,2. Siempre que el valor de la onda sinusoidal alcanzara 4,0, no habría ningún error porque el resultado acortado estaría desviado en 0,0, como se ilustró anteriormente. A lo largo del ciclo de la onda sinusoidal, la magnitud del error varía regular y repetidamente. Este error se revela específicamente como distorsión. Lo que el oído percibe como distorsión es la información adicional a frecuencias discretas que resulta de un error de cuantificación recurrente.
Un posible enfoque sería redondear el número de dos dígitos (por ejemplo, 4,8) en cualquier dirección. Podría redondearse a cinco una vez y luego a cuatro la siguiente. Esto haría que el promedio a largo plazo fuera de 4,5 en lugar de 4, lo que acercaría el valor a su valor real a lo largo del tiempo. Sin embargo, esto todavía da como resultado un error determinable (aunque más intrincado). Cada dos veces que se encuentra el valor 4,8, el resultado es un error del 0,2 por ciento, y las otras veces, el error es 0,8. Esto sigue dando lugar a un error cuantificado y repetido.
Una opción alternativa sería redondear 4,8 para que cuatro de cada cinco veces se redondee a 5, y la quinta vez se redondee a 4. A largo plazo, esto promediaría exactamente 4,8. Desafortunadamente, todavía resulta en fallas recurrentes y predecibles, y estas fallas continúan mostrándose como distorsión audible.
Esto da como resultado la solución de tramado. En lugar de redondear hacia arriba o hacia abajo de una manera predecible y repetitiva, es posible redondear hacia arriba o hacia abajo al azar. Si se crea una serie de números aleatorios entre 0,0 y 0,9 (por ejemplo, 0,6, 0,1, 0,3, 0,6, 0,9, etc.) y se suman a 4,8, dos de cada diez veces el resultado se truncará a 4 (si se suman 0,0 o 0,1 a 4,8), y ocho de cada diez veces el resultado se truncará a 5. Cada condición tiene un 20% de probabilidad de ser redondeada a 4 y un 80% de probabilidad de ser redondeada a 5. El promedio a largo plazo de estos resultados es de 4,8, y su error de cuantificación es ruido aleatorio. Este ruido es menos desagradable para el oído que la distorsión medible producida por otras soluciones.
Antes de la cuantificación o recuantificación, se introduce el tramado para desacoplar el ruido de cuantificación de la señal de entrada y evitar el comportamiento no lineal (distorsión). La cuantificación con una profundidad de bits más baja requiere más tramado. La técnica sigue dando lugar a una distorsión, pero la distorsión es aleatoria, por lo que el ruido resultante está esencialmente descorrelacionado con la señal deseada.
Lipshitz y Vanderkooi demostraron en un estudio seminal publicado en el AES Journal que diferentes tipos de ruido con distintas funciones de densidad de probabilidad (PDF) reaccionan de manera diferente cuando se emplean como señales de tramado, Dither se puede utilizar para romper ciclos límite periódicos, un problema típico con los filtros digitales. Por lo general, el ruido aleatorio es menos molesto que los tonos armónicos producidos por los ciclos límite.
Función de densidad de probabilidad rectangular (RPDF) Cualquier valor dentro del rango definido tiene la misma probabilidad de ocurrir dentro del ruido de tramado.
Función de densidad de probabilidad triangular (TPDF) El ruido de tramado tiene una distribución triangular; La probabilidad de ocurrencia es mayor para los valores en el medio del rango. Es posible obtener una distribución triangular combinando dos fuentes RPDF separadas.
La distribución gaussiana de PDF tiene una distribución normal. Esta curva en forma de campana o gaussiana es característica del tramado generado por fuentes analógicas como los preamplificadores de micrófono. Si la profundidad de bits de una grabación es suficiente, el ruido del preamplificador será adecuado para tramar la grabación.
El modelado de ruido es un procedimiento de filtrado que modifica la energía espectral del error de cuantificación, a menudo para restar importancia a las frecuencias a las que el oído es más sensible o para separar completamente las bandas de señal y ruido. El hecho de que el tramado se inserte dentro o fuera del bucle de retroalimentación del modelador de ruido afecta a su espectro final si se utiliza. Si está dentro, el tramado se considera como parte de la señal de error y se forma junto con el error de cuantificación real. Si está fuera de la ventana de cuantificación, el tramado se trata como parte de la señal original y linealiza la cuantificación sin tener forma en sí misma. En este caso, el ruido de fondo final es igual a la suma del espectro de tramado plano y el ruido de cuantificación curvo. Si bien la conformación del ruido en el mundo real