Estimación de movimiento: Avances y aplicaciones en visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la estimación de movimiento
En visión por computadora y procesamiento de imágenes, la estimación de movimiento es el proceso de determinar vectores de movimiento que describen la transformación de una imagen 2D a otra; generalmente de fotogramas adyacentes en una secuencia de vídeo. Es un problema mal planteado ya que el movimiento ocurre en tres dimensiones (3D), pero las imágenes son una proyección de la escena 3D en un plano 2D. Los vectores de movimiento pueden referirse a la imagen completa o a partes específicas, como bloques rectangulares, parches de formas arbitrarias o incluso por píxel. Los vectores de movimiento pueden representarse mediante un modelo traslacional o muchos otros modelos que pueden aproximarse al movimiento de una cámara de video real, como rotación y traslación en las tres dimensiones y zoom.
Cómo lo harás beneficio
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Estimación_de_movimiento
Capítulo 2: Compensación_de_movimiento
Capítulo 3: Algoritmo_de_coincidencia de bloques
Capítulo 4: H.261
Capítulo 5: H.262/MPEG-2_Part_2
Capítulo 6: Codificación_de_vídeo_avanzada
Capítulo 7: Compensación_de_movimiento_global
Capítulo 8: Coincidencia_de_bloques_y_filtrado_3D
Capítulo 9: Tipos_de_imagen_de_compresión_de_vídeo
Capítulo 10: Superresolución_de_vídeo
(II) Respondiendo a las principales preguntas del público sobre la estimación de movimiento.
(III) Ejemplos del mundo real para el uso de la estimación de movimiento en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de estimación de movimiento.
Relacionado con Estimación de movimiento
Títulos en esta serie (100)
Modelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesGeometría proyectiva: Explorando la geometría proyectiva en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de escala: Explorando las dimensiones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Flujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesReconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesIluminación global: Visión avanzada: conocimientos sobre la iluminación global Calificación: 0 de 5 estrellas0 calificacionesMosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesRepresentación de gráficos por computadora: Explorando el realismo visual: conocimientos sobre gráficos por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de polígono: Explorando la intersección de gráficos por computadora poligonales y visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráfico de trama digital: Revelando el poder de los gráficos rasterizados digitales en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos vectoriales: Potenciando la creación visual con algoritmos avanzados Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Introducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Guía para seres pensantes Calificación: 0 de 5 estrellas0 calificacionesProgramación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesKlara y el Sol Calificación: 5 de 5 estrellas5/5Cómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesMecatrónica Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Máquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Desarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesChatGPT La Máquina de Dinero del 2024 De Novato a Prodigio en el Uso de Indicaciones de manera Rápida. Un Curso Completo para Principiantes en Inteligencia Artificial. Calificación: 0 de 5 estrellas0 calificacionesLa IA curso de Inteligencia Artificial de principiante a experto: Curso de campo aprenderas todo sobre la inteligencia Artificial explicado paso a paso para mejor entendimiento Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: chatgpt práctico para empresas Calificación: 0 de 5 estrellas0 calificacionesCHATGPT: Obtén el máximo rendimiento a la Inteligencia Artificial Generativa Calificación: 0 de 5 estrellas0 calificacionesEl modelo para ganar dinero de ChatGPT para emprendedores Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesMonetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Diseño de algoritmos y su programación en C Calificación: 0 de 5 estrellas0 calificacionesDominar Chatbot GPT: Una guía completa para desbloquear el poder de las conversaciones de IA para su negocio Calificación: 0 de 5 estrellas0 calificacionesLibertad Financiera con ChatGPT y Prompt Engineering Aprende Cómo Hacer Dinero Online sin Trabajar Gracias a la Inteligencia Artificial Generativa con Prompts en Español Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesEstructuras de Datos Básicas: Programación orientada a objetos con Java Calificación: 5 de 5 estrellas5/5ChatGPT Guía Para Principiantes Cómo Usar la Inteligencia Artificial Generativa de OpenAI en tu Vida Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Arquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesAgile Calificación: 5 de 5 estrellas5/5
Comentarios para Estimación de movimiento
0 clasificaciones0 comentarios
Vista previa del libro
Estimación de movimiento - Fouad Sabry
Capítulo 1: Estimación de movimiento
La estimación de la cantidad de movimiento entre dos imágenes 2D, normalmente a partir de fotogramas sucesivos en una secuencia de vídeo, se conoce como estimación de movimiento. El movimiento se produce en tres dimensiones, pero las imágenes son proyecciones de la escena tridimensional en un plano bidimensional, lo que hace que este sea un problema mal planteado. La estimación de movimiento se puede realizar en toda la imagen (estimación de movimiento global) o en regiones más pequeñas o píxeles individuales. El modelo de traslación es solo uno de los muchos que se pueden usar para representar los vectores de movimiento, que pueden incluir cosas como la rotación, la traslación en las tres dimensiones y el acercamiento y alejamiento.
La estimación de movimiento y el flujo óptico a menudo se usan indistintamente, pero significan lo mismo. El registro de imágenes y la correspondencia estereoscópica también se relacionan de esta manera. En realidad, cada una de estas expresiones describe un método para localizar entidades coincidentes en fotografías o fotogramas de vídeo sucesivos. Los puntos en dos fotografías (fotogramas) de la misma escena o elemento del mundo real son típicamente
el mismo punto en el espacio y el tiempo. La métrica de coincidencia, una medida de la similitud de dos puntos de imagen, debe definirse antes de que pueda comenzar la estimación de movimiento. No hay una respuesta universalmente correcta aquí; Más bien, la métrica de coincidencia óptima dependerá del propósito del movimiento estimado y del enfoque de optimización empleado durante la fase de estimación.
Basándose en la ubicación del mismo macrobloque o de uno comparable en una imagen diferente, conocida como imagen de referencia, se crea un vector de movimiento para representar el macrobloque en cuestión en la imagen original.
De acuerdo con el estándar H.264/MPEG-4 AVC, el vector de movimiento se define como:
Las coordenadas de la imagen decodificada se desplazan con respecto a las coordenadas de la imagen de referencia a través de un vector bidimensional llamado vector de movimiento, que se utiliza para la predicción intermedia.
Se pueden utilizar tanto los enfoques basados en píxeles («directos») como los basados en características («indirectos») para localizar vectores de movimiento («indirectos»). Se escribieron dos artículos, uno de cada lado de una controversia bien conocida, en un esfuerzo por llegar a una resolución.
Algoritmo para hacer coincidir bloques
Técnicas basadas en la correlación de fases y en el dominio de la frecuencia
Algoritmos recursivos de píxeles
Flujo óptico
Las técnicas indirectas emplean características como la detección de esquinas para encontrar coincidencias en fotogramas adyacentes, normalmente mediante la aplicación de una función estadística en una región pequeña o grande. El objetivo de la función estadística es filtrar las coincidencias de movimiento erróneas.
RANSAC es un ejemplo de una función estadística útil.
Se puede argumentar que la definición de los criterios de coincidencia es un paso necesario en prácticamente cualquier enfoque. La única distinción real es entre comparar primero cada píxel (como con el cuadrado de la diferencia) y luego resumir sobre una región de imagen local (como con los enfoques basados en características) o viceversa (bloquear el movimiento base y el movimiento basado en filtros). Un nuevo método de coincidencia de criterios funciona resumiendo primero una región de imagen local en cada ubicación de píxel (utilizando alguna transformación de características como la transformada laplaciana) y, a continuación, comparando los dos conjuntos de resúmenes. Si bien algunos criterios de coincidencia pueden eliminar pares de elementos de datos que realmente no pertenecen juntos mientras tienen una puntuación de coincidencia alta, otros criterios de coincidencia no pueden.
En la visión artificial y el procesamiento de imágenes, la estimación del movimiento afín se utiliza para calcular una aproximación aproximada del movimiento relativo de dos imágenes o fotogramas. Supone que el movimiento se puede representar mediante una transformación lineal seguida de una traslación y rotación (transformación afín).
La compensación de movimiento es el proceso de utilizar los vectores de movimiento de una imagen para generar una nueva transformación.
La estimación y compensación de movimiento son componentes esenciales de la compresión de vídeo porque permiten el uso de redundancia temporal. Casi todos los estándares de codificación de vídeo, incluido el HEVC más actual, utilizan la estimación y compensación de movimiento basada en bloques.
Reconstruir la geometría 3D de una escena a partir de imágenes de cámara en movimiento es de lo que se trata la localización y el mapeo simultáneos.
{Fin del capítulo 1}
Capítulo 2: Compensación de movimiento
Al predecir el siguiente fotograma de un vídeo en función de los fotogramas anteriores y posteriores, la compensación de movimiento es una técnica algorítmica que se utiliza para tener en cuenta el movimiento de la cámara y/o del objeto. Se utiliza para crear archivos MPEG-2 y otros formatos de compresión de vídeo mediante la codificación de datos de vídeo. Con la transformación de una imagen de referencia a la imagen actual, la compensación de movimiento proporciona una descripción de la imagen. El período temporal de la imagen a la que se hace referencia no está limitado. La eficiencia de compresión mejora cuando se pueden sintetizar nuevas imágenes a partir de las antiguas con alta precisión.
En los estándares de codificación de vídeo, la compensación de movimiento y la transformada discreta de coseno son las dos técnicas de compresión de vídeo (DCT) más importantes. La codificación híbrida de compensación de movimiento en bloque (BMC) o DCT con compensación de movimiento (MC-DCT) se usa comúnmente en la mayoría de los estándares de codificación de video, como los formatos H.26x y MPEG (MC DCT).
La corrección de movimiento aprovecha el hecho de que la cámara o un objeto en la posición cambiante del fotograma suele ser la única diferencia entre los fotogramas sucesivos de una película. Esto significa que es muy probable que los datos utilizados para representar un fotograma de un clip de vídeo sean idénticos a los datos utilizados para representar el fotograma siguiente.
Cuando se utiliza la compensación de movimiento, una secuencia de vídeo tendrá unos pocos fotogramas completos (de referencia) y los fotogramas restantes solo contendrán los datos necesarios para convertir uno en el siguiente.
A continuación se muestra una descripción gráfica simplificada de cómo funciona la compensación de movimiento. Se tomaron dos fotogramas consecutivos de la película Elephants Dream. Debido a que incluye menos información, la diferencia inferior (con compensación de movimiento) entre dos fotogramas se comprime mucho mejor que las otras imágenes. Por lo tanto, los datos necesarios para codificar una trama compensada serán significativamente menores que los necesarios para codificar una trama diferente. Esto también significa que también es posible codificar la información utilizando una imagen diferente a un costo de menor eficiencia de compresión, pero ahorrando complejidad de codificación sin codificación compensada por movimiento; De hecho, la codificación con compensación de movimiento (junto con la estimación de movimiento, la compensación de movimiento) ocupa más del 90 por ciento de la complejidad de la codificación.
Las imágenes en MPEG se anticipan hacia atrás desde los fotogramas anteriores (fotogramas P) o hacia delante desde