Tesis > Documento


Ver el documento (formato PDF)   Gómez Fernández, Francisco Roberto.  "Estimación de movimiento en secuencias de imágenes RGB y RGB-D"  (2016-03-30)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
URL:
     
Resumen:
El movimiento es una característica fundamental para el procesamiento de video y sus posteriores aplicaciones. La estimación de movimiento en video es de gran utilidad para definir la correspondencia de puntos en una escena, calcular sus velocidades y así poder discriminar objetos, acciones, segmentar movimiento, etc. El objetivo de este trabajo es realizar un seguimiento preciso y una estimación de movimiento de un gran conjunto de puntos. Esto se conoce como estimación densa de movimiento. Para ello, se proponen dos líneas principales de estudio: modelos estadísticos de movimiento utilizando texturas dinámicas y el cálculo del flujo óptico minimizando la energía con graph cuts, en ambos casos considerando secuencias de imágenes RGB y RGB-D. El modelo de texturas dinámicas está muy bien condicionado para la segmentación de movimiento, y dentro de este contexto desarrollamos una aplicación con características novedosas: (i) proceso de aprendizaje desacoplado y (ii) algoritmos optimizados para trabajar en placas gráficas GPU (Graphic Process Unit). Además, el modelo ha sido extendido para contemplar secuencias de imágenes RGB-D, el cual no había sido estudiado hasta el momento, permitiéndonos identificar procesos visuales en 3D. Experimentos sobre la base de datos DynTex muestran resultados exitosos de performance y de clasificación para la mayoría de las casos. Luego, nuestros análisis sobre secuencias RGB-D revelan la viabilidad de este modelo para aplicaciones 3D. El problema de la estimación del flujo óptico (optical flow) fue abordado mediante la minimización de la energía del campo de vectores utilizando la técnica de graph cuts con una formulación novedosa de la energía. Ampliamos esta formulación para tener en cuenta la profundidad y así calcular el flujo de la escena (scene flow). Hasta donde sabemos, en la literatura, nunca se había utilizado graph cuts para estimar el scene flow. Los resultados obtenidos sobre el dataset Middlebury muestran que nuestros algoritmos son competitivos comparados con los presentes en el estado del arte y los mejores con en términos de error angular.

Abstract:
Motion is a fundamental cue for video processing and its further applications. Video motion estimation is very useful to find correspondences of points in a scene, computing their velocities, discriminate objects, actions, segment motion, etc. The aim of this work is to accurately track the motion of a large set of points in videos. This is known as dense motion estimation. To this end, two main lines of study were proposed: statistical models of motion using dynamic textures and optical flow calculation using graph cuts for energy minimization, considering in both cases sequences of RGB and RGB-D images. The dynamic textures model is well suited for motion segmentation, and in this context we develop an application with novel features: (i) a decoupled learning step (ii) GPU-translated algorithms optimized to work on GPU (Graphic Process Unit). Also, the model has been extended to process RGB-D sequences, which had not been studied so far, allowing us to identify visual processes in 3D. Experiments on the Dyntex dataset show successful results of performance and classification for most cases. Then our analysis of RGB-D sequences reveal the viability of this model for 3D applications. The problem of optical flow estimation was addressed by minimizing the energy of the vector field using the graph cuts method with a novel formulation of energy. We extend this formulation to take depth into account and thus estimate the Scene Flow. To the best of our knowledge, scene flow estimation using graph cuts has never been used in the literature. The results obtained on the Middlebury dataset show that our algorithms are competitive with the state of the art and the best performing in terms of angular error.

* A este resumen le pueden faltar caracteres especiales. Consulte la versión completa en el documento en formato PDF

Registro:
Título : Estimación de movimiento en secuencias de imágenes RGB y RGB-D     =    Motion estimation in RGB and RGB-D image sequences
Autor : Gómez Fernández, Francisco Roberto
Director : Mejail, Marta
Pardo Piccone, Alvaro D.
Consejero : Mejail, Marta
Jurados : Gómez, Juan Carlos  ; Ferreira Vázquez, Enrique  ; Wachs, Juan P.
Año : 2016-03-30
Editor : Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación : Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Departamento de Computación
Grado obtenido : Doctor de la Universidad de Buenos Aires en el área de Ciencias de la Computación
Ubicación : Preservación - http://digital.bl.fcen.uba.ar/gsdl-282/cgi-bin/library.cgi?a=d&c=tesis&d=Tesis_5985_GomezFernandez
Idioma : Inglés
Area Temática : Computación / Procesamiento de Imágenes
Computación / Reconocimiento de Patrones
Palabras claves : ESTIMACION DE MOVIMIENTO; TEXTURAS DINAMICAS; OPTICAL FLOW; SCENE FLOW; GRAPH CUTS; MOTION ESTIMATION; DYNAMIC TEXTURES; OPTICAL FLOW; SCENE FLOW; GRAPH CUTS
URL al Documento : 
URL al Registro : 
hola chau _gs.DocumentHeader_ chau2 _documentheader_ chau3
Estadísticas:
     http://digital.bl.fcen.uba.ar
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34