Tesis > Documento


Ver el documento (formato PDF)   Bali, Juan Lucas.  "Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes"  (2012)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
URL:
     
Resumen:
En muchas situaciones prácticas, los datos se registran sobre un período de tiempo o corresponden a imágenes. Por esta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar de discretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamente usado para describir los principales modos de variación de las observaciones es el de componentes principales funcionales. Sin embargo, los procedimientos clásicos basados en el desvío estándar o el operador de covarianza muestral son muy sensibles a datos atípicos. Para resolver este problema, en esta tesis, se introducen estimadores robustos para las componentes principales mediante un enfoque basado en el método de projection–pursuit. Estimadores de projection–pursuit, para el caso finito– dimensional, fueron inicialmente propuestos en Huber (1981) como una forma de obtener estimadores robustos de la matriz de covarianza. Posteriormente, fueron considerados por Li y Chen (1985) para el problema de componentes principales como una aproximación directa al problema sin necesidad de obtener estimadores robustos de la matriz de escala (ver, también Huber, 1985). En esta tesis, se extiende dicha propuesta al caso funcional. Por otra parte, se consideran diversas variaciones de la misma que permiten obtener estimadores suaves mediante una penalización en la escala o en la norma, o bien, mediante una aproximación finito–dimensional sobre una base con elementos suaves. Bajo condiciones débiles de regularidad, se obtiene la continuidad del funcional asociado, de lo que se deduce la consistencia de los estimadores sin suavizar. Por otra parte, se prueba la consistencia de los estimadores que penalizan la norma y/o la escala así como la de una propuesta basada en aproximaciones por subespacios crecientes, bajo condiciones débiles. Mediante un estudio de simulación, se compara la performance de las propuestas clásicas y robustas bajo diferentes tipos de contaminación. Se complementa el estudio de los estimadores de proyección de las direcciones principales, obteniendo una expresión para la función de influencia del funcional asociado a la dirección principal y su tamaño. Las propuestas anteriores de estimación se extendieron al caso de k poblaciones que cumplen un modelo de componentes principales comunes funcional. Bajo dicho modelo, las diversas poblaciones presentan una estructura común en cuanto a su operador de dispersión compartiendo sus autofunciones y el orden de las mismas. Para ser más precisos, se definen estimadores robustos de projection–pursuit de las direcciones principales bajo un modelo de componentes principales comunes. Para las distintas propuestas, algunas de las cuales incluyen como antes diversos tipos de penalización, se prueba su consistencia, bajo condiciones débiles. Por otra parte, mediante un estudio de Monte Carlo, se estudia el comportamiento de los estimadores introducidos para muestras finitas, bajo diferentes modelos y tipos de contaminación. Finalmente, se proponen algoritmos que permiten calcular aproximaciones de cada una de las propuestas dadas. Se prueba la consistencia del estimador obtenido a través de dicho algoritmo. Mediante un estudio Monte Carlo, se analiza la velocidad de convergencia de dicha propuesta en el caso de procesos con trayectorias suaves e irregulares. Para estas últimas, se propone un método alternativo de cálculo.

Abstract:
In many practical situations, data are recorded over a period of time or may correspond to images. In these situations, it is preferable to consider them as samples of an stochastic process instead of discretizing and studying them as multivariate data samples. A technique widely used to describe the observations principal modes of variations is the functional principal components analysis. The classical procedures based on the standard deviation or the sample covariance are very sensitive to atypical data. To overcome this problem, in this thesis, we introduce robust estimators for the principal components using a projection–pursuit approach. In the multivariate setting, projection–pursuit estimators were initially proposed in Huber(1981) as a way to obtain robust estimators of the covariance matrix. They were then considered by Li and Chen (1985) to perform a robust principal component analysis without passing by a robust estimate of the covariance matrix (see also, Huber, 1985). In this thesis, we extend that proposal to the functional case. On the other hand, we consider other alternatives which allow us to obtain smooth estimators of the principal directions using either a penalization on the scale or the norm or through a sieve approach which consists in considering an increasing sequence of finite–dimensional spaces spanned by a basis with smooth elements. Under mild regularity conditions, we derive the continuity of the associated functional which entails the consistency of the non–smoothed estimators. On the other hand, we show that the estimators defined penalizing the norm and/or the scale and those based on the sieve approach are consistent. Through a simulation study, we compare the performance of the classical and robust proposals under different contamination models. We complete the study of the projection–based estimators of principal directions, obtaining an expression for the influence function of the functional related to the principal direction and its size. The previous proposals are extended to k populations satisfying a functional common principal component model. Under this model, the populations have a common dispersion structure, since the dispersion operators share the same eigenfunctions and their order. More precisely, we introduce robust projection– pursuit estimators of the principal directions under functional common principal components model. We derive the consistency of the the different proposals, some of which include penalization terms. On the other hand, through a Monte Carlo study, we the performance of the robust estimators is compared to that of the classical one, under different models and contaminations. Finally, we propose algorithms that allow to compute approximations for each of the robust proposals given. The estimators obtained through that algorithm turn out to be consistent. Using a Monte Carlo study, we analyse the convergence rate of the proposals when the observations have smooth or rugged trajectories. For the latter, we propose an alternative method of computation.

* A este resumen le pueden faltar caracteres especiales. Consulte la versión completa en el documento en formato PDF

Registro:
Título : Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes     =    Robust methods for estimation of functional principal components and for the model of common principal components
Autor : Bali, Juan Lucas
Director : Boente, Graciela
Consejero : Boente, Graciela
Jurados : Salibian Barrera, Matías  ; Maronna, Ricardo  ; Forzani, Liliana
Año : 2012
Editor : Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación : Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Instituo de Cálculo
Grado obtenido : Doctor de la Universidad de Buenos Aires en el área de Ciencias Matemáticas
Ubicación : Preservación - http://digital.bl.fcen.uba.ar/gsdl-282/cgi-bin/library.cgi?a=d&c=tesis&d=Tesis_5153_Bali
Idioma : Español
Area Temática : Matemática / Análisis Funcional
Palabras claves : ANALISIS DE COMPONENTES PRINCIPALES; COMPONENTES PRINCIPALES COMUNES; DATOS FUNCIONALES; ESTIMADORES ROBUSTOS; FUNCION DE INFLUENCIA; PENALIZACION; COMMON PRINCIPAL COMPONENTS MODEL; FUNCTIONAL DATA; INFLUENCE FUNCTION; PENALIZATION; PRINCIPAL COMPONENT ANALYSIS; ROBUST ESTIMATORS
URL al Documento : 
URL al Registro : 
hola chau _gs.DocumentHeader_ chau2 _documentheader_ chau3
Estadísticas:
     http://digital.bl.fcen.uba.ar
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34