Tesis > Documento


Ver el documento (formato PDF)   Alvarez, Agustín.  "Métodos robustos en correlación canónica funcional"  (2017-03-22)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
URL:
     
Resumen:
En diversas aplicaciones, resulta de interés poder medir la asociación entre dos características que se observan sobre los individuos de una población. Por otra parte, muchas veces estas características se registran sobre un período de tiempo o corresponden a imágenes. Por esta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar de discretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamente utilizado para lograr este objetivo es el análisis de correlación canónica funcional. Leurgans et al. (1993) prueban que la extensión natural de los estimadores utilizados en el caso multivariado al funcional no resulta consistente para la primera correlación canónica. Por esta razón, dichos autores proponen estimadores que penalizan la rugosidad de las direcciones y prueban que resultan consistentes. Por otro lado, He et al. (2003) dan condiciones que garantizan la buena definición de las correlaciones y direcciones canónicas para elementos aleatorios (X; Y )^t a valores en el espacio de Hilbert L²(0, 1) x L² (0, 1). Los trabajos mencionados consideran como medida de asociación la correlación de Pearson. Sin embargo, es bien sabido, que esta medida es muy sensible a la presencia de datos atípicos. Con el fin de lidiar con este problema, en el caso multivariado, Branco et al. (2005) y Alfons et al. (2016) proponen estimadores utilizando un enfoque de projection-pursuit, es decir, maximizando funcionales de asociación robustos de proyecciones de los datos. En esta tesis, consideramos espacios de Hilbert separables H1 y H2 y elementos aleatorios (X, Y )^t Є H = H1 x H2 y medidas de asociación bivariadas robustas. Para mostrar que la extensión natural del caso multivariado al caso funcional falla cuando se utiliza la extensión de los estimadores de projection-pursuit de Branco et al. (2005) al caso funcional, extendemos el resultado de Leurgans et al. (1993) al caso de medidas de asociación generales. Por otra parte, para proponer estimadores robustos y consistentes consideramos un enfoque que combina projection-pursuit con el método de Sieves que aproxima el espacio infinito-dimensional H por subespacios de dimensión finita que crecen con el tamaño de muestra. Bajo condiciones de regularidad, obtenemos que los estimadores de las primeras direcciones y de la primera correlación canónica son consistentes al funcional asociado. Para identificar que representa dicho funcional, se muestra la consistencia Fisher de éstos cuando se utilizan medidas de asociación que cumplan ciertas condiciones. En particular, las medidas de correlación robustas de uso habitual permiten obtener estimadores consistentes a la cantidad de interés en el caso de procesos Gaussianos o de procesos elípticos. Mediante un estudio de simulación, se compara el comportamiento de los estimadores robustos con los estimadores basados en la correlación de Pearson, para muestras finitas Gaussianas y contaminadas. Se proponen asimismo un procedimiento de convalidación cruzada robusta para elegir las dimensiones de los subespacios aproximantes y métodos para la detección de datos atípicos. Finalmente, se ilustra en un conjunto de datos reales las ventajas de los estimadores robustos ya que permiten identificar los datos atípicos y proveen estimaciones confiables.

Abstract:
In many applications, measuring the association between two individual features is an important issue. Besides, in many practical situations data are recorded over a period of time or may correspond to images. In these situations, it is preferable to consider them as samples of an stochastic process instead of working with the discretized trajectories as multivariate data samples. A technique widely used to study the dependence between the two functions recorded for a sample of subjects is the functional canonical correlation analysis. Leurgans et al. (1993) demonstrated the need for regularization in functional canonical correlation analysis, since the natural extension of the multivariate estimators are not consistent. Leurgans et al. (1993) also derived the consistency of the estimators obtained penalizing the roughness. These results are complemented with those obtained in He et al. (2003) who provide conditions ensuring the existence and proper definition of the canonical directions and correlations when the random element belongs to L² (0, 1) x L² (0; 1). The aforementioned papers consider as association measure the Pearson correlation. However, it is well known that the Pearson correlation is not robust, being sensitive to outliers and this sensitivity is inherited by the canonical directions and correlations. In the multivariate case, a robust approach was given by Branco et al. (2005) and Alfons et al. (2016) who proposed estimators using projection-pursuit, that is, maximizing a robust bivariate association measure over the projected data. In this thesis, we consider separable Hilbert spaces H1 and H2 and random elements (X, Y ) Є H = H1 x H2 as well as robust bivariate measures of association. To show that the natural extension from the multivariate case to the functional case fails when using the projection-pursuit estimators of Branco et al. (2005), we generalize the result of Leurgans et al. (1993) to the case of general measures of association. On the other hand, to obtain robust and consistent estimators in a functional framework, we consider an approach that com6 bines projection-pursuit with Sieves which approximate the infinite-dimensional space H by means of finite-dimensional linear spaces growing with the sample size. Under regularity conditions, consistency results for the first canonical correlation and directions are derived. An important point to highlight is what the functional related to the proposed estimators represent, at least in some situations. For that purpose, Fisher consistency is obtained when the bivariate measure of association may be transformed to a Fisher-consistent bivariate association functional. In particular, the usual robust correlations allow to obtain consistent estimators of the quantities of interest when (X, Y )^t is a Gaussian or an elliptical process. Through a simulation study, we compare the performance of the robust proposals with the estimators based on the Pearson correlation, for clean and contaminated data. Furthermore, a robust cross-validation procedure is also proposed to select the dimension of the approximating linear spaces and outlier detection rules are studied. Finally, we illustrate on a real data set the advantages of the robust estimators which allow identify outliers and provide reliable estimates.

* A este resumen le pueden faltar caracteres especiales. Consulte la versión completa en el documento en formato PDF

Registro:
Título : Métodos robustos en correlación canónica funcional     =    Robust inference in functional canonical correlation
Autor : Alvarez, Agustín
Director : Boente Boente, Graciela Lina
Director Asistente : Kudraszow, Nadia Laura
Jurados : Agostinelli, Claudio  ; Svarc, Marcela  ; Yohai, Víctor
Año : 2017-03-22
Editor : Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación : Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Departamento de Matemática
Instituto de Cálculo (IC)
Grado obtenido : Doctor de la Universidad de Buenos Aires en el área de Ciencias Matemáticas
Ubicación : Preservación - http://digital.bl.fcen.uba.ar/gsdl-282/cgi-bin/library.cgi?a=d&c=tesis&d=Tesis_6188_Alvarez
Idioma : Español
Area Temática : Matemática / Estadística y Probabilidad
Palabras claves : CORRELACION CANONICA; DATOS FUNCIONALES; ESPACIOS APROXIMANTES; ROBUSTEZ; CANONICAL CORRELATION; FUNCTIONAL DATA; ROBUSTNESS; SIEVES
URL al Documento : 
URL al Registro : 
hola chau _gs.DocumentHeader_ chau2 _documentheader_ chau3
Estadísticas:
     http://digital.bl.fcen.uba.ar
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34