Registro:
Documento: | Tesis de Maestría |
Disciplina: | matematica |
Título: | Algoritmos rápidos para computar estimadores robustos |
Autor: | Ambrosio, Beatriz |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Filiación: | Departamento de Matemática
|
Publicación en la Web: | 2019-03-29 |
Fecha de defensa: | 2004 |
Fecha en portada: | 2004-11 |
Grado Obtenido: | Maestría |
Título Obtenido: | Magíster de la Universidad de Buenos Aires en el área de Estadística Matemática |
Director: | Yohai, Victor |
Idioma: | Español |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n3765_Ambrosio.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n3765_Ambrosio |
Ubicación: | Dep.EST 003765 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Ambrosio, Beatriz. (2004). Algoritmos rápidos para computar estimadores robustos. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio |
Resumen:
El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo.
Abstract:
Regression analysis is an important statistical tool that is applied in most sciences. The purpose of regression analysis is to fit equations to observed variables. The most commonly regression technique is the least squares method, generally adopted because of tradition and easier computation. However these method is very sensitive to the presence of atypical points in the sample. An observation is an atypical point or outlier if it does not follow the model. To remedy this problem the robust mothods have been developed that are not so easuly affected by outliers. One mesure of robustness of an estimate is its breakdown point. Heuristically, the breakdown point is the minimun fraction of arbitrary outliers that can take the estimate beyond any limit. The breakdown point as an asymptotic concept has been introduced by Hampel (1971). Donoho and Huber (1983) gave the corresponding finite sample notion. A desirable property for regression estimates is that the estimate be equivariant with respect to affine, regression and scale transformations. Estimates are computationally expensive, and the corresponding algorithms become unfasible for moderately large number of regressors. In this thesis we propose an algorithm for computing S-estimates, analogous to the algorithm of Rousseeuw and Van Driessen (Fast-LTS) to improve the computational speed of the LTS-estimate. The new algorithm, that we call "fast-S", is based on a "local improvement" step of the re-sampling initial candidates. This allows a substantial reduction of the number of candidates requiered to obtain a good approximation to the optimal solution. We performed a simulation study wich shows that S-estimators computed with the fast-S algorithm compare favourably to the LTS estimator computed with the fast-LTS algorithm.
Citación:
---------- APA ----------
Ambrosio, Beatriz. (2004). Algoritmos rápidos para computar estimadores robustos. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
---------- CHICAGO ----------
Ambrosio, Beatriz. "Algoritmos rápidos para computar estimadores robustos". Tesis de Maestría, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2004.https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n3765_Ambrosio.pdf