Tesis > Documento


Ver el documento (formato PDF)   Ambrosio, Beatriz.  "Algoritmos rápidos para computar estimadores robustos"  (2004)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
URL:
     
Resumen:
El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo.

Abstract:
Regression analysis is an important statistical tool that is applied in most sciences. The purpose of regression analysis is to fit equations to observed variables. The most commonly regression technique is the least squares method, generally adopted because of tradition and easier computation. However these method is very sensitive to the presence of atypical points in the sample. An observation is an atypical point or outlier if it does not follow the model. To remedy this problem the robust mothods have been developed that are not so easuly affected by outliers. One mesure of robustness of an estimate is its breakdown point. Heuristically, the breakdown point is the minimun fraction of arbitrary outliers that can take the estimate beyond any limit. The breakdown point as an asymptotic concept has been introduced by Hampel (1971). Donoho and Huber (1983) gave the corresponding finite sample notion. A desirable property for regression estimates is that the estimate be equivariant with respect to affine, regression and scale transformations. Estimates are computationally expensive, and the corresponding algorithms become unfasible for moderately large number of regressors. In this thesis we propose an algorithm for computing S-estimates, analogous to the algorithm of Rousseeuw and Van Driessen (Fast-LTS) to improve the computational speed of the LTS-estimate. The new algorithm, that we call "fast-S", is based on a "local improvement" step of the re-sampling initial candidates. This allows a substantial reduction of the number of candidates requiered to obtain a good approximation to the optimal solution. We performed a simulation study wich shows that S-estimators computed with the fast-S algorithm compare favourably to the LTS estimator computed with the fast-LTS algorithm.

* A este resumen le pueden faltar caracteres especiales. Consulte la versión completa en el documento en formato PDF

Registro:
Título : Algoritmos rápidos para computar estimadores robustos    
Autor : Ambrosio, Beatriz
Director : Yohai, Victor
Año : 2004
Editor : Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación : Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Departamento de Matemática
Grado obtenido : Magister de la Universidad de Buenos Aires en el área de Estadística Matemática
Ubicación : Preservación - http://digital.bl.fcen.uba.ar/gsdl-282/cgi-bin/library.cgi?a=d&c=tesis&d=Tesis_3765_Ambrosio
Idioma : 
Area Temática : 
URL al Documento : 
URL al Registro : 
hola chau _gs.DocumentHeader_ chau2 _documentheader_ chau3
Estadísticas:
     http://digital.bl.fcen.uba.ar
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34