Tesis > Documento


Ver el documento (formato PDF)   Lamagna, Walter Marcelo.  "Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires"  (2016-11-24)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
URL:
     
Resumen:
En esta última década, el acceso masivo a las nuevas tecnológicas con medios de almacenamiento reducidos en tamaño y precios accesibles han impulsado la creación y manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datos públicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos a disposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecen la participación democrática motivando a los científicos de datos a utilizar su conocimiento para responder ciertas preguntas ó resolver problemas a través de la tecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que corresponden a las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato proveniente de dos fuentes diferentes de formato distinto: dígitos tipeados a partir de formularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadas utilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya que son producto del conteo manual supervisado por todos los actores presentes en el evento. Conociendo la metodología utilizada sabemos que este dato debería corresponderse entre ambas fuentes. Se busca determinar si existe una tasa de error entre dos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regiones de interés que localizan cada número que luego será segmentado en sus correspondientes dígitos. La dificultad de decodificar el símbolo numérico que corresponde a cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamiento de imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizado que clasifica los dígitos manuscritos de los telegramas y luego los compara con los datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árboles de decisión en la clasificación de las regiones del telegrama y redes neuronales convolucionales en la clasificación de los dígitos manuscritos.

* A este resumen le pueden faltar caracteres especiales. Consulte la versión completa en el documento en formato PDF

Registro:
Título : Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires    
Autor : Lamagna, Walter Marcelo
Director : Buemi, María Elena
Jurados : Acevedo, Daniel Germán  ; Mora Cofre, Daniel Marco Antonio  ; Aubin, Verónica Inés
Año : 2016-11-24
Editor : Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación : Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Grado obtenido : Magíster de la Universidad de Buenos Aires en Explotación de Datos y Descubrimiento de Conocimiento
Ubicación : Preservación - http://digital.bl.fcen.uba.ar/gsdl-282/cgi-bin/library.cgi?a=d&c=tesis&d=Tesis_6105_Lamagna
Idioma : Español
Area Temática : Explotación de Datos y Descubrimiento del Conocimiento
Palabras claves : ELECCIONES; DATAMINING; GOBIERNO ABIERTO; PROCESAMIENTO DE IMAGENES; REDES NEURONALES CONVOLUCIONALES; 
URL al Documento : 
URL al Registro : 
hola chau _gs.DocumentHeader_ chau2 _documentheader_ chau3
Estadísticas:
     http://digital.bl.fcen.uba.ar
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34