Tesis > Documento


Ver el documento (formato PDF)   Fernández, Paula del Carmen.  "Análisis genómico de girasol: desarrollo de colecciones de ESTs y de una plataforma bioinformática para estudios de expresión de genes candidato en respuestas a estreses abióticos"  (2006)
Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
URL:
     
Resumen:
El girasol es uno de los principales cultivos oleaginosos del mundo por su volumen de producción y composición en ácidos grasos insaturados. En promedio, durante los últimos cinco años, la producción mundial se ha mantenido estable concentrándose el 72% de la misma entre Argentina y la Unión Europea. A pesar de esto y debido a las condiciones de los precios internacionales y la productividad comparativa con otros cultivos, el área de producción se está desplazando a regiones más áridas a nivel mundial cobrando relevancia la incidencia de estreses abióticos como sequía, salinidad y bajas temperaturas. Pese a la importancia económica del girasol a escala mundial, el grado de avance de los conocimientos públicos sobre el genoma de girasol es limitado cuando se lo compara con cultivos como el arroz, el maíz, la soja, el tomate, el trigo, la papa, la cebada. Sin embargo, en los últimos cinco años, en paralelo al avance de este trabajo, se han iniciado distintos proyectos a nivel nacional e internacional orientados al análisis genómico de girasol con lo cual ha aumentado significativamente la disponibilidad de secuencias genómicas y de ADNc, con el consecuente impacto en el avance de las investigaciones y el conocimiento sobre esta especie. El objetivo de este trabajo es contribuir al conocimiento de las regiones codificantes del genoma de girasol a partir de una estrategia de genómica funcional que sirva como base para la caracterización transcripcional simultanea de los perfiles de expresión inducidos bajo condiciones de estrés y el desarrollo de marcadores funcionales. Para lo cual se abordo el desarrollo de un banco local de secuencias que se expresan o ESTs ("expressed sequence tags") diferenciales para distintos órganos y/o estadios de desarrollo de girasol y el desarrollo de una plataforma bioinformática para la caracterización de los perfiles transcripcionales de las mismas en respuesta a estrés abióticos. En una primera etapa se evaluaron distintas estrategias de secuenciación a pequeña y mediana escala para la identificación de genes diferencialmente expresados en girasol a partir de la generación colecciones de ADNc diferencial. La técnica utilizada se basó en la hibridación substractiva como herramienta para la identificación de genes diferencialmente expresados en un tejido definido, disminuyendo significativamente la redundancia en la secuenciación de clones que representan a genes abundantes y maximizando la detección de los transcriptos “raros” o poco abundantes. Esta estrategia posibilitó un incremento de la eficiencia de secuenciación dentro del marco de un proyecto genómico de pequeña escala que apunta a la identificación de genes de utilidad para propósitos de mejoramiento y la búsqueda de marcadores funcionales. Como resultado, se obtuvieron clonotecas diferenciales a partir de hoja, tallo, raíz y flor en dos estadios de desarrollo (R1 y R4). El uso de diferentes fuentes de ARN como objeto o “tester” y referencia o “driver” fue de utilidad para la selección y detección de transcriptos poco abundantes. La especificidad órgano- específica varió dentro de un rango de 75 a 100% de las secuencias no- redundantes (unigenes) dentro de cada clonoteca de ADNc. La clonoteca correspondiente al estadio R4 de flor fue la menos redundante con un 62% de secuencias únicas y la que aportó el número más elevado de secuencias nuevas de girasol. El análisis bioinformático se llevó a cabo mediante la instalación de un servidor local (INTA 01) conteniendo las herramientas de distribución pública para la edición, análisis y ensamblado de secuencias como Phred/Phrap, CAP3 y algoritmos de comparación de secuencias como BLAST y el desarrollo de BioPipeline® una plataforma desarrollada en entorno Windows para el análisis automatizado de secuencias utilizando los mismos programas y algoritmos mencionados anteriormente. La información de secuencias generadas fue depositada en la base dbESTs de NCBI para su distribución pública. Para el manejo local de esta información se desarrolló una base relacional de tipo ACeDB para la integración de la información generada y su anotación funcional. Sobre un total de 919 secuencias que fueron editadas y anotadas, 318 representan secuencias únicas. Las comparaciones contra bases de datos públicos arrojaron un valor del 60% de secuencias no-redundantes con similitud a secuencias conocidas. El número de genes novedosos predichos varió según la clonoteca analizadas, en un rango que va de 56% en las clonotecas de flor estadio R4 al 16% en las de flor R1. Las comparaciones con los ESTs de girasol depositados y reportados en bases de datos mostraron que 197 secuencias (59,9%) del total) representaban secuencias nuevas, sin similitud significativa con secuencias conocidas. Este enfoque fue exitoso respecto del aislamiento de un número significativo de secuencias reportadas asociadas en su función inferida (probable) a caracteres de importancia agronómica, procesos regulatorios y fisiológicos clave. En una segunda etapa se abordó la evaluación de la expresión relativa simultánea de los transcriptos correspondientes a las secuencias de la base de ESTs desarrollada bajo diferentes condiciones de estrés abiótico utilizando la tecnología de micromatrices de ADN. Se imprimieron los fragmentos representativos de los 318 unigenes anotados en las clonotecas previamente descriptas en micromatrices sobre soporte de vidrio. Se evaluaron tres muestras biológicas tanto para tratamiento de frío (estrés térmico), tratamiento de salinidad (estrés salino) y controles representados por plantas crecidas en condiciones regulares. Estos estreses fueron seleccionados considerando al girasol como una planta con grado intermedio-alto de sensibilidad a bajas temperaturas en la zona radicular, así como también particularmente susceptible al desarrollo en condiciones de alta salinidad. El análisis transcripcional permitió detectar 3 grupos de genes bien diferenciados en sus patrones de expresión. Por una parte el Grupo 2, integrado por 126 genes, no mostró variación en sus niveles medios a través de los tratamientos. En cambio, el Grupo 1 (integrado por 112 genes) evidenció sobre- expresión respecto del control cuando las plantas fueron sometidas a estrés (por frío o por salinidad). De manera análoga, 49 genes conformaron el Grupo 3, pero en este caso se observó una sub-expresión respecto del control en ambos tratamientos. Dentro del grupos 1 y 3, se detectaron perfiles de expresión diferenciales para ambos tipos de estrés, siendo la sobre expresión y/o sub expresión de los genes evaluados más pronunciada en respuesta al estrés por frío respecto al estrés por salinidad. Finalmente, surgieron 80 genes candidato en la separación de tratamientos de acuerdo a su p-valor en la prueba de comparación de medias por análisis de la varianza y su ubicación en la región periférica del plano de ordenación generado por los dos primeros ejes principales de un Análisis de Componentes Principales (ACP) de la matriz de expresión génica escalada gen a gen por la desviación estándar residual del análisis de la varianza. De estos genes, 7 fueron validados por técnicas de reacción en cadena de la polimerasa cuantitativa (Real Time PCR), habiéndose obtenido patrones transcripcionales similares con ambas estrategias de análisis La diferencia en expresión génica fue analizada en relación al origen de las secuencias en evaluación. Las secuencias provenientes de la colección de hoja mostraron en general patrones de subexpresión génica en respuesta a ambos estreses (la mayoría corresponden a genes asociados al proceso de fotosíntesis) mientras que las secuencias aisladas de colecciones de tallo o flor en estadio R4 mostraron patrones de inducción génica frente a los mismos estreses. Si se considera que los cambios transcripcionales en respuesta a frío y salinidad fueron evaluados en hoja, estos resultados confirman la eficiencia de la técnica de SSH utilizada para la generación de las colecciones de ADNc órgano específicas y explica la alta relación de transcriptos que muestra cambios en su perfil en respuesta a estreses en relación a los que no varían su nivel transcripcional en las condiciones evaluadas. Durante la segunda etapa de este trabajo se realizó un análisis de los 80 genes candidatos, detectándose 48 como sobre o sub expresados frente a uno u otro estrés, indicando la implicancia de mecanismos regulatorios comunes a ambos estreses. Asimismo 17 y 12 genes se detectaron inducidos o sub expresados específicamente frente a un estrés y no frente al otro. De acuerdo al análisis funcional comparativo estos genes estarían involucrados en mecanismos de regulación incluyendo procesos de transcripción, traducción, degradación/plegado o interacción de proteínas o asociados a mecanismos de generación y procesamiento de especies reactivas de oxigeno. De estas secuencias, 12 corresponden a secuencias con funcionalidad desconocida. Sólo 3 de las secuencias analizadas en este trabajo mostraron patrones transcripcionales opuestos incluyendo una con similitud a un transportador de lípidos. La información generada a partir de la caracterización del banco de ESTs constituye por una parte una fuente de información sobre genes candidatos involucrados en mecanismos de respuesta a estreses abióticos que pueden ser incluidos en ensayos de complementación en plantas transgénicas modelo y asimismo permite identificar secuencias nuevas no descriptas anteriormente para el desarrollo de marcadores funcionales a ser utilizados en programas de mejoramiento asistido de este cultivo

Abstract:
Sunflower is one of the most important oil crops worldwide regarding its production volume and composition in unsaturated fatty acids. However due to international price conditions and productivity respect to other crops, sunflower production is progressively expanding to arid regions worldwide. Consequently, abiotic stresses as drought, low temperatures and salinity arise as main constrains nowadays. Sunflower is considered a medium-high tolerant plant crop to low temperatures in the radial zone and sensitive to saline environment. Compared to other crops such as rice, maize, soybean, tomato, wheat, potato and barley genetic and genomic sunflower knowledge was limited until the onset of the present decade. However, in parallel to the advance of this thesis (last five years), different projects aimed to the genome analysis of cultivated sunflower and its related wild species, resulted in a significant increase of the number of available expressed and genome sequences in public databases. The objective of this work was to develop tools for structural and functional analysis of cultivated sunflower through the development of a model organ-specific ESTs ("expressed sequence tags") database, the creation and actualization of a bioinformatics platform to characterize transcriptional profiles of the represented genes in response to abiotic stress conditions with the aim to identify novel genes as a source of functional molecular markers associated to important traits, under the scope of an alternative, cost-effective strategy to high-throughput sequencing projects. In the first stage of this work a low scale sequencing strategy based on suppressed subtracted hybridization method was evaluated for the construction of organ- specific cDNA libraries in order to identify differentially expressed genes in sunflower Differential organ-specific ESTs were generated from leaf, stem, root and flower bud at two developmental stages (R1 and R4). Organ-specificity ranged from 75 to 100% of non-redundant sequences in the different cDNA libraries. Sequence redundancy varied according to the target and driver cDNA used for each library. The R4 flower cDNA library was the less redundant library with 62% of unique sequences. Bioinformatics analysis was achieved through the development of BioPipeline®, a bioinformatic tool for sequence quality analysis, contaminant sequence removal and sequence assembly and automatic annotation based on the utilization of free available software as Phred/Phrap, CAP3 and BLAST algorithms using a local server installed at the Institute of Biotechnology, INTA01. Processed sequences were deposited for public distribution in the dbEST database at NCBI. Biological information related to these sequences was locally stored using an ACeDB-based relational database as a laboratory information management system. Out of a total of 919 sequences that were edited and annotated, 318 were non redundant sequences. Comparison against sequences in public databases showed that 60% of non redundant sequences showed significant similarity to known sequences. The number of predicted novel genes varied among the different cDNA libraries, ranging from 56% in the R4 flower to 16 % in the R1 flower bud library. Comparison with sunflower ESTs on public databases showed that 197 of non- redundant sequences (60%) did not exhibit significant similarity to previously reported sunflower ESTs. This approach helped to successfully isolate 33 newly reported unique sequences for sunflower putatively related to responses to biotic and/or abiotic stresses. Application of suppressed subtracted hybridization technology not only enabled the cost effective isolation of differentially expressed sequences but it also allowed the identification of novel sequences in sunflower from a relative small number of analyzed sequences when compared to major sequencing projects. In a second stage, functional genomic studies were performed using microarray technology. A cDNA glass slide chip containing the 318 organ-specific unigenes was constructed in order to evaluate the expression profile under cold and salinity stress conditions. Three biological leaf samples from treated plants, exposed either to low temperatures or watered with NaCl solution, as well as control plants grew under standard condition, were evaluated by hybridization of fluorescence labeled treated and control RNA to target genes. Transcriptional analysis allowed the detection of three groups of genes well differentiated in their expression profiles during the exploratory analysis. One group composed by 126 genes did not show variation along treatments; a second group composed by 112 genes showed evidence of up-regulation under abiotic stress (cold or salinity), whereas a SUB- regulation in both treatments was observed in the 49 genes belonging to a third group. During the second phase of this analysis, 80 candidate genes were identified according to the p-value obtained by classical ANOVA and their peripheral location in the PCA analysis of the gene matrix. Seven genes were experimentally validated by quantitative real time PCR (qRT-PCR) being the transcriptional patterns derived from the two methods highly similar in all cases. Differences in genes expression were analyzed according to the differential organ-specific cDNA library from which they were isolated. While differential leaf library sequences showed the majority of genes sub-regulated (most of them corresponding to photosynthesis or general metabolism related genes), R4 flower developmental stage and stem libraries showed a larger number of up-regulated genes. Considering that transcriptional changes in response to salt and cold stresses were evaluated in leaf tissue, these results confirmed the efficiency of SSH technique in the generation of the differential organ specific libraries and explained the large transcription change / transcription unchanged ratio detected in these assays. Within the 80 candidate a large number of evaluated sequences (48) were either up-regulated or sub-regulated under both abiotic stresses, thus supporting common regulatory mechanisms and general responses to low temperature and salinity. Interestingly 17 sequences were specifically up regulated and 12 were specifically sub-regulated in one stress but not in the other. These genes are potentially involved in different regulatory mechanisms including transcription / translation / protein degradation / protein folding or correspond to genes involved in ROS production or ROS-scavenging and some of them (12) did not show similarity to reported gene products. Only three of the evaluated sequences in this work showed an inverted transcriptional pattern under cold and salinity stress, including one with similarity to a LTP transcript. The information obtained from this EST library characterization not only contributed as a major source of knowledge about candidate genes involved in the mechanisms of abiotic stress responses in sunflower that can be incorporated in future complementary gene studies in model or sunflower transgenic plants but also allows the detection of new putative functional markers as a key tool for marker assisted selection in sunflower.

* A este resumen le pueden faltar caracteres especiales. Consulte la versión completa en el documento en formato PDF

Registro:
Título : Análisis genómico de girasol: desarrollo de colecciones de ESTs y de una plataforma bioinformática para estudios de expresión de genes candidato en respuestas a estreses abióticos    
Autor : Fernández, Paula del Carmen
Director : Heinz, Ruth A.
Jurados : Poggio, L.  ; Chan, R.  ; Bravo Almonacid, F.
Año : 2006
Editor : Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires
Filiación : Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Instituto de Biotecnología CICVyA INTA Castelar
Grado obtenido : Doctor de la Universidad de Buenos Aires en el área de Ciencias Biológicas
Ubicación : Preservación - http://digital.bl.fcen.uba.ar/gsdl-282/cgi-bin/library.cgi?a=d&c=tesis&d=Tesis_4034_Fernandez
Idioma : Español
Area Temática : Biología / Biología Molecular y Celular
Biología / Agrobiotecnología
Biología / Ingeniería Genética
Palabras claves : HELIANTHUS ANNUUS; GIRASOL; EST; SSH; ADNC DIFERENCIAL; GENOMICA FUNCIONAL; BIOINFORMATICA; TRANSCRIPTOS ORGANO-ESPECIFICOS; MICROMATRICES DE ADNC; ESTRES POR FRIO; ESTRES SALINO; PCR CUANTITATIVA; HELIANTHUS ANNUUS; SUNFLOWER; EST; SSH; DIFFERENTIAL CDNA; FUNCTIONAL GENOMICS; BIOINFORMATICS; ORGAN-SPECIFIC TRANSCRIPTOMA; CDNA; MICROARRAYS; COLD STRESS; SALINITY STRESS; QUANTITATIVE PCR
URL al Documento : 
URL al Registro : 
hola chau _gs.DocumentHeader_ chau2 _documentheader_ chau3
Estadísticas:
     http://digital.bl.fcen.uba.ar
Biblioteca Central Dr. Luis Federico Leloir - Facultad de Ciencias Exactas y Naturales - Universidad de Buenos Aires
Intendente Güiraldes 2160 - Ciudad Universitaria - Pabellón II - C1428EGA - Tel. (54 11) 4789-9293 int 34