Discrete methods for microarray analysis

Ortiz Zuazaga, Humberto

Publication:

Discrete methods for microarray analysis

dc.contributor.advisor	Moreno de Ayala, Oscar
dc.contributor.author	Ortiz Zuazaga, Humberto
dc.contributor.college	College of Engineering	en_US
dc.contributor.committee	Bollman, Dorothy
dc.contributor.committee	Corrada Bravo, Carlos
dc.contributor.committee	Pericchi, Luis
dc.contributor.department	Department of Electrical and Computer Engineering	en_US
dc.contributor.representative	García Arrarás, Jose E.
dc.date.accessioned	2019-05-14T18:22:49Z
dc.date.available	2019-05-14T18:22:49Z
dc.date.issued	2008
dc.description.abstract	Microarrays allow researchers to simultaneously measure the expression of thousands of genes. They give invaluable insight into the transcriptional state of biological systems, and can be important in understanding physiological as well as diseased conditions. However, the analysis of data from many thousands of genes, from only a few replications is very difficult. We have devised a novel method of correcting errors in microarray experiments, that also clusters genes into groups, and categorizes their measurements into coarse divisions, suitable for discrete techniques for reverse engineering. These techniques are based on finite fields and algebraic coding theory. We test these new techniques on a data set obtained from behavioral training experiments on rats, and identify two novel genes that may be involved in learning and memory. We extend this method to work with “probe level” microarray data, where each gene is represented by multiple probes. We have applied the error correction procedure to two data sets, one Affymetrix, one NimbleGen, having either 14 (Affymetrix) or approximately 10 (NimbleNen) probes per gene, derived from an odor avoidance experiment on Drosophila. The experiment is designed to validate analysis procedures by examining the degree of concordance the procedures produce across the data sets. For this data we devise a method to measure the concordance quantitatively. We have developed a technique based on mutual information to compare results obtained across the two data sets. Our results show that our error correction techniques result in a greater amount of shared information between data sets than traditional approaches based on averaging of probes and gene expression levels across repetitions. We show how our results can be extended to sets with finer gradations in expression values, and present the analysis of the Drosophila data discretized to 5 separate expression values. Finally, we present some future applications, such as using finite fields to encode expression values, allowing us to use the algebraic properties of finite fields to perform reverse engineering of gene regulatory networks.	en_US
dc.description.abstract	Microarreglos de material genético permiten medir niveles de expresión de miles de genes en un solo experimento. Presentan un cuadro de el estado transcripcional de una muestra biológica, y pueden ser de gran valor en elucidar mecanismos de acción de procesos fisiológicos o patológicos. El análisis de datos de estos experimentos, sin embargo, se hace difícil por la gran cantidad de genes medidos, y la carencia de replicados. Hemos desarollado un método novedoso de analizar estos datos. Nuestra técnica agrupa genes en categorías gruesas, permite corregir errores experimentales, y sirve para producir datos discretos de expresión para luego utilizar técnicas discretas para más análisis. Nuestras técnicas se basan en representar valores de expresión genéticas como elementos de cuerpos finitos, y utilizan propiedades algebraicas de tales cuerpos. Hemos demostrado nuestras técnicas en un conjunto de datos provenientes de un experimento conducual en ratas, e identificamos dos genes que parecen estar involucrados en memoria y aprendizaje. Extendimos nuestras técnicas para trabajar con datos de sondas individuales, donde multiples sondas de material genético diferentes miden la expresión de un solo gen. Esta nueva técnica fue demostrada en dos conjuntos de datos provenientes de experimentos iguales hechos en dos tecnologias de microarreglos distintos. El experimento fue diseñado para probar y validar técnicas de análisis, midiendo el grado de concordancia entre los dos tipos de microarreglos Para este experimento diseñamos una metodología para cuantificar la concordancia entre los resultados en ambos tipos de microarreglos. Esta metodología utiliza el concepto de información mutua para asignar un valor cuantitativo al grado de concordancia. Nuestros resultados demuestran que nuestra metodología de discretización y corrección de errores resulta en mayor concordancia, determinado por un aumento en la información mutua, cuando la comparamos con las técnicas usuales de análisis que promedian la información de las distintas sondas y de las repeticiones. También aprovechamos modelos sobre conjuntos finitos para producir un mod- elo con mayor número de niveles de expresión, que puede capturar diferencias más sutiles entre los niveles de expresión de un gen. Por último, demostramos applicaciones futuras utilizando propiedades algebraicas de cuerpos finitos para encontrar una solución algebraica a el problema de determinar una función que explique la relación entre genes.	en_US
dc.description.graduationYear	2008	en_US
dc.description.sponsorship	Support from a SCORE grant (S06GM08102) and an INBRE grant (P20RR16470) from the National Institutes of Health.	en_US
dc.identifier.uri	https://hdl.handle.net/20.500.11801/2225
dc.language.iso	en	en_US
dc.rights.holder	(c) 2008 Humberto Ortiz Zuazaga	en_US
dc.rights.license	All rights reserved	en_US
dc.title	Discrete methods for microarray analysis	en_US
dc.type	Thesis	en_US
dspace.entity.type	Publication
thesis.degree.discipline	Computer Engineering	en_US
thesis.degree.level	PhD	en_US

Files

Original bundle

Now showing 1 - 1 of 1

Name:: ICOM_OrtizZuazagaH_2008.pdf
Size:: 571.3 KB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Theses & Dissertations

Publication: Discrete methods for microarray analysis

Files

Original bundle

Collections

Publication:

Discrete methods for microarray analysis