Publication:
Análisis sobre métodos de pruebas de hipótesis múltiple en la identificación de genes diferencialmente expresados

dc.contributor.advisor Acuña-Fernández, Edgar
dc.contributor.author Muñiz-Rivera, Lus M.
dc.contributor.college College of Arts and Sciences - Sciences en_US
dc.contributor.committee Santana Morant, Dámaris
dc.contributor.committee Lorenzo González, Edgardo
dc.contributor.department Department of Mathematics en_US
dc.contributor.representative Martínez Cruzado, Juan Carlos
dc.date.accessioned 2018-06-03T23:14:36Z
dc.date.available 2018-06-03T23:14:36Z
dc.date.issued 2009-07
dc.description.abstract The Human Genome Project is the most important reason for the surge of new technologies in the microarray area. These technologies facilitate the experimentation with a large number of genes simultaneously. These experiments allow, for example, to compare the genetic expressions between sick and healthy cells. One of the main goals in analysis of gene expression data from microarray experiments is the identification of genes differentially expressed. To accomplish this goal various methods are used. One of them is to use multiple testing establishing a null hypothesis of not association between the measure of gene expression and the response is tested for each gene. Due to the fact that in microarray experiments thousand of genes are considered, the same amount of tests must be considered. In this situation, the probability of error type I increases with the number of hypothesis. Thus, a p-value near zero can occur randomly due to the large number of hypothesis that are tested simultaneously and not because the gene is differentially expressed. In this thesis, we study methods for multiple testing on data coming from microarray experiments. We compare theoretically and experimentally ten multiple hypothesis testing methods on six gene expression data sets, which are freely available in the internet.
dc.description.abstract Con el Proyecto del Genoma Humano surgieron nuevas tecnologías, tales como los microarreglos que facilitan la ejecución de experimentos con un gran número de genes simultáneamente. Estos experimentos permiten, por ejemplo, comparar la expresión genética entre una célula sana y una enferma. Una de las principales metas en el análisis de datos de expresión de genes en experimentos de microarreglos es la identificación de genes diferencialmente expresados. Para alcanzar esta meta se han propuesto varios métodos, entre ellos, los métodos de prueba de hipótesis múltiple, los cuales establecen simultáneamente para cada gen una hipótesis nula de no asociación entre la medida de expresión de los genes y la respuesta. Pero debido a que los experimentos de microarreglos consideran miles de genes, la misma cantidad de pruebas ha de ser considerada. Por tanto la probabilidad de cometer un Error Tipo I aumenta con el número de hipótesis; pues, un p-value cercano a cero puede ser producto del azar debido al gran número de hipótesis que se prueban simultáneamente y no porque el gen sea diferencialmente expresado. En esta tesis, estudiamos métodos de prueba de hipótesis múltiple para datos de expresión genética provenientes de experimentos de microarreglos. Para ello examinamos y comparamos, teóricamente y experimentalmente diez métodos de prueba de hipótesis múltiple empleando seis conjuntos de datos de expresión genética, disponibles gratuitamente en la internet.
dc.description.graduationSemester Summer en_US
dc.description.graduationYear 2009 en_US
dc.description.sponsorship Departamento de la Defensa Grant N0014-061-1-0555 Naval (ONR) Grant N0014-03-0359 en_US
dc.identifier.uri https://hdl.handle.net/20.500.11801/693
dc.language.iso es en_US
dc.rights.holder (c)2009 Luz M. Muñiz Rivera en_US
dc.rights.license All rights reserved en_US
dc.subject Probability en_US
dc.subject P-value en_US
dc.subject Human Genome Project en_US
dc.subject Microarrays en_US
dc.subject.lcsh Statistical hypothesis testing -- Mathematical models en_US
dc.subject.lcsh Genomics -- Statistical methods en_US
dc.subject.lcsh Cluster analysis en_US
dc.subject.lcsh Multiple comparisons (Statisitcs) en_US
dc.subject.lcsh Human genome en_US
dc.subject.lcsh Microarrays, DNA en_US
dc.title Análisis sobre métodos de pruebas de hipótesis múltiple en la identificación de genes diferencialmente expresados en_US
dc.title.alternative Analysis of multiple hypothesis testing procedure on the identification of differentially expressed genes en_US
dc.type Thesis en_US
dspace.entity.type Publication
thesis.degree.discipline Mathematical Statistics en_US
thesis.degree.level M.S. en_US
Files
Original bundle
Now showing 1 - 1 of 1
Thumbnail Image
Name:
MATE_MuñizRiveraLM_2009.pdf
Size:
2.66 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.64 KB
Format:
Item-specific license agreed upon to submission
Description: