Publication:
Componentes principales supervisados para clasificación de datos de expresión genética

dc.contributor.advisor Acuña-Fernández, Edgar
dc.contributor.author Porras-Cerrón, Jaime C.
dc.contributor.college College of Arts and Sciences - Sciences en_US
dc.contributor.committee Quintana, Julio
dc.contributor.committee Lorenzo, Edgardo
dc.contributor.department Department of Mathematics en_US
dc.contributor.representative Ducoudray, Gladys
dc.date.accessioned 2019-04-15T15:50:43Z
dc.date.available 2019-04-15T15:50:43Z
dc.date.issued 2005
dc.description.abstract The gene expression data obtained through the technology of microarrays are characterized by its considerably greater amount of features in comparison to the number of observations. The direct use of traditional statistics techniques of supervised classification can give poor results in gene expression data. Therefore before analyzing this type of data is advisable to perform a dimension reduction. The present work combines two types of dimensional reduction techniques: feature selection and feature extraction. In the first step of the proposed method feature selection is applied, and in the second step principal components are formed with the selected features. This technique is called Supervised Principal Components (SPC). Three classifiers are applied to these components and the misclassification error is estimated. Two algorithms of SPC are presented; they essentially, differ in the time in which the feature selection is made. Finally, the results of this new technique are applied to nine gene expression data sets. en_US
dc.description.abstract Los datos de expresiones genéticas obtenidos a través de la tecnología de microarreglos tienen como característica principal contar con una cantidad considerablemente mayor de variables en comparación al número de observaciones. En estos casos utilizar directamente técnicas estadísticas tradicionales de clasificación supervisada puede brindar resultados poco satisfactorios. Por esta razón es recomendable realizar una reducción de dimensionalidad, antes de analizar este tipo de datos. El presente trabajo combina dos formas de reducción de dimensionalidad: selección de variables y extracción de variables. Como primer paso del método propuesto, se realiza una selección de variables (se usaron diferentes procedimientos) para posteriormente, con las variables seleccionadas, formar Componentes Principales, los cuales son llamados Componentes Principales Supervisados (CPS). A estos componentes se les pueden aplicar distintos clasificadores para obtener finalmente el error de mala clasificación. Se presentan dos algoritmos de CPS, que esencialmente, se diferencian en el momento en que se hace la selección de variables. Finalmente, se muestran los resultados de esta nueva técnica aplicada a nueve conjuntos de datos de expresión genética. en_US
dc.description.graduationYear 2005 en_US
dc.identifier.uri https://hdl.handle.net/20.500.11801/2000
dc.language.iso Spanish en_US
dc.rights.holder (c) 2005 Jaime Carlos Porras-Cerrón en_US
dc.rights.license All rights reserved en_US
dc.subject Datos de expresión genética en_US
dc.title Componentes principales supervisados para clasificación de datos de expresión genética en_US
dc.type Thesis en_US
dspace.entity.type Publication
thesis.degree.discipline Mathematical Statistics en_US
thesis.degree.level M.S. en_US
Files
Original bundle
Now showing 1 - 1 of 1
Thumbnail Image
Name:
MATE_PorrasCerronJ_2005.pdf
Size:
793.21 KB
Format:
Adobe Portable Document Format
Description: