Show simple item record

dc.contributor.advisorAcuña-Fernández, Edgar
dc.contributor.authorPorras-Cerrón, Jaime C.
dc.description.abstractThe gene expression data obtained through the technology of microarrays are characterized by its considerably greater amount of features in comparison to the number of observations. The direct use of traditional statistics techniques of supervised classification can give poor results in gene expression data. Therefore before analyzing this type of data is advisable to perform a dimension reduction. The present work combines two types of dimensional reduction techniques: feature selection and feature extraction. In the first step of the proposed method feature selection is applied, and in the second step principal components are formed with the selected features. This technique is called Supervised Principal Components (SPC). Three classifiers are applied to these components and the misclassification error is estimated. Two algorithms of SPC are presented; they essentially, differ in the time in which the feature selection is made. Finally, the results of this new technique are applied to nine gene expression data sets.en_US
dc.description.abstractLos datos de expresiones genéticas obtenidos a través de la tecnología de microarreglos tienen como característica principal contar con una cantidad considerablemente mayor de variables en comparación al número de observaciones. En estos casos utilizar directamente técnicas estadísticas tradicionales de clasificación supervisada puede brindar resultados poco satisfactorios. Por esta razón es recomendable realizar una reducción de dimensionalidad, antes de analizar este tipo de datos. El presente trabajo combina dos formas de reducción de dimensionalidad: selección de variables y extracción de variables. Como primer paso del método propuesto, se realiza una selección de variables (se usaron diferentes procedimientos) para posteriormente, con las variables seleccionadas, formar Componentes Principales, los cuales son llamados Componentes Principales Supervisados (CPS). A estos componentes se les pueden aplicar distintos clasificadores para obtener finalmente el error de mala clasificación. Se presentan dos algoritmos de CPS, que esencialmente, se diferencian en el momento en que se hace la selección de variables. Finalmente, se muestran los resultados de esta nueva técnica aplicada a nueve conjuntos de datos de expresión genética.en_US
dc.subjectDatos de expresión genéticaen_US
dc.titleComponentes principales supervisados para clasificación de datos de expresión genéticaen_US
dc.rights.licenseAll rights reserveden_US
dc.rights.holder(c) 2005 Jaime Carlos Porras-Cerrónen_US
dc.contributor.committeeQuintana, Julio
dc.contributor.committeeLorenzo, Edgardo
dc.contributor.representativeDucoudray, Gladys Statisticsen_US
dc.contributor.collegeCollege of Arts and Sciences - Sciencesen_US
dc.contributor.departmentDepartment of Mathematicsen_US

Files in this item


This item appears in the following Collection(s)

  • Theses & Dissertations
    Items included under this collection are theses, dissertations, and project reports submitted as a requirement for completing a degree at UPR-Mayagüez.

Show simple item record

All rights reserved
Except where otherwise noted, this item's license is described as All Rights Reserved