Componentes principales supervisados para clasificación de datos de expresión genética

Porras-Cerrón, Jaime C.

Publication:

Componentes principales supervisados para clasificación de datos de expresión genética

dc.contributor.advisor	Acuña-Fernández, Edgar
dc.contributor.author	Porras-Cerrón, Jaime C.
dc.contributor.college	College of Arts and Sciences - Sciences	en_US
dc.contributor.committee	Quintana, Julio
dc.contributor.committee	Lorenzo, Edgardo
dc.contributor.department	Department of Mathematics	en_US
dc.contributor.representative	Ducoudray, Gladys
dc.date.accessioned	2019-04-15T15:50:43Z
dc.date.available	2019-04-15T15:50:43Z
dc.date.issued	2005
dc.description.abstract	The gene expression data obtained through the technology of microarrays are characterized by its considerably greater amount of features in comparison to the number of observations. The direct use of traditional statistics techniques of supervised classification can give poor results in gene expression data. Therefore before analyzing this type of data is advisable to perform a dimension reduction. The present work combines two types of dimensional reduction techniques: feature selection and feature extraction. In the first step of the proposed method feature selection is applied, and in the second step principal components are formed with the selected features. This technique is called Supervised Principal Components (SPC). Three classifiers are applied to these components and the misclassification error is estimated. Two algorithms of SPC are presented; they essentially, differ in the time in which the feature selection is made. Finally, the results of this new technique are applied to nine gene expression data sets.	en_US
dc.description.abstract	Los datos de expresiones genéticas obtenidos a través de la tecnología de microarreglos tienen como característica principal contar con una cantidad considerablemente mayor de variables en comparación al número de observaciones. En estos casos utilizar directamente técnicas estadísticas tradicionales de clasificación supervisada puede brindar resultados poco satisfactorios. Por esta razón es recomendable realizar una reducción de dimensionalidad, antes de analizar este tipo de datos. El presente trabajo combina dos formas de reducción de dimensionalidad: selección de variables y extracción de variables. Como primer paso del método propuesto, se realiza una selección de variables (se usaron diferentes procedimientos) para posteriormente, con las variables seleccionadas, formar Componentes Principales, los cuales son llamados Componentes Principales Supervisados (CPS). A estos componentes se les pueden aplicar distintos clasificadores para obtener finalmente el error de mala clasificación. Se presentan dos algoritmos de CPS, que esencialmente, se diferencian en el momento en que se hace la selección de variables. Finalmente, se muestran los resultados de esta nueva técnica aplicada a nueve conjuntos de datos de expresión genética.	en_US
dc.description.graduationYear	2005	en_US
dc.identifier.uri	https://hdl.handle.net/20.500.11801/2000
dc.language.iso	Spanish	en_US
dc.rights.holder	(c) 2005 Jaime Carlos Porras-Cerrón	en_US
dc.rights.license	All rights reserved	en_US
dc.subject	Datos de expresión genética	en_US
dc.title	Componentes principales supervisados para clasificación de datos de expresión genética	en_US
dc.type	Thesis	en_US
dspace.entity.type	Publication
thesis.degree.discipline	Mathematical Statistics	en_US
thesis.degree.level	M.S.	en_US

Files

Original bundle

Now showing 1 - 1 of 1

Name:: MATE_PorrasCerronJ_2005.pdf
Size:: 793.21 KB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Theses & Dissertations

Publication: Componentes principales supervisados para clasificación de datos de expresión genética

Files

Original bundle

Collections

Publication:

Componentes principales supervisados para clasificación de datos de expresión genética