Regresión logística con penalidad ridge aplicada a datos de expresión genética

Thumbnail Image
Prieto-Castellanos, Karen A.
Embargoed Until
Acuña-Fernández, Edgar
College of Arts and Sciences - Sciences
Department of Mathematics
Degree Level
Logistic regression analysis is used in classification to find out which group an individual belong from a predictor variables set. In classification sometimes we work with data sets with more variables than observations. This is the case of microarray data sets, where there are a relatively small number of observations, generally less than one hundred, and a huge number of features, usually thousands. The follow- ing problems in the parameters estimation of logistic regression may occur: over- fitting, unstability and multicollineality. This work explores the logistic regression with Ridge penalty as an alternative to deal with that sort of data sets. It stabilizes the statistical problem, eliminates the numeric degeneracy due to multicollineality and gets low error rates of classification when it is compared with others methods.

El análisis de regresión logística es utilizado en clasificación para determinar la clase a la que pertenece un individuo a partir de un conjunto de variables predictoras. En clasificación algunas veces se trabaja con bases de datos que tienen más variables que observaciones. Este es el caso de las bases de datos de microarreglos, que consisten de un número relativamente pequeño de observaciones, generalmente menos de 100, y una gran cantidad de variables, usualmente miles. Esto genera que al estimar los parámetros de la regresión logística se presenten problemas como: sobreajuste, inestabilidad y multicolinealidad. Este trabajo explora la regresión logística con penalidad “ridge ̧como una alternativa para tratar con este tipo de datos. Esta estabiliza el problema estadístico, elimina la degeneración numérica debida a la multicolinealidad y obtiene bajas tasas de error de clasificación en comparación con otros métodos.
Regresión logística
Prieto-Castellanos, K. A. (2005). Regresión logística con penalidad ridge aplicada a datos de expresión genética [Thesis]. Retrieved from