Publication:
Clasificación noparamétrica en datos direccionales

Thumbnail Image
Authors
Velasco-Forero, Santiago A.
Embargoed Until
Advisor
Acuña-Fernández, Edgar
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2004
Abstract
In a supervised classification problem, when the vectors of data are direction- al, it means, that they take values on a k-dimensional sphere, the application of the algorithms of pattern recognition as k-nearest-neighbour method, discriminant analysis, and kernel discriminant analysis, do not obtain good results in classification error rate. For this type of problems, we propose several algorithms based on directional k-nearest-neighbour, estimation of density for directional kernel and discriminant analysis with assumption of von Mises-Fisher distribution. Additionally we present an extension for these classification methods for directional data in standard sets (not directional), based in the correlation matrix. We illustrate the performance of these methods on simulated data, machine learning datasets and microarray data sets.

Si se tiene un problema de clasificación supervisada donde los vectores de datos son direccionales, es decir, toman valores sobre una esfera k-dimensional, la aplicación de los métodos de reconocimiento de patrones tales como k-vecinos más cercano, análisis de discriminante y clasificación por estimación de densidad por kernel, no tienen buenos resultados en cuanto a tasa de error en la clasificación. Se propone para este tipo de problemas, algoritmos basados en k-vecinos más cercanos direccionales, en estimación de densidad por kernel direccional y en el análisis de discriminante direccional con el supuesto de distribución de von Mises-Fisher. Adicionalmente se presenta una extención para utilizar los métodos de clasificación para datos direccionales en conjuntos estándar (no direccionales), basándose en la matriz de correlación entre individuos. Se ilustra el rendimiento de los métodos en conjuntos simulados, en datos de aprendizaje automático y en datos de expresión genética tomadas por medio de microareglos.
Keywords
Clasificación noparamétrica
Cite
Velasco-Forero, S. A. (2004). Clasificación noparamétrica en datos direccionales [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/2011