Publication:
Efecto de casos anómalos en máquinas de vectores de soporte
Efecto de casos anómalos en máquinas de vectores de soporte
Authors
Restrepo-Henao, Alba M.
Embargoed Until
Advisor
Acuña-Fernández, Edgar
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2009-03
Abstract
Support Vector Machines (SVM) is a new technique of classification that has received much attention in recent years. In many applications, the SVM has shown better performance than machine learning methods, and it has been introduced as a powerful tool for solving classification problems. The SVM was originally developed for binary classification, but was later generalized to problems with various classes using different approaches. Currently, the SVM can be applied to an extensive list of scientific and real life problems. This thesis describes the SVM method for the separable case, the non-separable case, and for multiple classes. Several outlier detection methods are discussed including the support vector description method as well as the use of SVM for one class classification to detect outliers. Experiments with the SVM classifier were made and it is empirically shown that after the elimination of the detected outliers the misclassification error rate of the SVM classifier is improved. All experiments were carried out on 5 data sets available at the Machine Learning Database Repository of the University California, Irvine.
Las Máquinas de Soporte Vectorial (SVM), son una nueva técnica de clasificación que ha recibido mucha atención en años recientes. En muchas aplicaciones, el SVM ha mostrado tener mejor desempeño que las máquinas de aprendizaje y ha sido introducido como una herramienta poderosa para resolver problemas de clasificación. Originalmente, el SVM fue desarrollado para clasificación binaria, pero fue posteriormente más tarde generalizado para varias clases usando diferentes variantes. Actualmente el SVM se puede aplicar a una lista extensa de problemas científicos y de la vida real. La presente tesis describe el método SVM, tanto para el caso separable, como el no separable, y para múltiple clases. Varios métodos para detectar “outliers” son discutidos incluyendo el método de descripción por vectores de soporte así como el clasificador SVM con una sola clase para detectar “outliers”. Se realizaron experimentos con el clasificador SVM con una sola clase, y se realizan experimentos con el SVM en clasificación y se prueba empíricamente que después de la eliminación de los “outliers” encontrados, se logra una mejora en la tasa de error de mala clasificación del clasificador SVM. Todos los experimentos se realizaron en 5 conjuntos de datos disponible en el repositorio de bases de datos Máquinas de aprendizaje de la Universidad de California en Irvine.
Las Máquinas de Soporte Vectorial (SVM), son una nueva técnica de clasificación que ha recibido mucha atención en años recientes. En muchas aplicaciones, el SVM ha mostrado tener mejor desempeño que las máquinas de aprendizaje y ha sido introducido como una herramienta poderosa para resolver problemas de clasificación. Originalmente, el SVM fue desarrollado para clasificación binaria, pero fue posteriormente más tarde generalizado para varias clases usando diferentes variantes. Actualmente el SVM se puede aplicar a una lista extensa de problemas científicos y de la vida real. La presente tesis describe el método SVM, tanto para el caso separable, como el no separable, y para múltiple clases. Varios métodos para detectar “outliers” son discutidos incluyendo el método de descripción por vectores de soporte así como el clasificador SVM con una sola clase para detectar “outliers”. Se realizaron experimentos con el clasificador SVM con una sola clase, y se realizan experimentos con el SVM en clasificación y se prueba empíricamente que después de la eliminación de los “outliers” encontrados, se logra una mejora en la tasa de error de mala clasificación del clasificador SVM. Todos los experimentos se realizaron en 5 conjuntos de datos disponible en el repositorio de bases de datos Máquinas de aprendizaje de la Universidad de California en Irvine.
Keywords
Support Vector Machines,
Classification problems,
Binary classification,
Outlier detection
Classification problems,
Binary classification,
Outlier detection
Usage Rights
Persistent URL
Cite
Restrepo-Henao, A. M. (2009). Efecto de casos anómalos en máquinas de vectores de soporte [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/696