Algorithms for non-parametric classifiers in multi-relational data mining

Encarnación-Rivera, Trilce M.

Publication:

Algorithms for non-parametric classifiers in multi-relational data mining

dc.contributor.advisor	Acuña-Fernández, Edgar
dc.contributor.author	Encarnación-Rivera, Trilce M.
dc.contributor.college	College of Arts and Sciences - Sciences	en_US
dc.contributor.committee	Castillo, Paúl E.
dc.contributor.committee	Vasquez, Pedro
dc.contributor.department	Department of Mathematics	en_US
dc.contributor.representative	Carlo, Héctor
dc.date.accessioned	2019-04-15T15:50:42Z
dc.date.available	2019-04-15T15:50:42Z
dc.date.issued	2006
dc.description.abstract	Over the last decades, due to the advances in information technologies, both the industrial and scientific communities have acquired large volumes of data in digital form. Most of these data sets are stored using relational databases consisting of multiple tables and associations. Moreover, the data used in the fields of bio-informatics, computational biology, HTML and XML documents are relational in nature. However, most of the existing approaches to knowledge discovery in databases, assume that the data are stored in a single table. Therefore, new algorithms are needed in order to exploit the relational information provided in these data sets. This thesis proposes two novel solutions to the task of supervised classification in relational domains, based on traditional non-parametric classifiers and built upon relational algebra. The first approach is based on Kernel Density Estimation, and the second technique is based on Gaussian Mixture Models. Both techniques are evaluated using three real world relational data sets, drawn from the fields of organic chemistry, medicine and genetics.	en_US
dc.description.abstract	Avances en las tecnologías de información han hecho posible que en las últimas décadas se hayan generado grandes volúmenes de datos de manera digital. La mayoría de estos conjuntos de datos están almacenados en bases de datos relacionales, utilizando múltiples tablas y asociaciones. Por otro lado, existen otros datos cuya naturaleza es relacional, como son los generados en los campos de bioinformática, biología computacional, documentos de HTML y XML. A pesar de esta gran cantidad de datos relacionales disponibles, la mayoría de los enfoques de minería de datos existentes asumen que los datos se encuentran almacenados en una sola tabla o matriz de datos. Por lo tanto, nuevos algoritmos deben desarrollarse para explotar la información relacional que proveen estos datos. Esta Tesis propone dos nuevas soluciones al problema de clasificación supervisada en bases de datos relacionales, estas soluciones surgen como extensiones a técnicas no-paramétricas tradicionales. El primer enfoque esta basado en estimación de densidad a base de Kernel y la segunda solución se cimenta sobre la estimación de densidad basada en modelos de mezclas Gaussianas. Ambos enfoques son evaluados experimentalmente utilizando tres conjuntos de datos conocidos, estos conjuntos son extraídos de los campos de bioinformática, medicina y genética.	en_US
dc.description.graduationYear	2006	en_US
dc.description.sponsorship	The Office of Naval Research (ONR) under grant number N00014-03- 1-0359.	en_US
dc.identifier.uri	https://hdl.handle.net/20.500.11801/1985
dc.language.iso	English	en_US
dc.rights.holder	(c) 2006 Trilce Marie Encarnación-Rivera	en_US
dc.rights.license	All rights reserved	en_US
dc.subject	Data mining	en_US
dc.title	Algorithms for non-parametric classifiers in multi-relational data mining	en_US
dc.type	Thesis	en_US
dspace.entity.type	Publication
thesis.degree.discipline	Scientific Computing	en_US
thesis.degree.level	M.S.	en_US

Files

Original bundle

Now showing 1 - 1 of 1

Name:: MATE_EncarnacionRiveraT_2006.pdf
Size:: 624.55 KB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Theses & Dissertations

Publication: Algorithms for non-parametric classifiers in multi-relational data mining

Files

Original bundle

Collections

Publication:

Algorithms for non-parametric classifiers in multi-relational data mining