Uso de técnicas de clasificación en conglomerados para describir perfiles en grandes bases de datos educativas

Jaimes, Luis G.

Publication:

Uso de técnicas de clasificación en conglomerados para describir perfiles en grandes bases de datos educativas

dc.contributor.advisor	McGee, Daniel L.
dc.contributor.author	Jaimes, Luis G.
dc.contributor.college	College of Arts and Sciences - Sciences	en_US
dc.contributor.committee	Quintana, Julio
dc.contributor.committee	Wayland, Keith
dc.contributor.department	Department of Mathematics	en_US
dc.contributor.representative	Fernando-Vega, José
dc.date.accessioned	2019-04-15T15:50:44Z
dc.date.available	2019-04-15T15:50:44Z
dc.date.issued	2004
dc.description.abstract	This thesis describes the procedures used to identify the natural clusters formed by the students from Calculus that participated in the Quiz Project of the Mathematics Department at the University of Puerto Rico Mayagüez Campus The principal techniques for clustering and cluster validation are also discussed. In total four, clustering techniques with validation measures were employed The project was developed in stages. In the first stage data was collected from the Quiz system. For this purpose, an application was developed that inputs files containing quiz results, questionnaires and class results and outputs the information to matrix in which each row represented a student and each column an attribute. During the second stage the information was processed to eliminate unwanted data and weights were assigned to each datum associates with a student. A metric was employed that would help determine the similarities and dissimilarities between students. To formulate an effective methodology to ascertain the clusters that were present in the actual data, datasets consisting of a number of n-dimensional normal distribution with a variety of means and standard deviations were prepared to simulate real data. The simulated datasets were grouped with the cluster algorithms and validation measures were used to determinate the quality of the grouping. The methodology developed with the simulated data was then applied to find natural cluster existing in the real data.	en_US
dc.description.abstract	En esta tesis se describe el proceso utilizado para encontrar los conglomerados naturales en los que se encuentran agrupados los estudiantes de Cálculo I que participan en el proyecto QUIZ del Departamento de Matemáticas de la UPRM. Además, se muestra un panorama general de las principales técnicas de agrupación y validación de conglomerados. Para este propósito se utilizaron cuatro de los algoritmos más representativos de estas técnicas y cuatro medidas de validación. El proyecto se desarrolló en varias etapas. En la primera se extrajo la información del sistema Quiz, para lo cual se creó una aplicación que extrae información de archivos de texto en diferentes formatos y con estos datos crea una matriz donde cada fila corresponde a un estudiante y cada columna a sus atributos. En la siguiente etapa se procesó la información mediante la eliminación de datos y la asignación de pesos. Luego se adoptó una métrica para determinar lo similar o disimilar que son los estudiantes entre sí. Como se desconocen las clases a las cuales pertenecen los alumnos y el número de ellas, se diseñó una metodología para identificarlas. Esta metodología consiste de la aplicación de algoritmos de agrupamiento a datos generados aleatoriamente normalmente distribuidos que pretenden simular los datos reales. Posteriormente se midió la calidad de los conglomerados formados con las medidas de validación y se compararon estos conglomerados con los conglomerados reales. De esta forma se pudo establecer el comportamiento de los algoritmos con diferentes estructuras de datos y el grado de confiabilidad de las diferentes medidas de validación. Finalmente se aplicó esta metodología para encontrar los conglomerados naturales subyacentes en los datos reales.	en_US
dc.description.graduationYear	2004	en_US
dc.identifier.uri	https://hdl.handle.net/20.500.11801/2008
dc.language.iso	Spanish	en_US
dc.rights.holder	(c) 2004 Luis Gabriel Jaimes	en_US
dc.rights.license	All rights reserved	en_US
dc.subject	Clasificación en conglomerados	en_US
dc.title	Uso de técnicas de clasificación en conglomerados para describir perfiles en grandes bases de datos educativas	en_US
dc.type	Thesis	en_US
dspace.entity.type	Publication
thesis.degree.discipline	Scientific Computing	en_US
thesis.degree.level	M.S.	en_US

Files

Original bundle

Now showing 1 - 1 of 1

Name:: MATE_JaimesLG_2004.pdf
Size:: 444.32 KB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Theses & Dissertations

Publication: Uso de técnicas de clasificación en conglomerados para describir perfiles en grandes bases de datos educativas

Files

Original bundle

Collections

Publication:

Uso de técnicas de clasificación en conglomerados para describir perfiles en grandes bases de datos educativas