Publication:
An integrative data-driven approach to identify molecular patterns in breast cancer patients

dc.contributor.advisor Torres García, Wandaliz
dc.contributor.author Narváez Bandera, Isis Y.
dc.contributor.college College of Engineering en_US
dc.contributor.committee Cabrera, Mauricio
dc.contributor.committee Domenech, Maribella
dc.contributor.department Department of Industrial Engineering en_US
dc.contributor.representative Rodríguez Román, Daniel
dc.date.accessioned 2018-09-19T19:34:07Z
dc.date.available 2018-09-19T19:34:07Z
dc.date.issued 2017
dc.description.abstract El cáncer de mama es una enfermedad heterogénea del genoma que necesita mejores diagnósticos y tratamientos a través de la caracterización de patrones genómicos e interacciones. Actualmente, su comprensión molecular es aún insuficiente incluso con los avances en las tecnologías genómicas. Por lo tanto, esta tesis presenta un enfoque de minería de datos en varias etapas para discriminar los subtipos de cáncer de mama a través de la integración de datos altamente dimensionales de diferentes plataformas genómicas utilizando técnicas de selección y clasificación de características. Esta metodología nos permitió extraer patrones que desempeñan un papel crítico en la clasificación de los subtipos de cáncer de mama (es decir, la subexpresión de FOXA1 para basal). Además, esta tesis proporciona una nueva métrica capaz de evaluar y clasificar las interacciones entre las características pertinentes utilizando un criterio de prevalencia y el clasificador Random Forest. Esta métrica identificó una lista de interacciones de variables importantes para discriminar subtipos. Entre las principales interacciones, encontramos un conjunto de genes correlacionados interactuando frecuentemente con FOXA1 o MLPH tales como CEP55 y UBET2. en_US
dc.description.abstract El cáncer de mama es una enfermedad heterogénea del genoma que necesita mejores diagnósticos y tratamientos a través de la caracterización de patrones genómicos e interacciones. Actualmente, su comprensión molecular es aún insuficiente incluso con los avances en las tecnologías genómicas. Por lo tanto, esta tesis presenta un enfoque de minería de datos en varias etapas para discriminar los subtipos de cáncer de mama a través de la integración de datos altamente dimensionales de diferentes plataformas genómicas utilizando técnicas de selección y clasificación de características. Esta metodología nos permitió extraer patrones que desempeñan un papel crítico en la clasificación de los subtipos de cáncer de mama (es decir, la subexpresión de FOXA1 para basal). Además, esta tesis proporciona una nueva métrica capaz de evaluar y clasificar las interacciones entre las características pertinentes utilizando un criterio de prevalencia y el clasificador Random Forest. Esta métrica identificó una lista de interacciones de variables importantes para discriminar subtipos. Entre las principales interacciones, encontramos un conjunto de genes correlacionados interactuando frecuentemente con FOXA1 o MLPH tales como CEP55 y UBET2. en_US
dc.description.graduationYear 2017 en_US
dc.identifier.uri https://hdl.handle.net/20.500.11801/930
dc.language.iso en en_US
dc.rights.holder (c) 2017 Isis Yanina Narvaez Bandera en_US
dc.rights.license All rights reserved en_US
dc.subject Random Forest en_US
dc.subject Breast cancer en_US
dc.subject Genomic patterns en_US
dc.subject.lcsh Data mining en_US
dc.subject.lcsh Gene expression en_US
dc.subject.lcsh Nucleotide sequence en_US
dc.subject.lcsh Breast--Cancer--Patients en_US
dc.title An integrative data-driven approach to identify molecular patterns in breast cancer patients en_US
dc.type Thesis en_US
dspace.entity.type Publication
thesis.degree.discipline Industrial Engineering en_US
thesis.degree.level M.S. en_US
Files
Original bundle
Now showing 1 - 1 of 1
Thumbnail Image
Name:
ININ_NarvaezBanderaIY_2017.pdf
Size:
3.62 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.64 KB
Format:
Item-specific license agreed upon to submission
Description: