Publication:
An integrative data-driven approach to identify molecular patterns in breast cancer patients
An integrative data-driven approach to identify molecular patterns in breast cancer patients
dc.contributor.advisor | Torres García, Wandaliz | |
dc.contributor.author | Narváez Bandera, Isis Y. | |
dc.contributor.college | College of Engineering | en_US |
dc.contributor.committee | Cabrera, Mauricio | |
dc.contributor.committee | Domenech, Maribella | |
dc.contributor.department | Department of Industrial Engineering | en_US |
dc.contributor.representative | Rodríguez Román, Daniel | |
dc.date.accessioned | 2018-09-19T19:34:07Z | |
dc.date.available | 2018-09-19T19:34:07Z | |
dc.date.issued | 2017 | |
dc.description.abstract | El cáncer de mama es una enfermedad heterogénea del genoma que necesita mejores diagnósticos y tratamientos a través de la caracterización de patrones genómicos e interacciones. Actualmente, su comprensión molecular es aún insuficiente incluso con los avances en las tecnologías genómicas. Por lo tanto, esta tesis presenta un enfoque de minería de datos en varias etapas para discriminar los subtipos de cáncer de mama a través de la integración de datos altamente dimensionales de diferentes plataformas genómicas utilizando técnicas de selección y clasificación de características. Esta metodología nos permitió extraer patrones que desempeñan un papel crítico en la clasificación de los subtipos de cáncer de mama (es decir, la subexpresión de FOXA1 para basal). Además, esta tesis proporciona una nueva métrica capaz de evaluar y clasificar las interacciones entre las características pertinentes utilizando un criterio de prevalencia y el clasificador Random Forest. Esta métrica identificó una lista de interacciones de variables importantes para discriminar subtipos. Entre las principales interacciones, encontramos un conjunto de genes correlacionados interactuando frecuentemente con FOXA1 o MLPH tales como CEP55 y UBET2. | en_US |
dc.description.abstract | El cáncer de mama es una enfermedad heterogénea del genoma que necesita mejores diagnósticos y tratamientos a través de la caracterización de patrones genómicos e interacciones. Actualmente, su comprensión molecular es aún insuficiente incluso con los avances en las tecnologías genómicas. Por lo tanto, esta tesis presenta un enfoque de minería de datos en varias etapas para discriminar los subtipos de cáncer de mama a través de la integración de datos altamente dimensionales de diferentes plataformas genómicas utilizando técnicas de selección y clasificación de características. Esta metodología nos permitió extraer patrones que desempeñan un papel crítico en la clasificación de los subtipos de cáncer de mama (es decir, la subexpresión de FOXA1 para basal). Además, esta tesis proporciona una nueva métrica capaz de evaluar y clasificar las interacciones entre las características pertinentes utilizando un criterio de prevalencia y el clasificador Random Forest. Esta métrica identificó una lista de interacciones de variables importantes para discriminar subtipos. Entre las principales interacciones, encontramos un conjunto de genes correlacionados interactuando frecuentemente con FOXA1 o MLPH tales como CEP55 y UBET2. | en_US |
dc.description.graduationYear | 2017 | en_US |
dc.identifier.uri | https://hdl.handle.net/20.500.11801/930 | |
dc.language.iso | en | en_US |
dc.rights.holder | (c) 2017 Isis Yanina Narvaez Bandera | en_US |
dc.rights.license | All rights reserved | en_US |
dc.subject | Random Forest | en_US |
dc.subject | Breast cancer | en_US |
dc.subject | Genomic patterns | en_US |
dc.subject.lcsh | Data mining | en_US |
dc.subject.lcsh | Gene expression | en_US |
dc.subject.lcsh | Nucleotide sequence | en_US |
dc.subject.lcsh | Breast--Cancer--Patients | en_US |
dc.title | An integrative data-driven approach to identify molecular patterns in breast cancer patients | en_US |
dc.type | Thesis | en_US |
dspace.entity.type | Publication | |
thesis.degree.discipline | Industrial Engineering | en_US |
thesis.degree.level | M.S. | en_US |