Publication:
Optimization-driven meta-analysis: The simultaneous search for cancer biomarkers with multiple microarray experiments

Thumbnail Image
Authors
Camacho-Cáceres, Katia I.
Embargoed Until
Advisor
Cabrera-Ríos, Mauricio
College
College of Engineering
Department
Department of Industrial Engineering
Degree Level
M.S.
Publisher
Date
2014
Abstract
In bioinformatics, it is possible to generate experimental data at a high pace. For example, microarrays can provide large amounts of data for genetic relative expression in illnesses of interest such as cancer. These data are stored and often times abandoned when new experimental technologies arrive. This work, re-examines lung cancer microarray data with a multiple criteria optimization-based strategy developed in our research group. This strategy does not require any adjustment of parameters by the user and is capable to converge consistently to important genes –potential biomarkers- even in the presence of multiple and incommensurate units across microarrays. In this thesis, three different cases were approached with the proposed method: lung cancer and leukemia, each using microarrays, and breast cancer with microRNA. The lists of resulting genes in the first two cases are provided with a discussion of their role in cancer, as well as the possible research directions for each of them. A list of microRNA sequences is also provided in the third case, emphasizing that this last case is to demonstrate the transferability of analysis ideas to other high throughput biological experiments. It is also recognized at this point that experimental validation is necessary to confirm the role of genes for which not enough evidence was found in the literature. Fundamentally, these genes with little reported information represent the best opportunities for biological discovery from existing data.

En bioinformática es posible la generación de datos experimentales a un paso muy acelerado. Los microarreglos, por ejemplo, pueden proveer grandes cantidades de datos sobre expresión genética relativa en una enfermedad de interés como lo es el cáncer. Esta data es almacenada y en muchas ocasiones abandonada cuando nueva tecnología experimental es desarrollada. Este trabajo re examina la data proveniente de microarreglos de cáncer del pulmón utilizando una estrategia de optimización multicriterio que fue desarrollada previamente en nuestro grupo de investigación. Esta estrategia no requiere de ajustes en los parámetros por parte del usuario y es capaz de converger consistentemente a genes importantes considerados como biomarcadores potenciales, incluso en presencia de unidades múltiples e inconmensurables a través de los microarreglos. En esta tesis tres casos diferentes fueron abordados con el método propuesto: el cáncer de pulmón y leucemia, cada una usando microarreglos y el cáncer de seno con microRNA. La lista de los genes resultantes de los dos primeros casos, se provee con una discusión sobre su rol en el cáncer, al igual que las posibles direcciones de investigación para cada uno de ellos. Igualmente se provee la lista de secuencias de microRNA del tercer caso, enfatizando que este último puede ser transferido y aplicado a otros tipos de alto rendimiento de experimentos biológicos. Se reconoce en este punto que la validación experimental es necesaria para confirmar el rol de estos genes para los cuales no se encontró suficiente evidencia en la literatura. Fundamentalmente estos genes con poca información representan mejores oportunidades para descubrimientos biológicos en la data ya existente.
Keywords
Cancer biomarkers,
Microarrays
Cite
Camacho-Cáceres, K. I. (2014). Optimization-driven meta-analysis: The simultaneous search for cancer biomarkers with multiple microarray experiments [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/1548