Publication:
High precision detection of LINE-1s in human genomes

dc.contributor.advisor Seguel, Jaime
dc.contributor.author López Gerena, Juan Omar
dc.contributor.college College of Engineering en_US
dc.contributor.committee Vélez Rivera, Bienvenido
dc.contributor.committee Schütz Schmuck, Marko
dc.contributor.committee Torres García, Wandaliz
dc.contributor.department Department of Computer Science and Engineering en_US
dc.contributor.representative Isaza Brando, Clara E.
dc.date.accessioned 2022-05-25T17:34:35Z
dc.date.available 2022-05-25T17:34:35Z
dc.date.issued 2022-05-20
dc.description.abstract Long interspersed elements 1 (LINE-1s or L1s) are autonomous retrotransposons that make up about 17% of the human genome. Strong correlations between abnormal L1 expression and several human diseases have been reported, which has motivated an interest in accurate quantification of the number of L1 copies present in any given biological specimen. A main obstacle towards this aim is that L1s are relatively long DNA segments with regions of high variability often with truncated or added fragments. These particularities render traditional alignment strategies, such as seed-and-extend, inefficient, as the number of segments that are similar to L1s explodes exponentially. Here, a new strategy is introduced to increase quantification efficiency, resulting in a more accurate identification of L1s. This dissertation discusses this method and experimentally validates its superiority for L1 detection over alternative methods, and also considers some additional potential applications. en_US
dc.description.abstract Los elementos intercalados largos 1 (LINE-1 o L1, por sus siglas en inglés) son retrotransposones autónomos que constituyen aproximadamente el 17% del genoma humano. Se han reportado fuertes correlaciones entre la expresión anormal de L1 y varias enfermedades humanas, lo que ha motivado un interés en la cuantificación precisa del número de copias de L1 presentes en cualquier espécimen biológico dado. Un obstáculo principal para este objetivo es que los L1 son segmentos de ADN relativamente largos con regiones de alta variabilidad, frecuentemente con fragmentos truncados o añadidos. Estas particularidades hacen que las estrategias de alineación tradicionales, como sembrar y extender («seed and extend»), sean ineficientes, ya que el número de segmentos que son similares a los L1 explota exponencialmente. Aquí se introduce una nueva estrategia para aumentar la eficiencia de cuantificación, resultando en una identificación de L1s más precisa. Esta disertación discute este método y experimentalmente muestra su superioridad para la detección de L1s sobre métodos alternos, y también considera potenciales aplicaciones adicionales. en_US
dc.description.graduationSemester Spring en_US
dc.description.graduationYear 2022 en_US
dc.identifier.uri https://hdl.handle.net/20.500.11801/2911
dc.language.iso en en_US
dc.rights Attribution-ShareAlike 4.0 International *
dc.rights.holder (c) 2022 Juan Omar López Gerena en_US
dc.rights.uri http://creativecommons.org/licenses/by-sa/4.0/ *
dc.subject Long interspersed nuclear elements (LINE-1) en_US
dc.subject Probes en_US
dc.subject Pattern en_US
dc.subject.lcsh Human genome en_US
dc.subject.lcsh DNA probes en_US
dc.subject.lcsh DNA - Synthesis en_US
dc.subject.lcsh Human genome - Hypervariable regions en_US
dc.title High precision detection of LINE-1s in human genomes en_US
dc.title.alternative Detección de alta precisión de LINE-1s en genomas humanos en_US
dc.type Dissertation en_US
dspace.entity.type Publication
thesis.degree.discipline Computing and Information Sciences and Engineering en_US
thesis.degree.level Ph.D. en_US
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
ICCD_LopezGerenaJO_2022.pdf
Size:
715.93 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.26 KB
Format:
Item-specific license agreed upon to submission
Description: