Publication:
High precision detection of LINE-1s in human genomes

Thumbnail Image
Authors
López Gerena, Juan Omar
Embargoed Until
Advisor
Seguel, Jaime
College
College of Engineering
Department
Department of Computer Science and Engineering
Degree Level
Ph.D.
Publisher
Date
2022-05-20
Abstract
Long interspersed elements 1 (LINE-1s or L1s) are autonomous retrotransposons that make up about 17% of the human genome. Strong correlations between abnormal L1 expression and several human diseases have been reported, which has motivated an interest in accurate quantification of the number of L1 copies present in any given biological specimen. A main obstacle towards this aim is that L1s are relatively long DNA segments with regions of high variability often with truncated or added fragments. These particularities render traditional alignment strategies, such as seed-and-extend, inefficient, as the number of segments that are similar to L1s explodes exponentially. Here, a new strategy is introduced to increase quantification efficiency, resulting in a more accurate identification of L1s. This dissertation discusses this method and experimentally validates its superiority for L1 detection over alternative methods, and also considers some additional potential applications.

Los elementos intercalados largos 1 (LINE-1 o L1, por sus siglas en inglés) son retrotransposones autónomos que constituyen aproximadamente el 17% del genoma humano. Se han reportado fuertes correlaciones entre la expresión anormal de L1 y varias enfermedades humanas, lo que ha motivado un interés en la cuantificación precisa del número de copias de L1 presentes en cualquier espécimen biológico dado. Un obstáculo principal para este objetivo es que los L1 son segmentos de ADN relativamente largos con regiones de alta variabilidad, frecuentemente con fragmentos truncados o añadidos. Estas particularidades hacen que las estrategias de alineación tradicionales, como sembrar y extender («seed and extend»), sean ineficientes, ya que el número de segmentos que son similares a los L1 explota exponencialmente. Aquí se introduce una nueva estrategia para aumentar la eficiencia de cuantificación, resultando en una identificación de L1s más precisa. Esta disertación discute este método y experimentalmente muestra su superioridad para la detección de L1s sobre métodos alternos, y también considera potenciales aplicaciones adicionales.
Keywords
Long interspersed nuclear elements (LINE-1),
Probes,
Pattern
Usage Rights
Except where otherwise noted, this item’s license is described as Attribution-ShareAlike 4.0 International
Cite
López Gerena, J. O. (2022). High precision detection of LINE-1s in human genomes [Dissertation]. Retrieved from https://hdl.handle.net/20.500.11801/2911