Loading...
High precision detection of LINE-1s in human genomes
López Gerena, Juan Omar
López Gerena, Juan Omar
Citations
Altmetric:
Abstract
Long interspersed elements 1 (LINE-1s or L1s) are autonomous retrotransposons that make up about 17% of the human genome. Strong correlations between abnormal L1 expression and several human diseases have been reported, which has motivated an interest in accurate quantification of the number of L1 copies present in any given biological specimen. A main obstacle towards this aim is that L1s are relatively long DNA segments with regions of high variability often with truncated or added fragments. These particularities render traditional alignment strategies, such as seed-and-extend, inefficient, as the number of segments that are similar to L1s explodes exponentially. Here, a new strategy is introduced to increase quantification efficiency, resulting in a more accurate identification of L1s. This dissertation discusses this method and experimentally validates its superiority for L1 detection over alternative methods, and also considers some additional potential applications.
Los elementos intercalados largos 1 (LINE-1 o L1, por sus siglas en inglés) son retrotransposones autónomos que constituyen aproximadamente el 17% del genoma humano. Se han reportado fuertes correlaciones entre la expresión anormal de L1 y varias enfermedades humanas, lo que ha motivado un interés en la cuantificación precisa del número de copias de L1 presentes en cualquier espécimen biológico dado. Un obstáculo principal para este objetivo es que los L1 son segmentos de ADN relativamente largos con regiones de alta variabilidad, frecuentemente con fragmentos truncados o añadidos. Estas particularidades hacen que las estrategias de alineación tradicionales, como sembrar y extender («seed and extend»), sean ineficientes, ya que el número de segmentos que son similares a los L1 explota exponencialmente. Aquà se introduce una nueva estrategia para aumentar la eficiencia de cuantificación, resultando en una identificación de L1s más precisa. Esta disertación discute este método y experimentalmente muestra su superioridad para la detección de L1s sobre métodos alternos, y también considera potenciales aplicaciones adicionales.
Los elementos intercalados largos 1 (LINE-1 o L1, por sus siglas en inglés) son retrotransposones autónomos que constituyen aproximadamente el 17% del genoma humano. Se han reportado fuertes correlaciones entre la expresión anormal de L1 y varias enfermedades humanas, lo que ha motivado un interés en la cuantificación precisa del número de copias de L1 presentes en cualquier espécimen biológico dado. Un obstáculo principal para este objetivo es que los L1 son segmentos de ADN relativamente largos con regiones de alta variabilidad, frecuentemente con fragmentos truncados o añadidos. Estas particularidades hacen que las estrategias de alineación tradicionales, como sembrar y extender («seed and extend»), sean ineficientes, ya que el número de segmentos que son similares a los L1 explota exponencialmente. Aquà se introduce una nueva estrategia para aumentar la eficiencia de cuantificación, resultando en una identificación de L1s más precisa. Esta disertación discute este método y experimentalmente muestra su superioridad para la detección de L1s sobre métodos alternos, y también considera potenciales aplicaciones adicionales.
Description
Date
2022-05-20
Journal Title
Journal ISSN
Volume Title
Publisher
Collections
Keywords
Long interspersed nuclear elements (LINE-1), Probes, Pattern