Publication:
Novel assembly of homozygous genomes indicates ancient divergence times and suggests new conservation strategies for the critically endangered Solenodon paradoxus

Thumbnail Image
Authors
Grigorev, Kirill
Embargoed Until
Advisor
Oleksyk, Taras K.
College
College of Arts and Sciences - Sciences
Department
Department of Biology
Degree Level
M.S.
Publisher
Date
2017
Abstract
Solenodons are ancient insectivores living on the Caribbean islands Hispaniola and Cuba, with no other surviving relatives found elsewhere. The genus is estimated to have diverged from the rest of the mammalian order circa 78 Mya (Brandt et al. 2016), and occupies a unique evolutionary position representing the most ancient isolated branch of the placental tree. Of additional interest is the conservation status of the Hispaniolan species (Solenodon paradoxus) because it appears to be subdivided in two separate subspecies (Ottenwalder 2001). The origins, the unique biology and adaptations of these enigmatic venomous species, coupled with their endangered status, can be greatly advanced given the availability of genome data. This study corroborates previous estimates of ancient vicariant origins of the Solenodon lineage based on mitochondrial DNA. A whole genome assembly for either of the species has never been previously performed, partially due to the difficulty in obtaining high quality genome grade DNA samples from the field. We hypothesized that the span of millions of years of island isolation resulted in extreme homozygosity in S. paradoxus genomes. Thus, after generating short paired end sequence libraries from multiple individuals, we employed several assembly strategies with the assumption that there was low genetic diversity between samples. Results indicated that the string-graph based assembly strategy with Fermi software package (Li 2012) had the best results compared to the standard de Bruijn approach with SOAPdenovo2 (Luo et al. 2012), yet two other Fermi-based pipelines yielded high quality contig assemblies, as evidenced by high N50, conserved gene content and favorable REAPR (Hunt et al. 2013) scores. An optimized Fermi-based pipeline surpassed the rest in gene annotation quality, providing the closest representation of the genome. This provides an argument that string-graph-model assembly methods may be the better choice for the homozygous genomes, which is often a hallmark of endemic or endangered species. Once the consensus reference genome was assembled, the genome variants were collected by comparing the five individual sequences from the southern subspecies (S. p. woodi) plus one sequence of the northern subspecies (S. p. paradoxus). This allowed to infer the demographic histories of the two subspecies, which indicated a split at at least 300 Kya or more, suggesting that separate conservation units be applied to each subspecies. New genomic signatures of the Solenodon genome were characterized and annotated, with a specific emphasis on the venomous genes, wherein results indicate several unusual sequence insertions as well as phylogenetic proximity to the reptilians. Also, the phylogenetic positioning of the species S. paradoxus was inferred based on 4,416 monoorthologs from 10 other mammalian species.

Los solenodontes son insectívoros antiguos que solamente habitan las islas de La Española y Cuba sin que se encuentren parientes cercanos en ninguna otra parte del mundo. Se estima que este género divergió del resto de los mamíferos hace aproximadamente 78 millones de años atrás (Brandt et al. 2016), ocupando una posición evolutiva única representando la rama aislada más antigua del árbol placentario. De especial interés es el estado de conservación de la especie que habita en La Española (Solenodon paradoxus) ya que aparenta estar dividida en 2 subespecies separadas (Ottenwalder 2001). Ninguna de las dos subespecies de solenodonte que habitan La Española ha tenido su genoma completamente ensamblado. Esto se debe parcialmente a la dificultad de conseguir en el campo ADN de alta calidad para poder llevar a cabo estudios a nivel de genoma. De haber una disponibilidad en los datos del genoma se podría elucidar mejor los orígenes, la biología única y las adaptaciones de esta enigmática especie venenosa, junto con su estado en peligro de extinción. Este estudio corrobora estimados previos de los orígenes vicariantes del linaje de los solenodontes basado en ADN mitocondrial. Nuestra hipótesis es que el transcurso de millones de años de aislamiento de islas resultó en una homosigocidad extrema en los genomas de S. paradoxus. Por lo tanto, luego de generar librerías de secuencias cortas con sus extremos pareados de múltiples individuos, utilizamos varias estrategias de ensamblado asumiendo baja diversidad genética en las muestras. Los resultados indicaron que el ensamblaje basado en la estrategia de ‘string-graph’ utilizando el software Fermi (Li 2012) tuvo mejores resultados comparado con el enfoque estándar ‘de Bruijn’ con el software SOAPdenovo2 (Luo et al. 2012). Sin embargo, otros dos resultados de ensamblaje utilizando protocolos basados en Fermi produjeron montajes con contigs de alta calidad evidenciado por su N50 alto, contenido de genes conservados y puntuación REAPR (Hunt et al. 2013) favorable. Un protocolo optimizado empleando a Fermi sobrepaso al resto en la calidad de anotación de genes, proporcionando una representación más cercana de su genoma. Esto provee un argumento de que métodos de ensamblaje basados en ‘string-graph’ pueden representar una mejor opción para genomas homogéneos, que usualmente es el caso de especies endémicas o en peligro de extinción. Una vez ensamblado un consenso del genoma de referencia, las variantes de secuencias genómicas de cinco individuos de la subespecie del sur (S. p. woodi) fueron colectadas en conjunto con variantes genómicas de un individuo perteneciente a la subespecie del norte (S. p. paradoxus). Esto permitió inferir las historias demográficas de las dos subespecies, lo cual indicó una divergencia de más de 300 mil años atrás, sugiriendo que distintos métodos de conservación deben ser aplicados a ambas subespecies. Nuevos signos a nivel de genoma del Solenodonte fueron caracterizados y anotados, con un énfasis especifico en genes asociados con capacidad venenosa, lo que proveyó indicios de inserciones en el genoma inusuales y una proximidad filogenética con los reptiles. Finalmente, la posición filogenética de S. paradoxus se infirió basado en 4,416 genes mono-ortólogos procedentes de otras 10 especies de mamíferos.
Keywords
Solenodon paradoxus,
Hispaniola,
Cuba
Cite
Grigorev, K. (2017). Novel assembly of homozygous genomes indicates ancient divergence times and suggests new conservation strategies for the critically endangered Solenodon paradoxus [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/715