Publication:
Using deduplication to improve storage efficiency in distributed file systems

dc.contributor.advisor Arzuaga, Emmanuel
dc.contributor.author Bartus, Paul
dc.contributor.college College of Engineering en_US
dc.contributor.committee Rodríguez-Martínez, Manuel
dc.contributor.committee Rivera Vega, Pedro I.
dc.contributor.committee Rivera-Gallego, Wilson
dc.contributor.department Department of Electrical and Computer Engineering en_US
dc.contributor.representative Rodríguez, Daniel
dc.date.accessioned 2019-04-15T13:45:14Z
dc.date.available 2019-04-15T13:45:14Z
dc.date.issued 2018
dc.description.abstract Storage systems contain redundant copies of data such as identical files or within sub-file regions. Using deduplication technology, we can take advantage of this re-dundancy and reduce the space needed to store files in the file system. Scalable, highly reliable distributed systems supporting data deduplication have recently become popular for storing backup and archival data. There is potential for this technology to be adapted to primary storage. This dissertation is focused on solving the storage problem, designing and de- veloping HD2FS, improving data storage capacity and efficiency in distributed file systems. en_US
dc.description.abstract Los sistemas de almacenamiento contienen copias redundantes de datos, como archivos idénticos o dentro de regiones de subarchivos. Utilizando la tecnología de deduplicación sobre esta redundancia, reducimos el espacio necesario para almacenar archivos en el sistema de archivos. Recientemente se han popularizado los sistemas distribuidos escalables y altamente confiables que respaldan la deduplicación de datos para almacenar datos de copia de seguridad y archivado. Existe la posibilidad de que esta tecnología se adapte al almacenamiento primario. Esta disertación se enfoca en resolver el problema de almacenamiento de datos mediante el diseño y desarrollo del sistema HD2FS, logrando mejorar la capacidad y la eficiencia del almacenamiento en el sistema de archivos distribuidos. en_US
dc.description.graduationSemester Summer (3rd Semester) en_US
dc.description.graduationYear 2018 en_US
dc.identifier.uri https://hdl.handle.net/20.500.11801/1946
dc.language.iso English en_US
dc.rights.holder (c) 2018 Paul Bartus en_US
dc.rights.license All rights reserved en_US
dc.subject Data deduplication en_US
dc.title Using deduplication to improve storage efficiency in distributed file systems en_US
dc.type Dissertation en_US
dspace.entity.type Publication
thesis.degree.discipline Computing and Information Sciences and Engineering en_US
thesis.degree.level Ph.D en_US
Files
Original bundle
Now showing 1 - 1 of 1
Thumbnail Image
Name:
CIIC_BartusP_2018.pdf
Size:
5.34 MB
Format:
Adobe Portable Document Format
Description: