Publicación:
Caracterización y discriminación de los tipos de fragmentación disponibles en sistemas gestores de bases de datos

Cargando...
Miniatura

Fecha

Autores

Quevedo Ortiz, Suriel

Director de Tesis

Co-director de Tesis

Título de la revista

ISSN de la revista

Título del volumen

Editor

Unidades académicas

Colecciones

item.page.projects

item.page.journal-issue

Resumen

La fragmentación o partición es una técnica de diseño de bases de datos que consiste en dividir una tabla (original) en tablas más pequeñas (llamadas fragmentos), con el objetivo de reducir el tiempo de respuesta de las consultas. Dependiendo de los elementos (tuplas o atributos) de la tabla original que se incluyan en los fragmentos, la fragmentación es de dos tipos: horizontal, si los fragmentos contienen subconjuntos de tuplas, o vertical, si tienen subconjuntos de atributos. Aunque la mayoría de los Sistemas Gestores de Bases de Datos (SGBD) permiten aplicar diversos tipos de partición en las bases de datos, estos difieren significativamente. Ante este contexto, en esta tesis se realizó un estudio comparativo de los SGBD más populares para conocer los tipos de partición disponibles en los mismos, posteriormente se seleccionaron algunos gestores para implementar los distintos tipos de partición en las bases de datos estándar TPC-H y TPC-E, las cuales son especificaciones estándar desarrolladas por TPC (Transaction Processing Performance Council, Consejo de Rendimiento del Procesamiento de Transacciones) para conocer sus ventajas en cuanto a la reducción del tiempo de ejecución de las operaciones de gestión de datos: creación, lectura, actualización y eliminación. Por tal motivo, se implementaron los distintos tipos de partición en PostgreSQL, MySQL y MongoDB, en las bases de datos estándar TPC-H y TPC-E. Dentro de los principales resultados, se identificó que MySQL fue el que logró mejores resultados al obtener una mejora de rendimiento en por lo menos una consulta por cada tipo de operación de gestión de datos con los métodos de partición implementados. No obstante, de forma individual la partición List de PostgreSQL, logró mejorar los tiempos de ejecución en operaciones de lectura, actualización y eliminación. Además, se identificó que, si es complejo realizar un método de partición adecuado para la base de datos, el mejor SGBD es MongoDB, ya que implementa la partición Hash para lograr una distribución uniforme de los datos en los fragmentos de forma automática.

Descripción

Citación

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced