Publication:
Empirical cost models for estimating power and energy consumption in database servers

Thumbnail Image
Authors
Valdivia-Garcia, Harold D.
Embargoed Until
Advisor
Rodríguez-Martínez, Manuel
College
College of Engineering
Department
Department of Electrical and Computer Engineering
Degree Level
M.S.
Publisher
Date
2010
Abstract
The explosive growth in the size of data centers, coupled with the wide- spread use of virtualization technology has brought power and energy consumption as major concerns for data center administrators. Provisioning decisions must take into consideration not only target application performance but also the power demands and total energy consumption incurred by the hardware and software to be deployed at the data center. Failure to do so will result in damaged equipment, power outages, and inefficient operation. Since database servers comprise one of the most popular and important server applications de- ployed in such facilities, it becomes necessary to have accurate cost models that can predict the power and energy demands that each database workloads will impose in the system. In this work we present an empirical methodology to esti- mate the power and energy cost of database operations. Our methodology uses multiple-linear regression to derive accurate cost models that depend only on readily available statistics such as selectivity factors, tuple size, numbers columns and relational cardinality. Moreover, our method does not need measurement of individual hardware components, but rather total power and energy consumption measured at a server. We have implemented our methodology, and ran experiments with several server configurations. Our experiments indicate that we can predict power and energy more accurately than alternative methods found in the literature.

El crecimiento vertiginoso de los centros de cómputo a gran escala, junto con el uso generalizado de tecnologías de virtualización, han hecho que el consumo de energía y potencia máxima esten entre las principales preocupaciones para los administradores de estos centros de cómputo a gran escala. Las decisiones de aprovisionamiento ahora deben tomar en consideración no solo el rendimiento de las aplicaciones, sino también la demanda de energia incurrida por el hardware y el software a ser utilizados en los centros de cómputo. Fallar en ello resultará en daños a los equipos, cortes de energía y operaciones ineficientes. Ya que los servi dores de base de datos constituyen uno de los más populares e importantes servi- dores de aplicación en estas facilidades, es necesario tener modelos de costos más precisos que puedan predecir las demandas de energía y la potencia máxima que cada carga de trabajo impondrá en el sistema. En este trabajo nosotros presen- tamos una metodología empírica para estimar la potencia máxima y el costo de energía de las operaciones de un servidor de base de datos. Nuestra metodología utiliza regresión lineal multiple para derivar modelos de costos que dependan solo de estadísticas disponibles en la base de datos, tales como la selectividad del "query", el tamaño promedio de los registros, el número de columnas y la cardinalidad de una relación. Además nuestra metodología no necesita medir individualmente los componentes hardware de un computador. En vez de ello se mide la potencia máxima y el consumo de energía del servidor. Hemos implementado nuestra metodología y corrido experimentados con diferentes configuraciones de servidores. Nuestros experimentos indican que podemos predecir la potencia maxima y la energía con mayor precisión que otros métodos alternativos encontrados en la literatura.
Keywords
Cite
Valdivia-Garcia, H. D. (2010). Empirical cost models for estimating power and energy consumption in database servers [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/2213