Análisis del peso de los recién nacidos en Puerto Rico usando regresión a cuantiles

Thumbnail Image
Moreno-Castilla, Ana C.
Embargoed Until
Torres-Saavedra, Pedro A.
College of Arts and Sciences - Sciences
Department of Mathematics
Degree Level
This project illustrates the use of the grouped Smoothly Clipped Absolute De- viation (SCAD), a variable selection method based on regularization, in quantile regression to model the weight of newborns in Puerto Rico in 2009-2011. Quantile regression models allows us to study the effect of the independent variables on the different quantiles of the dependent variable and thus to have a complete idea of the relationship between these variables and the distribution of the response. Therefore, one can conclude which, prenatal care variables, sociodemographic factors, and health conditions are associated, not only to the low weight and overweight newborns, but also to other parts of the distribution of the newborn weights such as the median. A quantile regression model for newborn weight with several covariates was adjusted for different quanitles of interest. Some of the variables included in the model were age of the mother, weeks of gestation and sex of the newborn. However, due to the large number of possible explanatory variables associated to a particular quantile of the newborn weights, a variable selection method based on regularization, namely SCAD, was implemented to come up with a subset of covariates significantly associated with the quantile of the newborn weights. Our results suggest that the factors significantly associated to the newborn weights depend on the quanitle being modeled, although there are some explanatory variables that are consistently selected regardless the quantile. For instance, the weight gain of the mother was maintained in all cases.

Este proyecto muestra la aplicación del método de selección de variables Smoothly Clipped Absolute Deviation (SCAD), un método de selección de variables basado en regularización, en regresión a cuantiles para modelar el peso de los recién nacidos en Puerto Rico en los años 2009-2011. Los modelos de regresión cuantil nos permiten estudiar el efecto de las variables independientes sobre los diferentes cuantiles de la variable dependiente y así tener una idea completa de la relación entre estas variables y la variable dependiente. Esto permite identificar cuáles variables de cuidado prenatal, factores sociodemográficos, y condiciones de salud están asociadas, no sólo con el bajo peso y el sobrepeso de recién nacidos, sino que también con otras parte de la distribución de los pesos de los recién nacidos como por ejemplo, la mediana. Un modelo de regresión a cuantiles para el peso de los recién nacidos con varias covariables fue ajustado para diferentes cuantiles de interés. Algunas variables incluidas en el modelo fueron edad de la madre, las semanas de gestación y el sexo del recién nacido. Sin embargo, debido al gran número de variables explicativas posibles asociadas a un cuantil particular del peso de los recién nacidos, se implementó un método de selección de variables basado en la regularización, llamado SCAD, para llegar a un subconjunto de covariables significativamente asociadas con el cuantil de los pesos de los recién nacidos. Nuestros resultados sugieren que los factores significativamente asociados al peso de los recién nacidos dependen del cuantil que se modele, aunque hay algunas variables explicativas que se seleccionan consistentemente independientemente del cuantil. Por ejemplo, el aumento de peso de la madre se mantuvo en todos los casos.
Regresión a cuantiles,
Quantile regression,
Recién nacidos
Moreno-Castilla, A. C. (2018). Análisis del peso de los recién nacidos en Puerto Rico usando regresión a cuantiles [Project Report]. Retrieved from