Publication:
Análisis del peso de los recién nacidos en Puerto Rico usando regresión a cuantiles
Análisis del peso de los recién nacidos en Puerto Rico usando regresión a cuantiles
Authors
Moreno-Castilla, Ana C.
Embargoed Until
Advisor
Torres-Saavedra, Pedro A.
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2018-10-31
Abstract
This project illustrates the use of the grouped Smoothly Clipped Absolute De-
viation (SCAD), a variable selection method based on regularization, in quantile
regression to model the weight of newborns in Puerto Rico in 2009-2011. Quantile
regression models allows us to study the effect of the independent variables on the
different quantiles of the dependent variable and thus to have a complete idea of
the relationship between these variables and the distribution of the response. Therefore,
one can conclude which, prenatal care variables, sociodemographic factors,
and health conditions are associated, not only to the low weight and overweight
newborns, but also to other parts of the distribution of the newborn weights such
as the median.
A quantile regression model for newborn weight with several covariates was
adjusted for different quanitles of interest. Some of the variables included in the
model were age of the mother, weeks of gestation and sex of the newborn. However,
due to the large number of possible explanatory variables associated to a particular
quantile of the newborn weights, a variable selection method based on regularization,
namely SCAD, was implemented to come up with a subset of covariates significantly
associated with the quantile of the newborn weights.
Our results suggest that the factors significantly associated to the newborn
weights depend on the quanitle being modeled, although there are some explanatory
variables that are consistently selected regardless the quantile. For instance, the
weight gain of the mother was maintained in all cases.
Este proyecto muestra la aplicación del método de selección de variables Smoothly Clipped Absolute Deviation (SCAD), un método de selección de variables basado en regularización, en regresión a cuantiles para modelar el peso de los recién nacidos en Puerto Rico en los años 2009-2011. Los modelos de regresión cuantil nos permiten estudiar el efecto de las variables independientes sobre los diferentes cuantiles de la variable dependiente y así tener una idea completa de la relación entre estas variables y la variable dependiente. Esto permite identificar cuáles variables de cuidado prenatal, factores sociodemográficos, y condiciones de salud están asociadas, no sólo con el bajo peso y el sobrepeso de recién nacidos, sino que también con otras parte de la distribución de los pesos de los recién nacidos como por ejemplo, la mediana. Un modelo de regresión a cuantiles para el peso de los recién nacidos con varias covariables fue ajustado para diferentes cuantiles de interés. Algunas variables incluidas en el modelo fueron edad de la madre, las semanas de gestación y el sexo del recién nacido. Sin embargo, debido al gran número de variables explicativas posibles asociadas a un cuantil particular del peso de los recién nacidos, se implementó un método de selección de variables basado en la regularización, llamado SCAD, para llegar a un subconjunto de covariables significativamente asociadas con el cuantil de los pesos de los recién nacidos. Nuestros resultados sugieren que los factores significativamente asociados al peso de los recién nacidos dependen del cuantil que se modele, aunque hay algunas variables explicativas que se seleccionan consistentemente independientemente del cuantil. Por ejemplo, el aumento de peso de la madre se mantuvo en todos los casos.
Este proyecto muestra la aplicación del método de selección de variables Smoothly Clipped Absolute Deviation (SCAD), un método de selección de variables basado en regularización, en regresión a cuantiles para modelar el peso de los recién nacidos en Puerto Rico en los años 2009-2011. Los modelos de regresión cuantil nos permiten estudiar el efecto de las variables independientes sobre los diferentes cuantiles de la variable dependiente y así tener una idea completa de la relación entre estas variables y la variable dependiente. Esto permite identificar cuáles variables de cuidado prenatal, factores sociodemográficos, y condiciones de salud están asociadas, no sólo con el bajo peso y el sobrepeso de recién nacidos, sino que también con otras parte de la distribución de los pesos de los recién nacidos como por ejemplo, la mediana. Un modelo de regresión a cuantiles para el peso de los recién nacidos con varias covariables fue ajustado para diferentes cuantiles de interés. Algunas variables incluidas en el modelo fueron edad de la madre, las semanas de gestación y el sexo del recién nacido. Sin embargo, debido al gran número de variables explicativas posibles asociadas a un cuantil particular del peso de los recién nacidos, se implementó un método de selección de variables basado en la regularización, llamado SCAD, para llegar a un subconjunto de covariables significativamente asociadas con el cuantil de los pesos de los recién nacidos. Nuestros resultados sugieren que los factores significativamente asociados al peso de los recién nacidos dependen del cuantil que se modele, aunque hay algunas variables explicativas que se seleccionan consistentemente independientemente del cuantil. Por ejemplo, el aumento de peso de la madre se mantuvo en todos los casos.
Keywords
Regresión a cuantiles,
SCAD,
Quantile regression,
Recién nacidos
SCAD,
Quantile regression,
Recién nacidos
Usage Rights
Persistent URL
Cite
Moreno-Castilla, A. C. (2018). Análisis del peso de los recién nacidos en Puerto Rico usando regresión a cuantiles [Project Report]. Retrieved from https://hdl.handle.net/20.500.11801/1889