Publication:
Modelos no lineales mixtos con variables de respuesta con distribución beta

Thumbnail Image
Authors
García-Saavedra, Yuri M.
Embargoed Until
Advisor
Macchiavelli, Raúl E.
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2012-06
Abstract
There are many situations in which random variables involving some kind of percentage, ratio, or fraction. Many studies have shown that linear regression models are not appropriate to model this type of data. However, the beta distribution is very useful for modeling data that are continuous and restricted to the interval (0,1), and also can be explained by other variables through a regression structure. Due to this, Ferrari and Cribari-Neto (2004) proposed a beta linear regression model in which the response variable is distributed as a beta using a different parameterization of its density function, thus obtaining a regression structure for the mean of the response with a constant precision parameter. In this study we extend this theory, proposing a beta nonlinear mixed regression model, where the conditional distribution of observations is assumed beta and the distribution of the random effects is assumed normal. We study the induced marginal distribution and the properties of the model proposed by means of simulation, which are compared with those obtained by a nonlinear mixed regression model assuming normal distribution. The estimates are obtained using the maximum likelihood, until quasi-Newton technique for the optimization and Gaussian quadrature for the integration. Standard errors of the model parameters were estimated using the Hessian matrix. Finally, we apply these results to studies of disease severity (relative amount of affected tissue in a given time) in plantain crops in Puerto Rico (2006-2007), which usually estimates the percentage of leaf area affected. Nonlinear models yield a better fit of the disease progress. Furthermore, since the parameters of the nonlinear curve vary, this variability is reflected with the inclusion of one or two random effects plant. This generates a correlation between observations from the same plant, so implicitly the correlation between repeated measures are incorporated into modeled.

Existen muchas situaciones en las que se involucran variables aleatorias con algún tipo de porcentaje, proporciones o fracciones. Muchos estudios han demostrado que los modelos de regresión lineal no son apropiados para modelar este tipo de datos. Sin embargo, la distribución beta es muy útil para modelar datos que se encuentran restringidos continuamente en el intervalo (0,1) y que además pueden ser explicados por otras variables a través de una estructura de regresión. Debido a esto, Ferrari y Cribari-Neto (2004) propusieron un modelo de regresión beta lineal en el que la variable respuesta está distribuida como una beta usando una parametrización diferente de su función de densidad, obteniendo así, una estructura de regresión para la media de la respuesta con un parámetro de precisión constante. En este trabajo extendemos esta teoría, proponiendo un modelo de regresión beta no lineal mixto, donde la distribución condicional de las observaciones es asumida beta y la distribución de los efectos aleatorios se asume normal. Estudiamos la distribución marginal inducida y las propiedades del modelo propuesto mediante simulación, que se comparan con las obtenidas por un modelo de regresión no lineal mixto asumiendo distribución normal. Las estimaciones se realizan mediante máxima verosimilitud usando la técnica quasi-Newton para la optimización y la cuadratura Gaussiana para la integración. Los errores estándar de los parámetros del modelo fueron estimados mediante la matriz Hessiana. Finalmente, aplicamos estos resultados a estudios de severidad (cantidad relativa de tejido afectado en un momento dado) de enfermedades en cultivos de guineo en Puerto Rico (2006-2007), donde se estima usualmente el porcentaje del área de la hoja afectada. Los modelos no lineales permitieron obtener un mejor ajuste de las curvas de progreso de la enfermedad. Además, como los parámetros de la curva no lineal varían, se reflejó esta variabilidad mediante la inclusión de uno y dos efectos aleatorios. Esto nos generará una correlación entre las observaciones provenientes de la misma planta, por lo que implícitamente se incorporan las correlaciones por mediciones repetidas en el modelo.
Keywords
Variables,
Linear regression model,
Beta nonlinear mixed regression model
Cite
García-Saavedra, Y. M. (2012). Modelos no lineales mixtos con variables de respuesta con distribución beta [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/394