Publication:
Comparación de modelos de regresión semiparamétricos mixtos con distribución beta

Thumbnail Image
Authors
Calvo-Alfaro, Adriana P.
Embargoed Until
Advisor
Macchiavelli, Raúl E.
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2015-05
Abstract
Some studies generate data that are rates, proportions or probabilities, continuously restricted in the range (0, 1). The Beta regression allows to model this type of data and offers a number of advantages such as direct interpretation of results, since it is not necessary to use transformations, and the easy to model asymmetries because the distribution can take many forms if the scale and location parameters are changed. The semiparametric regression models provide an effective tool for modeling complex data structures, since the main feature is that they do not assume a specific shape for the regression function, the real purpose is to build it by using the observations for a better use of the collected information. The implementation of smooth techniques like splines in the beta regression modeling and random effects allows having a better regression curve approximation which generates more precise results. During the development of this work, three models of semiparametric regressions will be presented, and the matrices of design associated to the effects will be built by using splines. The conditional distribution from the variable of interest given the random effects is Beta and the random effects are assumed normally distributed; this Beta regression models are constructed by using the combination of B-splines in the fixed part; B-splines, P-splines or Radial Smoothing in the random part. By using simulations he chose the model that provides the better fit using Schwarz’s Criteria and the better predictive model using the Mean Integrated Absolute Error (MIAE). The obtained results are used in a study of disease severity of banana crops in Puerto Rico.

Algunos estudios generan datos que son tasas, proporciones o probabilidades, restringidos de forma continua en el intervalo (0, 1). La regresión Beta permite modelar este tipo de datos y ofrece una serie de ventajas como la interpretación directa de los resultados, ya que no es necesario el uso de transformaciones, y la facilidad para modelar asimetrías puesto que la distribución puede tomar diversas formas si se varían sus parámetros de escala y localización. Los modelos de regresión semiparamétricos proporcionan una herramienta eficaz en el modelado de datos con estructuras complejas, ya que su principal característica consiste en no asumir una forma específica para la función de regresión, si no construirla a través de las observaciones, permitiendo de esta forma un mayor aprovechamiento de la información. La incorporación de técnicas de suavizado como splines en el modelado con regresión beta y efectos aleatorios permiten realizar una mejor aproximación a la curva de regresión generando estimaciones más precisas. En este trabajo se presentan tres modelos de regresión semiparámetricos cuyas matrices de diseño asociadas a los efectos se construyen mediante splines, la distribución condicional de la variable de interés dados los efectos aleatorios es Beta y se asume que los efectos aleatorios son normalmente distribuidos; estos modelos de regresión Beta se construyen mediante la combinación de B-splines en la parte fija; con B-splines, P-splines o Suavizado Radial en la parte aleatoria. Por medio de simulaciones se selecciona el modelo que mejor se ajuste a los datos según el Criterio de Schwarz y el modelo que mejor predice según el criterio de Error Absoluto Integrado Medio (MIAE). Finalmente se aplican los resultados obtenidos a un estudio de severidad de enfermedades en cultivos de banano en Puerto Rico.
Keywords
Regression model,
Distribution beta
Cite
Calvo-Alfaro, A. P. (2015). Comparación de modelos de regresión semiparamétricos mixtos con distribución beta [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/114