Publication:
Robustez del modelo Poisson log-normal para conteos bivariados

Thumbnail Image
Authors
Enríquez Delgado, Alix Fernanda
Embargoed Until
Advisor
Santana-Morant, Dámaris
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2021-12-09
Abstract
Cuando se trata de modelar datos de conteos bivariados, un camino que comunmente se toma es modelar los conteos de forma separada, es decir, asumiendo independencia entre las variables que los representan. Sin embargo, esto puede conducir a resultados ineficientes en las estimaciones de los coeficientes del modelo de regresión, debido a que la correlación entre los conteos es ignorada. Actualmente, en la literatura referente a modelización de datos de conteos bivariados se pueden encontrar estudios que demuestran que se obtiene mayor precisión en las estimaciones cuando se tiene en cuenta la correlación entre los conteos. Existen varios modelos para conteos bivariados como, por ejemplo, la regresión de Poisson bivariada y Binomial negativa bivariada, que se usan con mucha frecuencia para modelar conteos bivariados. Sin embargo, otros modelos como la distribución de Poisson lognormal bivariada también han adquirido bastante importancia al momento de tratar datos de conteos bivariados, ya que no solamente hace frente a la correlación sino que también maneja la sobredispersión que muchas veces se hace presente en este tipo de datos. Al comprender la importancia que el modelo Poisson lognormal bivariado tiene en el análisis estadístico de datos de conteos bivariados, el objetivo de este estudio se centra principalmente en analizar la robustez de la regresión Poisson lognormal bivariada cuando hay desviaciones en el supuesto de normalidad en los efectos aleatorios. Para alcanzar tal objetivo se llevaron a cabo estudios de simulación, cuyos resultados muestran que cuando los efectos aleatorios asociados a los conteos bivariados tienen distribuciones marginales diferentes a la distribución normal con media 0, y su dependencia es modelada por un modelo de cópula como Clayton, Gumbel y Galambos, las estimaciones de los coeficientes de regresión son sesgadas y el error cuadrático medio de algunos estimadores es diferente al comparar el modelo correlacionado con el modelo no correlacionado. Esto indica que el modelo Poisson lognormal bivariado no es robusto ante desviaciones del supuesto de normalidad de los efectos aleatorios. Por otra parte, se realizó una aplicación a un conjunto de conteos de carruchos adultos y jóvenes, proveniente de un estudio sobre la densidad de carruchos en la costa oeste de Puerto Rico en los años 1997, 2001, 2003 y 2013. Estudio realizado por los investigadores del Departamento de Ciencias Marinas del Recinto universitario de Mayagüez. Los resultados de la aplicación permiten decir que, en general, se espera que los conteos sobre una misma unidad de medición estén correlacionados, tal como ocurrió en el caso de carruchos jóvenes y adultos compartiendo un habitat. Por lo tanto, es importante considerar un modelo que tenga en cuenta la correlación y que además maneje grados de asociación positiva y negativa, como el modelo Poisson lognormal bivariado.

When it comes to modeling bivariate count data, one path commonly taken is to model the counts separately, i.e., assuming independence between the variables that represent them. However, this can lead to inefficient results in the estimates of the regression model coefficients, because the correlation between the counts is ignored. In the literature concerning the modeling of bivariate count data, studies can be found that show that higher estimation accuracy is obtained when the correlation between counts is taken into account. There are several models for bivariate counts, such as bivariate Poisson regression and bivariate negative Binomial, which are very often used to model bivariate counts. However, other models such as the bivariate lognormal Poisson distribution have also become quite important when dealing with bivariate count data, since it not only copes with correlation but also handles the overdispersion that is often present in this type of data. Understanding the importance that the bivariate lognormal Poisson model has in the statistical analysis of bivariate count data, the objective of this study is mainly focused on analyzing the robustness of the bivariate lognormal Poisson regression when there are deviations from the assumption of normality in the random effects. To achieve this objective, simulation studies were carried out, the results of which show that when the random effects associated with the bivariate counts have marginal distributions different from the normal distribution with mean 0, and their dependence is modeled by a copula model such as Clayton, Gumbel and Galambos, the estimates of the regression coefficients are biased and the mean square error of some estimators is different when comparing the correlated model with the uncorrelated model. This indicates that the bivariate lognormal Poisson model is not robust to deviations from the assumption of normality of the random effects. On the other hand, an application was made to a set of counts of adult and juvenile mackerels from a study on the density of mackerels on the west coast of Puerto Rico in 1997, 2001, 2003 and 2013. The study was conducted by researchers from the Department of Marine Sciences of the University of Puerto Rico Mayag¨uez Campus. The results of the application allow us to say that, in general, it is expected that the counts on the same unit of measurement are correlated, as it occurred in the case of young and adult caruchos sharing a habitat. Therefore, it is important to consider a model that takes correlation into account and also handles positive and negative degrees of association, such as the bivariate lognormal Poisson model.
Keywords
Conteos bivariados,
Poisson-lognormal
Usage Rights
All Rights Reserved / restricted to Campus
Cite
Enríquez Delgado, A. F. (2021). Robustez del modelo Poisson log-normal para conteos bivariados [Project Report]. Retrieved from https://hdl.handle.net/20.500.11801/2843