Goodness-of-fit testing in two dimensions
- Global styles
- IEEE
- MLA
- CSE
- Chicago (author-date)
- APA (6th edition)
- ACS
- Help
Abstract
A goodness-of-fit (GOF) test is a test used to check whether a sample of data came from a specific probability density. For example, perhaps a particular sample of data looks be evenly distributed across its domain, and one wishes to test if the sample came from a uniform density or not. While many GOF methods are known for univariate data, much less work has been done on multivariate data. In this thesis we will focus specifically on the two-dimensional (bivariate) case. We will provide background on some of the most popular methods, including the famous Chi-square and Kolmogorov-Smirnov tests. We will detail how to calculate the necessary test statistics, and we will provide a variety of power studies to demonstrate each method’s effectiveness in different scenarios. Lastly, we will implement a method of adjusted p-values, where several different goodness-of-fit tests are combined in a particular way to yield a test with high power across all scenarios. Una prueba de bondad de ajuste es una preuba usada para probar si una muestra
de datos vino de una cierta densidad de probabilidad. Por ejemplo, puede que una
muestra de datos parezca ser distribuida uniformamente sobre todo su dominio, y se
quiere probar si dicha muestra vino de una densidad uniforme o no. Mientras existen
muchos m etodos de bondad de ajuste para datos univariados, se han recibido mucho
menos enfoque los m etodos para datos multivariados. En esta tesis, enfocaremos espec
camente en el caso de datos con dos dimensiones. Proveeremos trasfondo para
algunos de los m etodos m as populares, incluyendo las famosas pruebas Chi-square
y Kolmogorov-Smirnov. Daremos detalles sobre c omo se calculan los estad sticos de
prueba, y realizaremos una variedad de estudios de potencia estad stica para demostrar
la e ciencia de cada m etodo en varios escenarios. Por ultimo, implementaremos un
m etodo de valores p ajustados, donde se combinan varias pruebas diferentes de una
manera particular para dar una prueba con buena potencia estad stica en todos los
escenarios.
Collections