Publication:
Estimación de la proporción de una subpoblación oculta a través de muestreo por “bola de nieve” estratificado

Thumbnail Image
Authors
Sarmiento-Rondón, William B.
Embargoed Until
Advisor
Quintana-Díaz, Julio C.
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2008
Abstract
The inference process is inefficient when employing conventional sampling tech- niques to sample from hidden populations and those of difficult access. The method of sampling by reference or “Link-Tracing” (“Snowball Sampling”) permit provides additional information by using the existing relations or ties among its members, starting from an initial selected sample. In this context the population is presented as a graph, whether directed o not, where each individual is a node that describes its characteristic and each edge, the existing relation between each one of them. From a sociological perspective, human beings form social groups based on particular criterion that could potencially affects parameter estimation. From this point of view, we will apply “Link-Tracing”, by selecting an initial stratified random sampling, instead of an initial simple random sample, in order to increase the precision of our estimates, because the homogeneity intra strata. The objective is to estimate the size and proportion of a hidden population, from an initial sample S0 and S1, identifying each individuals characteristic, and considering the existing relationships, within each stratum. Our second objetive was to develop and implement algorithms in the statistics software R, to be applied to real and simulated data and compare these results to those obtained from conventional sampling procedures.

En poblaciones ocultas y de difícil acceso el proceso de inferencia es ineficiente cuando se emplean técnicas de muestreo convencionales. El muestro por referencia o “Rastreo por vínculos” (“Bola de Nieve”) permite obtener más información, usando las relaciones existentes entre sus miembros a partir de una muestra inicial. En este contexto la población se representa como un grafo, donde cada individuo es un nodo que describe su característica y cada arco la relación existente entre ellos. Desde la perspectiva sociológica, el ser humano tiende a formar estratos bajo algún criterio de asociación, que pueden influir en la inferencia de un parámetro en particular. Desde este enfoque, aplicar la técnica de “Rastreo por vínculos” escogiendo la muestra inicial de la población completa, en lugar de seleccionar una muestra inicial considerando los estratos, no sería apropiado si la característica bajo estudio define una division natural en la población, con una homogeneidad interna establecida. El objetivo es estimar la proporción y el tamaño de una subpoblación oculta, a partir de una muestra inicial S0 y de los contactos S1, identificando la característica de cada individuo y considerando las relaciones existentes, en cada estrato. Nuestro segundo objetivo es desarrollar e implementar en el programa estadístico R algoritmos, aplicado a datos reales y simulados, para comparar los resultados obtenidos con los estimadores de muestreo convencional.
Keywords
Link-tracing,
Hidden population,
Sampling
Cite
Sarmiento-Rondón, W. B. (2008). Estimación de la proporción de una subpoblación oculta a través de muestreo por “bola de nieve” estratificado [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/1974