Publications

Parametric and Semiparametric Model-Based Estimates of the Finite Population Mean for Two-Stage Cluster Samples with Item Nonresponse

This article concerns item nonresponse adjustment for two-stage cluster samples. Specifically, we focus on two types of nonignorable nonresponse: nonresponse depending on covariates and underlying cluster characteristics, and depending on covariates and the missing outcome. In these circumstances, standard weighting and imputation adjustments are liable to be biased. To obtain consistent estimates, we extend the standard random-effects model by modeling these two types of missing data mechanism. We also propose semiparametric approaches based on fitting a spline on the propensity score, to weaken assumptions about the relationship between the outcome and covariates. These new methods are compared with existing approaches by simulation. The National Health and Nutrition Examination Survey data are used to illustrate these approaches. /// Le présent article concerne l'ajustement pour non réponse à la variable d'intérêt dans le cadre d'échantillonnage par grappes à deux degrés. Plus précisément, nous nous intéressons à deux types de non réponse informative: la non réponse qui dépend de covariables et de caractéristiques sous-jacentes de la grappe, et celle qui dépend de covariables et de la variable d'intérêt dont la valeur est manquante. Dans ces circonstances, les ajustements usuels par pondération ou imputation sont susceptibles d'être biaisés. Pour obtenir des estimateurs fiables, nous développons le modèle standard à effets aléatoires en modélisant ces deux types de processus de données manquantes. Nous proposons également des approches semi-paramétriques avec le principe suivant: ajuster une fonction spline sur le score de propension, pour amortir l'impact des hypothèses quant à la relation entre la variable d'intérêt et les covariables. Ces nouvelles méthodes sont ensuite comparées par simulation aux approches déjà existantes, puis appliquées, pour illustration, aux données de l'enquête nationale sur la santé et la nutrition.