2003 Prépublication d'Orsay numéro 2003-74 (15/12/2003)



ADAPTIVE GOODNESS-OF-FIT TESTS IN A DENSITY MODEL.

FROMONT, Magalie - Modélisation Stochastique et Statistique, Université Paris-Sud, Bât. 425, 91405 Orsay cedex
LAURENT, Béatrice - Modélisation Stochastique et Statistique, I.N.S.A, 135 avenue de Rangueil, 31077 Toulouse cedex 4



Mots Clés : Goodness-of-fit test; Adaptive test; Uniform separation rate; Model selection

Classification MSC : 62G10; 62G20.



Resumé :
À partir de l'observation d'un échantillon de variables aléatoires réelles de densité f appartenant à $\mathbb{L}_2(\mathbb{R})$, nous nous proposons de construire un test d'adéquation de f à une densité donnée fo ou à une famille de translation/échelle. Nous introduisons une procédure de tests multiples basée sur une estimation de la distance $\mathbb{L}_2$ entre f et fo ou entre f et la famille paramétrique considérée. Le test ainsi obtenu a des propriétés non asymptotiques. Pour chaque taille d'échantillon n, il est de niveau $\alpha$. Dans le cas d'une hypothèse simple, nous prouvons qu'il est adaptatif : il atteint les vitesses de test minimax établies par Ingster (2000) sur plusieurs classes de fonctions régulières simultanément. Dans le cas d'une hypothèse composite, nous obtenons des résultats similaires à un facteur logarithmique près. Ces résultats théoriques sont par ailleurs illustrés par une étude de simulations, dans laquelle nous comparons nos procédures avec les tests de Kolmogorov-Smirnov, ou avec les tests d'adéquation proposés par Bickel et Ritov (1992) et par Kallenberg et Ledwina (1995).

Abstract :
Given an i.i.d. sample drawn from a density f, we propose to test that f equals some prescribed density fo or that f belongs to some translation/scale family. We introduce a multiple testing procedure based on an estimation of the $\mathbb{L}_2$-distance between f and fo or between f and the parametric family that we consider. For each sample size n, our test has level of significance $\alpha$. In the case of simple hypotheses, we prove that our test is adaptive: it achieves the optimal rates of testing established by Ingster (2000) over various classes of smooth functions simultaneously. As for composite hypotheses, we obtain similar results up to a logarithmic factor. We carry out a simulation study to compare our procedures with the Kolmogorov-Smirnov tests, or with goodness-of-fit tests proposed by Bickel and Ritov (1992) and by Kallenberg and Ledwina (1995).

Article : Fichier Postscript
Contact : Magalie.Fromont@math.u-psud.fr