Théorème de Donsker

Simulations de Xn de n=100 à n=800 avec U de loi uniforme sur l'ensemble {-1,1}

En théorie des probabilités, le théorème de Donsker établit la convergence en loi d'une marche aléatoire vers un processus stochastique gaussien. Il est parfois appelé le théorème central limite fonctionnel.

Ce théorème est une référence pour la convergence en loi de marches aléatoires renormalisées vers un processus à temps continus. De nombreux théorèmes sont alors dits de « type Donsker ».

Énoncé classique

Soient ( U n , n 1 ) {\displaystyle (U_{n},n\geq 1)} une suite iid de variables aléatoires centrées, de carré intégrable et de variance σ 2 {\displaystyle \sigma ^{2}} .

On interpole la marche aléatoire k = 1 n U k {\displaystyle \sum _{k=1}^{n}U_{k}} de manière affine par morceaux en considérant le processus ( X n ( t ) , t 0 ) {\displaystyle (X_{n}(t),t\geq 0)} défini par

X n ( t ) = 1 σ n ( k = 1 [ n t ] U k + ( n t [ n t ] ) U [ n t ] + 1 ) {\displaystyle X_{n}(t)={\frac {1}{\sigma {\sqrt {n}}}}\left(\sum _{k=1}^{[nt]}U_{k}+(nt-[nt])U_{[nt]+1}\right)} pour t > 0 {\displaystyle t>0} et où [x] désigne la partie entière de x.

Considérons l'espace C ( [ 0 , 1 ] ) {\displaystyle {\mathcal {C}}([0,1])} des fonctions à valeurs réelles et continues sur [0,1]. On munit C ( [ 0 , 1 ] ) {\displaystyle {\mathcal {C}}([0,1])} de la tribu borélienne B {\displaystyle {\mathcal {B}}} et de la norme infini | | . | | {\displaystyle ||.||_{\infty }} . Ainsi, X n {\displaystyle X_{n}} est une variable aléatoire à valeurs dans ( C ( [ 0 , 1 ] ) , B ) {\displaystyle ({\mathcal {C}}([0,1]),{\mathcal {B}})} .

Théorème (Donsker, 1951)

La suite ( X n , n 1 ) {\displaystyle (X_{n},n\geq 1)} converge en loi vers un mouvement brownien standard B = ( B t , t 0 ) {\displaystyle B=(B_{t},t\geq 0)} quand n tend vers l'infini.

Ici B est vu comme un élément aléatoire de ( C ( [ 0 , 1 ] ) , B ) {\displaystyle ({\mathcal {C}}([0,1]),{\mathcal {B}})} .

Idées de la démonstration

Notons X n ( t ) = 1 σ n k = 1 [ n t ] U k + ψ n , t {\displaystyle X_{n}(t)={\frac {1}{\sigma {\sqrt {n}}}}\sum _{k=1}^{[nt]}U_{k}+\psi _{n,t}}

En utilisant l'inégalité de Bienaymé-Tchebychev, on montre que ψ n , t {\displaystyle \psi _{n,t}} converge en probabilité vers 0.

Ainsi par le théorème central limite, X n ( t ) l o i n t N {\displaystyle X_{n}(t){\underset {n\rightarrow \infty }{\stackrel {loi}{\longrightarrow }}}{\sqrt {t}}N} (converge en loi) où N est une variable aléatoire de loi normale N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} .

De manière similaire, on obtient successivement

( X n ( s ) , X n ( t ) X n ( s ) ) l o i n ( B s , B t s ) {\displaystyle (X_{n}(s),X_{n}(t)-X_{n}(s)){\underset {n\rightarrow \infty }{\stackrel {loi}{\longrightarrow }}}(B_{s},B_{t-s})}
( X n ( s ) , X n ( t ) ) l o i n ( B s , B s + B t s ) {\displaystyle (X_{n}(s),X_{n}(t)){\underset {n\rightarrow \infty }{\stackrel {loi}{\longrightarrow }}}(B_{s},B_{s}+B_{t-s})}
( X n ( t 1 ) , X n ( t 2 ) , . . . , X n ( t k ) ) l o i n ( B t 1 , B t 2 , . . . , B t k ) {\displaystyle (X_{n}(t_{1}),X_{n}(t_{2}),...,X_{n}(t_{k})){\underset {n\rightarrow \infty }{\stackrel {loi}{\longrightarrow }}}(B_{t_{1}},B_{t_{2}},...,B_{t_{k}})}

B est un mouvement brownien standard.

Reste à montrer que la suite ( X n , n 1 ) {\displaystyle (X_{n},n\geq 1)} est tendue. Pour cela, on montre que

lim λ lim sup n λ 2 max k n P ( i = 1 k U i λ σ n ) = 0 {\displaystyle \lim _{\lambda \rightarrow \infty }{\underset {n\rightarrow \infty }{\lim \sup }}\,\lambda ^{2}\max _{k\leq n}\mathbb {P} \left(\sum _{i=1}^{k}U_{i}\geq \lambda \sigma {\sqrt {n}}\right)=0}

On démontre d'abord cette convergence pour le cas où les variables U i {\displaystyle U_{i}} sont normales. Pour généraliser à une loi quelconque, on utilise le théorème central limite et l'inégalité de Bienaymé-Tchebychev pour affiner les majorations[1].

Énoncé pour les processus empiriques

Soit ( X i , i 1 ) {\displaystyle (X_{i},i\geq 1)} une suite iid de variables aléatoires de loi uniforme sur [0,1]. On note F la fonction de répartition commune des variables X i {\displaystyle X_{i}} . ( F ( t ) = P [ X i t ] {\displaystyle F(t)=\mathbb {P} [X_{i}\leq t]} ) On définit la fonction de répartition empirique Fn de l'échantillon X1,X2,...,Xn par

F n ( t ) = 1 n i = 1 n 1 1 X i t , t [ 0 , 1 ] {\displaystyle F_{n}(t)={\frac {1}{n}}\sum _{i=1}^{n}1\!\!\!1_{X_{i}\leq t}\,,\,t\in [0,1]}

ainsi que le processus empirique associé Wn par

W n ( t ) = n ( F n ( t ) F ( t ) ) = 1 n i = 1 n ( 1 1 X i t F ( t ) ) , t [ 0 , 1 ] {\displaystyle W_{n}(t)={\sqrt {n}}(F_{n}(t)-F(t))={\frac {1}{\sqrt {n}}}\sum _{i=1}^{n}(1\!\!\!1_{X_{i}\leq t}-F(t))\,,\,t\in [0,1]} .

Considérons l'espace D ( [ 0 , 1 ] ) {\displaystyle D([0,1])} des fonctions càdlàg (continues à droite et avec limites à gauche) sur [0,1] muni de la topologie de Skorokhod.

Théorème (Donsker, 1952) (conjecture de Doob, 1949) —  La suite de processus ( W n , n 1 ) {\displaystyle (W_{n},n\geq 1)} converge en loi dans l'espace D ( [ 0 , 1 ] ) {\displaystyle D([0,1])} vers un pont brownien W = ( W ( t ) , t [ 0 , 1 ] ) {\displaystyle W=(W(t),t\in [0,1])} quand n tend vers l'infini.

Voir également

Références

  1. Voir (en) Patrick Billingsley (en), Convergence of Probability measures, Wiley-Interscience publication, , 2e éd., 296 p. (ISBN 978-0-471-19745-4, présentation en ligne) pour plus de détails.
  • (en) M. D. Donsker, « Justification and extension of Doob's heuristic approach to the Kolmogorov–Smirnov theorems », Annals of Mathematical Statistics, vol. 23,‎ , p. 277-281 (DOI 10.1214/aoms/1177729445)
  • (en) Richard M. Dudley (en), Uniform Central Limit Theorems, Cambridge, Cambridge University Press, , 436 p. (ISBN 978-0-521-46102-3, lire en ligne)
  • icône décorative Portail des probabilités et de la statistique