Graphe d'une chaîne de Markov et classification des états

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.
Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources ().

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

Le graphe d'une chaîne de Markov et la classification des états sont des notions de la théorie des graphes utilisées en calcul des probabilités.

Graphe d'une chaîne de Markov

Graphe d'une chaîne de Markov non irréductible à espace d'états fini, possédant 3 classes : { 2 } { 1 , 3 } {\displaystyle \{2\}\rightarrow \{1,3\}} et { 4 , 5 } . {\displaystyle \{4,5\}.} Les classes { 1 , 3 } {\displaystyle \{1,3\}} et { 4 , 5 } {\displaystyle \{4,5\}} sont finales.

Le graphe G {\displaystyle G} d'une chaîne de Markov est le graphe orienté défini à partir de l'espace d'états E {\displaystyle E} et de la matrice de transition   P = ( p i , j ) ( i , j ) E 2 {\displaystyle \ P=\left(p_{i,j}\right)_{(i,j)\in E^{2}}} de cette chaîne de Markov :

  • les sommets de G {\displaystyle G} sont les éléments de E , {\displaystyle E,}
  • les arêtes de G {\displaystyle G} sont les couples ( i , j ) E 2 {\displaystyle (i,j)\in E^{2}} vérifiant p i , j > 0. {\displaystyle p_{i,j}>0.}

Classification des états

Pour ( i , j ) E 2 {\displaystyle (i,j)\in E^{2}} , on dit que l'état j {\displaystyle j} est accessible à partir de l'état i {\displaystyle i} si et seulement s'il existe un entier n 0 {\displaystyle n\geq 0} tel que P ( X n = j X 0 = i ) > 0. {\displaystyle \mathbb {P} (X_{n}=j\mid X_{0}=i)>0.} On note :

{ j i } { n 0  tel que  p i , j ( n ) > 0 } . {\displaystyle \{j\leftarrow i\}\quad \Leftrightarrow \quad \left\{\exists n\geq 0{\text{ tel que }}p_{i,j}^{(n)}>0\right\}.}

On dit que les états i {\displaystyle i} et j {\displaystyle j} communiquent si et seulement s'il existe ( n , m ) N 2 {\displaystyle (n,m)\in \mathbb {N} ^{2}} tels que P ( X n = j X 0 = i ) > 0 {\displaystyle \mathbb {P} (X_{n}=j\mid X_{0}=i)>0} et P ( X m = i X 0 = j ) > 0. {\displaystyle \mathbb {P} (X_{m}=i\mid X_{0}=j)>0.} On note :

{ j i } { j i  et  i j } . {\displaystyle \{j\leftrightarrow i\}\quad \Leftrightarrow \quad \left\{j\leftarrow i{\text{ et }}i\leftarrow j\right\}.}

La relation communiquer, notée , {\displaystyle \leftrightarrow ,} est une relation d'équivalence. Quand on parle de classe en parlant des états d'une chaîne de Markov, c'est généralement aux classes d'équivalence pour la relation {\displaystyle \leftrightarrow } qu'on fait référence. Si tous les états communiquent, la chaîne de Markov est dite irréductible.

La relation être accessible, notée , {\displaystyle \leftarrow ,} s'étend aux classes d'équivalence : pour deux classes C {\displaystyle C} et C {\displaystyle C^{\prime }} , on a

{ C C } { ( i , j ) C × C , i j } { ( i , j ) C × C , i j } . {\displaystyle \{C\leftarrow C^{\prime }\}\quad \Leftrightarrow \quad \left\{\exists (i,j)\in C\times C^{\prime },\qquad i\leftarrow j\right\}\quad \Leftrightarrow \quad \left\{\forall (i,j)\in C\times C^{\prime },\qquad i\leftarrow j\right\}.}

La relation {\displaystyle \leftarrow } est une relation d'ordre entre les classes d'équivalence.


Une classe est dite finale si elle ne conduit à aucune autre, i.e. si la classe est minimale pour la relation . {\displaystyle \leftarrow .} Sinon, la classe est dite transitoire.

Soit

M i j = { n 0   |   P ( X n = j X 0 = i ) > 0 } . {\displaystyle M_{ij}=\{n\geq 0\ |\ P(X_{n}=j\mid X_{0}=i)>0\}.}

La période d'un état i {\displaystyle i} est le PGCD de l'ensemble M i i . {\displaystyle M_{ii}.} Si deux états communiquent, ils ont la même période : on peut donc parler de la période d'une classe d'états. Si la période vaut 1, la classe est dite apériodique.

Classes, modulo différents sous-groupes, du cube vu comme le groupe ( Z 2 3 , + ) , {\displaystyle (\mathbb {Z} _{2}^{3},+),} et classes finales de certaines marches aléatoires sur le cube.

La classification des états se lit de manière simple sur le graphe de la chaîne de Markov.

Marche aléatoire sur un groupe fini :

On se donne un groupe ( G , ) {\displaystyle (G,\oplus )} et une mesure de probabilité μ {\displaystyle \mu } sur ce groupe, ainsi qu'une suite ( Y n ) n 1 {\displaystyle (Y_{n})_{n\geq 1}} de variables aléatoires indépendantes de loi μ . {\displaystyle \mu .} On pose

X 0 = x 0 G et n 1 ,   X n = X n 1 Y n . {\displaystyle X_{0}=x_{0}\in G\quad {\text{et}}\quad \forall \,n\geq 1,\ X_{n}=X_{n-1}\oplus Y_{n}.}

Alors ( X n ) n 0 {\displaystyle (X_{n})_{n\geq 0}} est appelée marche aléatoire de pas μ {\displaystyle \mu } sur le groupe ( G , ) . {\displaystyle (G,\oplus ).} Le processus stochastique ( X n ) n 0 {\displaystyle (X_{n})_{n\geq 0}} est un processus de Markov. C'est une chaîne de Markov si G {\displaystyle G} est fini ou dénombrable (en ce cas μ = ( μ g ) g G {\displaystyle \mu =(\mu _{g})_{g\in G}} ). Notons supp ( μ ) {\displaystyle {\text{supp}}(\mu )} le support de μ {\displaystyle \mu }  :

supp ( μ ) = { g G | μ g > 0 } , {\displaystyle {\text{supp}}(\mu )=\{g\in G\quad |\quad \mu _{g}>0\},}

et notons H {\displaystyle H} le sous-groupe engendré par supp ( μ ) . {\displaystyle {\text{supp}}(\mu ).} Alors les classes à droite modulo H , {\displaystyle H,} (de type x H = { x h   |   h H } {\displaystyle xH=\{xh\ |\ h\in H\}} ) sont aussi les classes pour la relation . {\displaystyle \leftrightarrow .} Ces classes sont toutes finales.

Marches sur le cube :
  • La marche aléatoire sur les arêtes du cube peut être vue comme la marche sur le groupe ( Z 2 3 , + ) , {\displaystyle (\mathbb {Z} _{2}^{3},+),} de pas μ 0 = 1 3 ( δ ( 1 , 0 , 0 ) + δ ( 0 , 1 , 0 ) + δ ( 0 , 0 , 1 ) ) : {\displaystyle \mu _{0}={\tfrac {1}{3}}(\delta _{(1,0,0)}+\delta _{(0,1,0)}+\delta _{(0,0,1)}):} en effet ajouter un des 3 vecteurs de la base canonique revient à changer une des trois coordonnées du point de départ, i.e. cela revient à emprunter, au hasard, une des 3 arêtes issues du point de départ. En ce cas H 0 = supp ( μ 0 ) = G , {\displaystyle H_{0}=\langle {\text{supp}}(\mu _{0})\rangle =G,} et la marche est irréductible.
  • Si le pas est μ 1 = 1 2 ( δ ( 1 , 0 , 0 ) + δ ( 0 , 1 , 0 ) ) , {\displaystyle \mu _{1}={\tfrac {1}{2}}(\delta _{(1,0,0)}+\delta _{(0,1,0)}),} H 1 = supp ( μ 1 ) = Z 2 2 × { 0 } , {\displaystyle H_{1}=\langle {\text{supp}}(\mu _{1})\rangle =\mathbb {Z} _{2}^{2}\times \{0\},} et la marche a deux classes finales : les 2 faces horizontales.
  • Si le pas est μ 2 = δ ( 0 , 0 , 1 ) , {\displaystyle \mu _{2}=\delta _{(0,0,1)},} H 2 = { 0 } 2 × Z 2 , {\displaystyle H_{2}=\{0\}^{2}\times \mathbb {Z} _{2},} et la marche a 4 classes finales : les 4 arêtes verticales.
  • Si le pas est μ 3 = 1 2 ( δ ( 0 , 1 , 1 ) + δ ( 1 , 0 , 1 ) ) , {\displaystyle \mu _{3}={\tfrac {1}{2}}(\delta _{(0,1,1)}+\delta _{(1,0,1)}),} | H 3 | = 4 , {\displaystyle |H_{3}|=4,} et la marche a deux classes finales : les 2 tétraèdres inscrits.
Graphe de 2 marches aléatoires élémentaires, respectivement sur le groupe cyclique Z 8 {\displaystyle \mathbb {Z} _{8}} et sur le groupe diédral D 4 . {\displaystyle D_{4}.}
Marches aléatoires sur l'octogone :
  • La 1re chaîne de Markov de la figure ci-contre est une marche aléatoire sur le groupe cyclique Z 8 , {\displaystyle \mathbb {Z} _{8},} de pas μ = p δ 1 + q δ 1 . {\displaystyle \mu =p\delta _{1}+q\delta _{-1}.} Dans cet exemple, H = supp ( μ ) = Z 8 . {\displaystyle H=\langle {\text{supp}}(\mu )\rangle =\mathbb {Z} _{8}.}
  • La 2e chaîne de Markov de la figure ci-contre est une marche aléatoire sur le groupe diédral D 4 , {\displaystyle D_{4},} de pas ν = p δ τ + q δ ρ , {\displaystyle \nu =p\delta _{\tau }+q\delta _{\rho },} τ = ( b , d ) {\displaystyle \tau =(b,d)} est la symétrie du carré (abcd) par rapport à la diagonale (a,c), où ρ = ( a , b ) ( c , d ) {\displaystyle \rho =(a,b)(c,d)} est la symétrie du carré par rapport à son axe horizontal, les deux autres symétries étant τ ρ τ {\displaystyle \tau \circ \rho \circ \tau } et ρ τ ρ {\displaystyle \rho \circ \tau \circ \rho }  ; σ = ρ τ = ( a , b , c , d ) {\displaystyle \sigma =\rho \circ \tau =(a,b,c,d)} est la rotation d'angle π / 2. {\displaystyle \pi /2.} Dans cet exemple, H = supp ( ν ) = D 4 . {\displaystyle H=\langle {\text{supp}}(\nu )\rangle =D_{4}.}

Les deux chaînes sont donc irréductibles et récurrentes positives, de loi stationnaire uniforme.

Lexique : graphes-chaînes de Markov

  • L'état j {\displaystyle j} est accessible à partir de l'état i {\displaystyle i} si et seulement si l'une des deux conditions suivantes est remplie :
    • il existe un chemin allant du sommet i {\displaystyle i} au sommet j {\displaystyle j} dans le graphe G , {\displaystyle G,}
    • i = j . {\displaystyle i=j.}
  • Une chaîne de Markov est irréductible si et seulement si son graphe est fortement connexe, i.e. si pour tout couple i j {\displaystyle i\neq j} de sommets du graphe il existe un chemin de i {\displaystyle i} à j {\displaystyle j} et un chemin de j {\displaystyle j} à i . {\displaystyle i.}
  • Une classe d'une chaîne de Markov est une composante fortement connexe de son graphe. Dans la première figure en haut de page (avec les états 1, 2, 3, 4, 5), le graphe non orienté induit par le graphe de la chaîne de Markov a 2 composantes connexes, mais le graphe de la chaîne de Markov (qui est un graphe orienté) a 3 composantes fortement connexes, car 2 ne communique ni avec 1, ni avec 3.

Graphe d'une chaîne de Markov et propriétés probabilistes

Certaines propriétés probabilistes des états d'une chaîne de Markov sont partagées par tous les états d'une même classe. Plus précisément:

  • si une classe C {\displaystyle C} n'est pas finale, tous ses états sont transients (ou transitoires),
  • si une classe C {\displaystyle C} est à la fois finale et finie, tous ses états sont récurrents positifs.

Les états d'une classe finale peuvent très bien être tous transients (par exemple dans le cas de la marche simple biaisée sur Z ) , {\displaystyle \mathbb {Z} ),} ou bien être tous récurrents nuls (par exemple dans le cas de la marche simple symétrique sur Z ) . {\displaystyle \mathbb {Z} ).} Tout au plus faut-il pour cela que la classe finale en question soit infinie. Il existe également des exemples de classe finale infinie récurrente positive.

Par ailleurs,

  • s'il existe i {\displaystyle i} récurrent dans la classe C {\displaystyle C} , alors tout état j {\displaystyle j} de C {\displaystyle C} est récurrent,
  • s'il existe i {\displaystyle i} récurrent positif dans la classe C {\displaystyle C} , alors tout état j {\displaystyle j} de C {\displaystyle C} est récurrent positif,
  • s'il existe i {\displaystyle i} récurrent nul dans la classe C {\displaystyle C} , alors tout état j {\displaystyle j} de C {\displaystyle C} est récurrent nul,
  • s'il existe i {\displaystyle i} transient dans la classe C {\displaystyle C} , alors tout état j {\displaystyle j} de C {\displaystyle C} est transient,
  • s'il existe i {\displaystyle i} de période d {\displaystyle d} dans la classe C {\displaystyle C} , alors tout état j {\displaystyle j} de C {\displaystyle C} est de période d , {\displaystyle d,}
  • s'il existe i {\displaystyle i} apériodique dans la classe C {\displaystyle C} , alors tout état j {\displaystyle j} de C {\displaystyle C} est apériodique.

On dit donc que la classe C {\displaystyle C} est transiente, récurrente, apériodique, etc. puisqu'il s'agit en fait de propriétés de la classe tout autant que de propriétés d'un état particulier.


  • icône décorative Portail des probabilités et de la statistique