Matrice stochastique

Page d’aide sur l’homonymie

Ne pas confondre avec la notion de matrice aléatoire.

En mathématiques, une matrice stochastique (aussi appelée matrice de Markov) est une matrice carrée (finie ou infinie) dont chaque élément est un réel positif et dont la somme des éléments de chaque ligne vaut 1. Cela correspond, en théorie des probabilités, à la matrice de transition d'une chaîne de Markov.

Définitions

Une matrice M M n ( R ) {\displaystyle M\in {\mathcal {M}}_{n}(\mathbb {R} )} est dite stochastique si toutes ses entrées sont positives (ou nulles) et si, pour tout i = 1 , . . . , n {\displaystyle i=1,...,n} , on a j = 1 n m i j = 1 {\displaystyle \sum _{j=1}^{n}m_{ij}=1} , c'est-à-dire que la somme des coordonnées de chaque ligne vaut 1[1].

Une matrice stochastique est dite régulière s'il existe un entier k > 0 {\displaystyle k>0} tel que la matrice M k {\displaystyle M^{k}} ne contient que des réels strictement positifs.

Une matrice est dite bistochastique (ou doublement stochastique) si la somme des éléments de chaque ligne et de chaque colonne vaut 1, autrement si M {\displaystyle M} et sa transposée M t {\displaystyle M^{t}} sont stochastiques.

Propriétés

Une autre caractérisation des matrices stochastiques est donnée par :

  • M {\displaystyle M} est une matrice stochastique si et seulement si M 0 {\displaystyle M\geq 0} (ses coefficients sont positifs ou nuls) et M e = e {\displaystyle Me=e} , où e {\displaystyle e} désigne le vecteur de R n {\displaystyle \mathbb {R} ^{n}} dont toutes les coordonnées valent 1.
  • M {\displaystyle M} est bistochastique si M 0 {\displaystyle M\geq 0} , M e = e {\displaystyle Me=e} et e M = e {\displaystyle e^{*}M=e^{*}} , où e {\displaystyle e^{*}} est le vecteur transposé de e {\displaystyle e} .

D'après la propriété précédente, puisque 1 est une valeur propre de M {\displaystyle M} avec comme vecteur propre à droite le vecteur colonne dont toutes les coordonnées valent 1 :

  • Si M {\displaystyle M} est une matrice stochastique, on appelle vecteur stable pour M {\displaystyle M} un vecteur ligne non nul v {\displaystyle v} tel que v M = v {\displaystyle vM=v} , autrement dit : un vecteur propre à gauche pour la valeur propre 1 (et M {\displaystyle M} possède toujours au moins un vecteur stable).

Une caractérisation du rayon spectral d'une matrice stochastique est donnée par :

  • Si M {\displaystyle M} est une matrice stochastique, alors | | M x | | | | x | | {\displaystyle ||Mx||_{\infty }\leq ||x||_{\infty }} pour tout x C n {\displaystyle x\in \mathbb {C} ^{n}} , de sorte que le rayon spectral ρ ( M ) 1 {\displaystyle \rho (M)\leq 1} . Or, comme M e = e {\displaystyle Me=e} , on a en fait ρ ( M ) = 1 {\displaystyle \rho (M)=1} . Ainsi, le rayon spectral d'une matrice stochastique vaut précisément 1.

D'autres résultats sont donnés par :

  • Le produit de deux matrices stochastiques est stochastique.
  • Toute matrice stochastique indexée par E×E opère sur l'espace des applications bornées de E dans R {\displaystyle \mathbb {R} } .
  • Si M {\displaystyle M} est une matrice stochastique et si p {\displaystyle p} est une probabilité alors p M {\displaystyle pM} est une probabilité.

Exemple

La matrice suivante est stochastique mais pas bistochastique :

M = ( 0 , 5 0 , 3 0 , 2 0 , 2 0 , 8 0 0 , 3 0 , 3 0 , 4 ) . {\displaystyle M={\begin{pmatrix}0{,}5&0{,}3&0{,}2\\0{,}2&0{,}8&0\\0{,}3&0{,}3&0{,}4\end{pmatrix}}.}

Le vecteur ( 3 6 1 ) {\displaystyle {\begin{pmatrix}3&6&1\end{pmatrix}}} est stable pour M.

La matrice stochastique M est régulière car

M 2 = ( 0 , 37 0 , 45 0 , 18 0 , 26 0 , 70 0 , 04 0 , 33 0 , 45 0 , 22 ) . {\displaystyle M^{2}={\begin{pmatrix}0{,}37&0{,}45&0{,}18\\0{,}26&0{,}70&0{,}04\\0{,}33&0{,}45&0{,}22\end{pmatrix}}.}

Théorème des matrices stochastiques

Article détaillé : Théorème de Perron-Frobenius.

Le théorème des matrices stochastiques stipule que, si A est une matrice stochastique régulière, alors

De plus, si x0 est une loi initiale quelconque (i.e. est un vecteur à coordonnées positives ou nulles et de somme 1), et si xk+1 = xkA pour k = 0, 1, 2, … alors la chaîne de Markov {xk} converge vers t quand k {\displaystyle k\to \infty } . C’est-à-dire :

lim k x 0 A k = t . {\displaystyle \lim _{k\to \infty }\mathbf {x} _{0}A^{k}={\textbf {t}}.}

Quelques autres résultats

Article détaillé : Matrice bistochastique.

Le rôle des matrices stochastiques est important, notamment dans l'étude des chaînes de Markov. Une caractéristique importante des matrices doublement stochastiques (ou bistochastiques) est fourni par les matrices de permutation P ( σ ) {\displaystyle P(\sigma )} , σ S n {\displaystyle \sigma \in {\mathcal {S}}^{n}} , dont les coefficients valent p i j = δ σ ( i ) j {\displaystyle p_{ij}=\delta _{\sigma (i)}^{j}} , avec δ {\displaystyle \delta } le symbole de Kronecker.

Le théorème de Birkhoff montre ce rôle central qu'ont les matrices de permutations dans la caractérisation des matrices bistochastiques :

Théorème de Birkhoff — Une matrice M M n ( R ) {\displaystyle M\in {\mathcal {M}}_{n}(\mathbb {R} )} est doublement stochastique si et seulement si elle est barycentre de matrices de permutations.

Une conséquence de théorème est donnée par le résultat suivant[2] :

Corollaire — Soit | | . | | {\displaystyle ||.||} une norme sur R n {\displaystyle \mathbb {R} ^{n}} , invariante par permutation des coordonnées. Alors | | M | | = 1 {\displaystyle ||M||=1} pour toute matrice doublement stochastique.

Deux autres résultats sur les matrices bistochastiques utilisent la relation décrite par le symbole {\displaystyle \prec } , défini par : Soient a = ( a 1 , . . . , a n ) {\displaystyle a=(a_{1},...,a_{n})} et b = ( b 1 , . . . , b n ) {\displaystyle b=(b_{1},...,b_{n})} deux suites de n {\displaystyle n} nombres réels. On dit que b majore a, et on note a b {\displaystyle a\prec b} si :

  • a 1 + . . . + a k b 1 + . . . + b k {\displaystyle a_{1}+...+a_{k}\leq b_{1}+...+b_{k}} pour tout k = 1 , . . . , n 1 {\displaystyle k=1,...,n-1}  ;
  • a 1 + . . . + a n = b 1 + . . . + b n {\displaystyle a_{1}+...+a_{n}=b_{1}+...+b_{n}} .

Il s'agit d'une relation d'ordre partielle.

Les deux théorèmes sont :

Théorème — Une matrice M {\displaystyle M} est doublement stochastique si et seulement si x M x {\displaystyle x\prec Mx} pour tout x R n {\displaystyle x\in \mathbb {R} ^{n}} .

Théorème — Soient x , y R n {\displaystyle x,y\in \mathbb {R} ^{n}} . ALors x y {\displaystyle x\prec y} si et seulement s'il existe une matrice M {\displaystyle M} , doublement stochastique, telle que y = M x {\displaystyle y=Mx} .

Voir aussi

Bibliographie

Denis Serre, Les Matrices : Théorie et pratique, Paris, Dunod, , 176 p. (ISBN 2-10-005515-1).Document utilisé pour la rédaction de l’article

Notes et références

  1. Certains auteurs parlent de matrice stochastique à droite, la transposée d'une telle matrice (dont la somme des coordonnées de chaque colonne vaut 1) est alors dite stochastique à gauche.
  2. (en) F. L. Bauer, J. Stoer et C. Witzgall, « Absolute and monotonic norms », Numerische Mathematik, vol. 3, no 1,‎ , p. 257–264 (ISSN 0029-599X et 0945-3245, DOI 10.1007/bf01386026, lire en ligne, consulté le )

Articles connexes


v · m
Matrices
Forme
Transformée
Relation
Propriété
Famille
Associée
Résultats
Décompositions
Articles liés
  • icône décorative Portail des probabilités et de la statistique