Matrice stochastique
En mathématiques, une matrice stochastique (aussi appelée matrice de Markov) est une matrice carrée (finie ou infinie) dont chaque élément est un réel positif et dont la somme des éléments de chaque ligne vaut 1. Cela correspond, en théorie des probabilités, à la matrice de transition d'une chaîne de Markov.
Définitions
Une matrice <math> M \in \mathcal{M}_n (\mathbb{R}) </math> est dite stochastique si toutes ses entrées sont positives (ou nulles) et si, pour tout <math> i = 1, ...,n </math>, on a <math> \sum_{j=1}^n m_{ij} = 1</math>, c'est-à-dire que la somme des coordonnées de chaque ligne vaut 1<ref>Certains auteurs parlent de matrice stochastique à droite, la transposée d'une telle matrice (dont la somme des coordonnées de chaque colonne vaut 1) est alors dite stochastique à gauche.</ref>.
Une matrice stochastique est dite régulière s'il existe un entier <math>k > 0</math> tel que la matrice <math>M^k</math> ne contient que des réels strictement positifs.
Une matrice est dite bistochastique (ou doublement stochastique) si la somme des éléments de chaque ligne et de chaque colonne vaut 1, autrement si <math> M </math> et sa transposée <math> M^t </math> sont stochastiques.
Propriétés
Une autre caractérisation des matrices stochastiques est donnée par :
- <math> M </math> est une matrice stochastique si et seulement si <math> M\ge0 </math> (ses coefficients sont positifs ou nuls) et <math> Me=e </math>, où <math> e </math> désigne le vecteur de <math> \mathbb{R}^n </math> dont toutes les coordonnées valent 1.
- <math> M </math> est bistochastique si <math> M\ge0 </math>, <math> Me=e </math> et <math> e^*M=e^* </math>, où <math> e^* </math> est le vecteur transposé de <math> e </math>.
D'après la propriété précédente, puisque 1 est une valeur propre de <math> M </math> avec comme vecteur propre à droite le vecteur colonne dont toutes les coordonnées valent 1 :
- Si <math> M </math> est une matrice stochastique, on appelle vecteur stable pour <math> M </math> un vecteur ligne non nul <math> v </math> tel que <math> vM=v </math> , autrement dit : un vecteur propre à gauche pour la valeur propre 1 (et <math> M </math> possède toujours au moins un vecteur stable).
Une caractérisation du rayon spectral d'une matrice stochastique est donnée par :
- Si <math> M </math> est une matrice stochastique, alors <math> ||Mx||_{\infty} \le ||x||_{\infty} </math> pour tout <math> x \in \mathbb{C}^n </math>, de sorte que le rayon spectral <math> \rho (M) \le 1 </math>. Or, comme <math> Me = e </math>, on a en fait <math> \rho(M)=1 </math>. Ainsi, le rayon spectral d'une matrice stochastique vaut précisément 1.
D'autres résultats sont donnés par :
- Le produit de deux matrices stochastiques est stochastique.
- Toute matrice stochastique indexée par E×E opère sur l'espace des applications bornées de E dans <math> \mathbb{R} </math> .
- Si <math> M </math> est une matrice stochastique et si <math> p </math> est une probabilité alors <math> pM </math> est une probabilité.
Exemple
La matrice suivante est stochastique mais pas bistochastique :
- <math>M = \begin{pmatrix}
0{,}5 & 0{,}3 & 0{,}2 \\ 0{,}2 & 0{,}8 & 0 \\ 0{,}3 & 0{,}3& 0{,}4 \end{pmatrix}.</math>
Le vecteur <math>\begin{pmatrix}3 & 6 & 1\end{pmatrix}</math> est stable pour M.
La matrice stochastique M est régulière car
- <math>M^2 = \begin{pmatrix}
0{,}37 & 0{,}45 & 0{,}18\\ 0{,}26 & 0{,}70 & 0{,}04\\ 0{,}33 & 0{,}45 & 0{,}22 \end{pmatrix}.</math>
Théorème des matrices stochastiques
Modèle:Voir Le théorème des matrices stochastiques stipule que, si A est une matrice stochastique régulière, alors
- la chaîne de Markov de matrice de transition A est irréductible ;
- A possède un unique vecteur stable t dont la somme des coordonnées vaut 1 (autrement dit : le sous-espace vectoriel des vecteurs stables est de dimension 1 — les vecteurs stables sont tous colinéaires) ;
- les coordonnées de t sont toutes strictement positives.
De plus, si x0 est une loi initiale quelconque (i.e. est un vecteur à coordonnées positives ou nulles et de somme 1), et si xk+1 = xkA pour k = 0, 1, 2, … alors la chaîne de Markov {xk} converge vers t quand <math>k \to \infty</math>. C’est-à-dire :
<math>\lim_{k \to \infty} \mathbf{x}_0 A^k = \textbf{t}.</math>
Quelques autres résultats
Modèle:Voir Le rôle des matrices stochastiques est important, notamment dans l'étude des chaînes de Markov. Une caractéristique importante des matrices doublement stochastiques (ou bistochastiques) est fourni par les matrices de permutation <math> P(\sigma) </math>, <math> \sigma \in \mathcal{S}^n </math>, dont les coefficients valent <math> p_{ij} = \delta_{\sigma(i)}^j </math>, avec <math> \delta </math> le symbole de Kronecker.
Le théorème de Birkhoff montre ce rôle central qu'ont les matrices de permutations dans la caractérisation des matrices bistochastiques : Modèle:Théorème
Une conséquence de théorème est donnée par le résultat suivant<ref>Modèle:Article</ref> : Modèle:Théorème
Deux autres résultats sur les matrices bistochastiques utilisent la relation décrite par le symbole <math> \prec </math>, défini par : Soient <math> a=(a_1, ..., a_n) </math> et <math> b=(b_1, ..., b_n) </math> deux suites de <math> n </math> nombres réels. On dit que b majore a, et on note <math> a \prec b </math> si :
- <math> a_1 + ... + a_k \le b_1 + ... + b_k </math> pour tout <math> k=1, ..., n-1 </math> ;
- <math> a_1 + ... + a_n = b_1 + ... + b_n </math>.
Il s'agit d'une relation d'ordre partielle.
Les deux théorèmes sont : Modèle:Théorème
Voir aussi
Bibliographie
Notes et références
<references />