Propriété de Markov

{{#ifeq:||Un article de Ziki, l'encyclopédie libre.|Une page de Ziki, l'encyclopédie libre.}}
Fichier:Wiener process 3d.png
Exemple de processus stochastique vérifiant la propriété de Markov: un mouvement Brownien (ici représenté en 3D) d'une particule dont la position à un instant t+1 ne dépend que de la position précédente à l'instant t.

En probabilité, un processus stochastique vérifie la propriété de Markov si et seulement si la distribution conditionnelle de probabilité des états futurs, étant donnés les états passés et l'état présent, ne dépend en fait que de l'état présent et non pas des états passés (absence de « mémoire »). Un processus qui possède cette propriété est appelé processus de Markov. Pour de tels processus, la meilleure prévision qu'on puisse faire du futur, connaissant le passé et le présent, est identique à la meilleure prévision qu'on puisse faire du futur, connaissant uniquement le présent : si on connait le présent, la connaissance du passé n'apporte pas d'information supplémentaire utile pour la prédiction du futur.

Propriété de Markov faible (temps discret, espace discret)

Définition

C'est la propriété caractéristique d'une chaîne de Markov : en gros, la prédiction du futur à partir du présent n'est pas rendue plus précise par des éléments d'information supplémentaires concernant le passé, car toute l'information utile pour la prédiction du futur est contenue dans l'état présent du processus. La propriété de Markov faible possède plusieurs formes équivalentes qui reviennent toutes à constater que la loi conditionnelle de <math>X_{n+1}</math> sachant le passé, i.e. sachant <math>\left(X_k\right)_{0\le k\le n}</math> est une fonction de <math>X_n</math> seul : Modèle:Théorème On suppose le plus souvent les chaînes de Markov homogènes, i.e. on suppose que le mécanisme de transition ne change pas au cours du temps. La propriété de Markov faible prend alors la forme suivante :

<math>\forall n\ge 0, \forall (i_0,\ldots,i_{n-1},i,j) \in E^{n+2},</math>
<math>\mathbb{P}\Big(X_{n+1}=j \mid\, X_0=i_0, X_1=i_1,\ldots, X_{n-1}=i_{n-1},X_n=i\Big) = \mathbb{P}\left(X_{1}=j\mid X_0=i\right). </math>

Cette forme de la propriété de Markov faible est plus forte que la forme précédente, et entraîne en particulier que

<math>\forall n\ge 0, \forall (i,j)\in E^{2},\qquad\mathbb{P}\left(X_{n+1}=j\mid X_n=i\right) = \mathbb{P}\left(X_{1}=j\mid X_0=i\right).</math>

Dans la suite de l'article on ne considèrera que des chaînes de Markov homogènes. Pour une application intéressante des chaînes de Markov inhomogènes à l'optimisation combinatoire, voir l'article Recuit simulé.

La propriété de Markov faible pour les chaînes de Markov homogènes a une autre forme, beaucoup plus générale que la précédente, mais pourtant équivalente à la précédente : Modèle:Théorème,\quad A\in \mathcal P(E^{n+1}),\quad i\in E,</math>

<math>{\mathbb P}((X_{n}, X_{n+1}, \dots ) \in B\,|\,(X_0,\dots,X_{n}) \in A, X_n=i)

\;=\;{\mathbb P}((X_{0}, X_{1}, \dots )\in B\,|\, X_0=i).</math>}} Notons que les évènements passés <math>\{(X_0,\dots,X_{n}) \in A\}</math> et futurs <math>\{(X_{n}, X_{n+1}, \dots ) \in B\}</math> prennent ici la forme la plus générale possible, alors que l'évènement présent <math>\{X_n=i\}</math> reste sous une forme particulière, et pas par hasard : si on remplace <math>\{X_n=i\}</math> par <math>\{X_n\in C\}</math> dans l'énoncé ci-dessus, alors l'énoncé devient faux en général, car l'information sur le passé devient utile pour prévoir le présent (où <math>X_n</math> peut-il bien se trouver, plus précisément, à l'intérieur de la partie <math>C</math> ?), et, partant de là, pour prévoir le futur. Modèle:Exemple

Il existe une propriété de Markov forte, liée à la notion de temps d'arrêt : cette propriété de Markov forte est cruciale pour la démonstration de résultats importants (divers critères de récurrence, loi forte des grands nombres pour les chaînes de Markov).

Indépendance conditionnelle

La propriété de Markov faible « générale » entraine que Modèle:Théorème,\quad A\in \mathcal P(E^{n+1}),\quad i\in E,</math>

<math>{\mathbb P}((X_{n}, X_{n+1}, \dots ) \in B\text{ et } (X_0,\dots,X_{n}) \in A\ |\ X_n=i)</math>
<math>=\;{\mathbb P}((X_{n}, X_{n+1}, \dots ) \in B\ |\ X_n=i)\times{\mathbb P}((X_0,\dots,X_{n}) \in A\ |\ X_n=i).

</math>}} Cette égalité exprime l'indépendance conditionnelle entre le passé et le futur, sachant le présent (sachant que <math>X_n=i</math>). Cependant, si l'on compare avec la propriété de Markov faible « générale » telle qu'énoncée plus haut, on constate qu'on a perdu la propriété d'homogénéité : la propriété de Markov faible « générale » est en fait équivalente à la propriété plus forte Modèle:Théorème,\quad A\in \mathcal P(E^{n+1}),\quad i\in E,</math>

<math>{\mathbb P}((X_{n}, X_{n+1}, \dots ) \in B\text{ et } (X_0,\dots,X_{n}) \in A\ |\ X_n=i)</math>
<math> =\; {\mathbb P}((X_{0}, X_{1}, \dots )\in B\ |\ X_0=i)\times{\mathbb P}((X_0,\dots,X_{n}) \in A\ |\ X_n=i).

</math>}}

Critère

Modèle:Théorème Modèle:Exemple

Modèle:Exemple

Propriété de Markov forte (temps discret, espace discret)

Temps d'arrêt

Notons <math>\mathcal{F}_n</math> la tribu engendrée par la suite <math>(X_k)_{0\le k\le n}.</math> Dans le cas de variables aléatoires à valeurs dans un espace d'états <math>E</math> fini ou dénombrable, une partie <math>A\subset \Omega</math> appartient à <math>\mathcal{F}_n</math> si et seulement s'il existe <math>B\subset E^{n+1}</math> tel que

<math>

\begin{align} A&=\left\{(X_0,X_1,\dots,X_n)\in B\right\}\\ &=\left\{\omega\in\Omega\ |\ \left(X_k(\omega)\right)_{0\le k\le n}\in B\right\}. \end{align}

</math>

Modèle:Théorème Interprétation. Imaginons que les variables aléatoires <math>X_k</math> représentent les résultats d'un joueur lors des parties successives d'un jeu, et que <math>T</math> représente la partie après laquelle le joueur décide d'arrêter de jouer : <math>T</math> est un temps d'arrêt si la décision d'arrêter est prise en fonction des résultats des parties déjà jouées au moment de l'arrêt, i.e. si pour tout <math>n</math> il existe un sous ensemble <math>B_n\subset E^{n+1}</math> tel que :

<math>

\{T=n\}\quad \Leftrightarrow\quad\left\{(X_0,X_1,\dots,X_n)\in B_n\right\}.

</math>

Cela interdit au joueur de prendre sa décision en fonction des résultats des parties futures : cela revient à faire l'hypothèse que tricherie et don de double vue sont exclus.

Pour une définition d'un temps d'arrêt en situation générale on pourra regarder Modèle:Article détaillé Modèle:Exemple

Modèle:Exemple Modèle:Théorème Interprétation. On sait que pour tout <math>n</math> il existe un sous ensemble <math>B_n\subset E^{n+1}</math> tel que :

<math>

\{T=n\}\quad \Leftrightarrow\quad\left\{(X_0,X_1,\dots,X_n)\in B_n\right\}.

</math>

Si de plus <math>A\in\mathcal{F}_T,</math> cela signifie que pour tout <math>n</math> il existe un sous ensemble <math>D_n\subset B_n</math> tel que

<math>

\left\{A\cap \{T=n\}\right\}\quad \Leftrightarrow\quad\left\{(X_0,X_1,\dots,X_n)\in D_n\right\}.

</math>

En quelque sorte, on teste si l'évènement <math>A</math> se produit ou pas en observant le comportement de la suite <math>(X_k)_{0\le k\le n}</math> jusqu'au temps <math>T\ :</math> par abus de langage, on dit parfois que l'évènement <math>A</math> porte sur la suite <math>(X_0, X_1,\dots,X_T).</math>

Propriété de Markov forte

Dans l'énoncé général de la propriété de Markov faible, l'instant « présent », n, peut-être remplacé par un instant « présent » aléatoire, <math>T,</math> pourvu que <math>T</math> soit un temps d'arrêt : Modèle:Théorème Cela peut s'interpréter comme une forme d'indépendance (une indépendance conditionnelle ) entre le passé, <math>A,</math> et le futur, <math>\big(X_{T+n}\big)_{n\ge 0}\in B,</math> de <math>T,</math> sachant ce qui se passe à l'instant <math>T,</math> à savoir <math>\{T<+ \infty\text{ et }X_T=i\}.</math> En effet, en particularisant <math>A=\Omega,</math> on obtient que

<math>

\begin{align} {\mathbb P}_{\mu}\Big(\big(X_{T+n}\big)_{n\ge 0}\in B\ \vert\ T<+ \infty \text{ et }X_T=i\Big) &={\mathbb P}_i\left(\left(X_{n}\right)_{n\ge 0}\in B\right) \end{align}

</math>

puis, en revenant à un élément général <math>A</math> de <math>\mathcal F_T</math>, on obtient la formulation suivante : Modèle:Théorème

Cas particulier des temps de retour

Dans le cas où la chaîne de Markov est irréductible, où l'état <math>i</math> est récurrent, et où le temps d'arrêt <math>T</math> considéré est l'instant de k-ème retour en <math>i,</math> noté plus haut <math>R_i^{k},</math> on constate que, par récurrence de l'état <math>i,</math>

<math>

{\mathbb P}_{\mu}\Big(T<+\infty\Big)=1,

</math>

et que, par définition de <math>R_i^{k},</math>

<math>

{\mathbb P}_{\mu}\Big(X_T=i\Big)=1.

</math>

Ainsi les conditions apparaissant dans la propriété de Markov forte sont presque certaines. Or, dès que <math>{\mathbb P}_{\mu}(C)=1,</math> on a <math>{\mathbb P}_{\mu}(D\,|\,C)={\mathbb P}_{\mu}(D).</math> Ici cela donne que

<math>

\begin{align} {\mathbb P}_{\mu}\Big(\big(X_{T+n}\big)_{n\ge 0}\in B\text{ et }A\Big) &={\mathbb P}_{\mu}\Big(\big(X_{T+n}\big)_{n\ge 0}\in B\Big){\mathbb P}_{\mu}\left(A\right) \\ &={\mathbb P}_i\left(\left(X_{n}\right)_{n\ge 0}\in B\right){\mathbb P}_{\mu}\left(A\right). \end{align}

</math>

Pour tout k, il y a donc indépendance ( inconditionnelle ) entre les évènements qui précèdent le k-ème passage en <math>i</math> et les évènements qui suivent le k-ème passage en <math>i.</math> Qui plus est, la trajectoire de la chaîne de Markov après le k-ème passage en <math>i, \ (X_{T+n})_{n\ge 0},</math> a même loi que la trajectoire d'une chaîne de Markov partant de <math>i</math> à l'instant 0 : elle redémarre comme neuve, indépendamment de ce qui a pu se passer auparavant. On dit alors que les temps de retour successifs sont des instants de renouvellement ou bien des instants de régénération.

Les morceaux de trajectoires entre deux régénérations consécutives forment alors une suite de variables aléatoires i.i.d. (sauf le premier morceau, indépendant, mais éventuellement de loi différente, si la chaîne de Markov ne part pas de <math>i</math> à l'instant 0). Cela conduit à une démonstration de la loi forte des grands nombres pour les chaînes de Markov déduite de la loi forte des grands nombres pour les v.a.r. i.i.d.. Cela donne également une méthode pour construire des intervalles de confiance pour les paramètres intéressants de la chaîne de Markov.

Propriété de Markov faible (temps continu, espace discret)

Mathématiquement, si X(t), t > 0, est un processus stochastique, et si x(t), t > 0, est une fonction, la propriété de Markov est définie ainsi :

<math>\mathrm{P}\big[X(t+h) = y \,|\, X(s) = x(s), s \leq t\big] = \mathrm{P}\big[X(t+h) = y \,|\, X(t) = x(t)\big], \quad \forall h > 0.</math>

Généralement, on utilise une hypothèse d'homogénéité dans le temps, c'est-à-dire :

<math>\mathrm{P}\big[X(t+h) = y \,|\, X(t) = x(t)\big] = \mathrm{P}\big[X(h) = y \,|\, X(0) = x(0)\big], \quad \forall t, h > 0.</math>

Dans certains cas, un processus à première vue non-markovien peut tout de même avoir des représentations markoviennes en modifiant le concept d'état actuel et futur. Soient X un intervalle de temps, et Y un processus tel que chaque état de Y représente un intervalle de temps de X :

<math>Y(t) = \big\{ X(s) : s \in [a(t), b(t)] \, \big\}.</math>

Si Y est markovien, alors c'est la représentation markovienne de X et X qui est alors appelée processus de Markov du second ordre. Les processus d'ordre supérieur sont définis de la même manière.

Équation de Chapman-Kolmogorov-Smoluchowski

C'est une équation intégrale qui assure la cohérence du processus :

<math>p(x_3,t_3|x_1,t_1) = \int p(x_3,t_3|x_2,t_2) p(x_2,t_2|x_1,t_1) dx_2 \quad t_3>t_2>t_1

</math>.

Elle se transforme en une équation aux dérivées partielles, plus facile à manipuler, qui prend le nom d'équation de Fokker-Planck.

Références

  1. Norris, J. : Markov Chains.
  2. Modèle:Ouvrage
  1. Philippe A. Martin, Introduction aux processus stochastiques en physique
  2. Ch. Ancey, Simulations stochastiques - Applications aux écoulements géophysiques et la turbulence

Voir aussi

Modèle:Portail