Fonction de répartition

{{#ifeq:||Un article de Ziki, l'encyclopédie libre.|Une page de Ziki, l'encyclopédie libre.}}
Fichier:Discrete probability distribution illustration.png
Fonctions de répartition d'une variable discrète, d'une variable diffuse et d'une variable avec atome, mais non discrète.

En théorie des probabilités, la fonction de répartition, ou fonction de distribution cumulative, d'une variable aléatoire réelle Modèle:Mvar est la fonction Modèle:Math qui, à tout réel Modèle:Mvar, associe la probabilité d’obtenir une valeur inférieure ou égale :

<math>

F_X(x)=\mathbb P(X\leq x)

</math>.

Cette fonction est caractéristique de la loi de probabilité de la variable aléatoire. Elle permet de calculer la probabilité de chaque intervalle semi-ouvert à gauche Modèle:MathModèle:Math, par

<math>

\mathbb P(X\in]a,b]) = \mathbb P(a<X\le b) = F_X(b)- F_X(a)

</math>.

La fonction de répartition d'une mesure de probabilité <math>\mathbb P</math> définie sur la tribu borélienne <math>\mathcal B(\R)</math> est la fonction Modèle:Mvar qui à tout réel Modèle:Mvar associe

<math>

F(x)=\mathbb P(]-\infty, x]).

</math>

Exemples de calculs de la fonction de répartition

Variables à densité

Fichier:F repartition.png
Fonction de répartition de la loi normale centrée réduite.

La fonction de répartition Modèle:Mvar d'une variable aléatoire Modèle:Mvar de densité de probabilité Modèle:Mvar est une des primitives (en un sens un peu relâché, voir ci-dessous) de cette densité Modèle:Mvar. Plus précisément, Modèle:Mvar est définie, pour tout nombre réel Modèle:Mvar, par :

<math>

F_X(x)=\int_{-\infty}^{x} f_X(t)\,\mathrm dt. </math>

Toutefois, ce n'est pas, en toute généralité, une primitive au sens strict du terme : on peut seulement affirmer :

Mais il y a beaucoup de « contre-exemples » : la fonction de répartition de la loi uniforme sur un intervalle, ou encore celle de la loi exponentielle, ne sont pas dérivables sur tout <math>\R,</math> et ne sont donc pas, au sens strict, des primitives de densités de probabilités.

Notons que, contrairement aux variables discrètes, une variable à densité Modèle:Mvar vérifie <math>\mathbb P(X=a)=0</math> pour tout nombre réel Modèle:Mvar : en conséquence, la fonction de répartition des variables à densité est continue en tout point. En fait une variable aléatoire réelle Modèle:Mvar possède une densité de probabilité si et seulement si sa fonction de répartition est absolument continue sur chaque intervalle borné.

Variables discrètes

Fichier:Repartitions-uniformes.png
Fonction de répartition de la loi uniforme discrète sur {0,2 ; 0,4 ; 0,6 ; 0,8 ; 1} (pour laquelle Modèle:Math, en violet) et de la loi uniforme (continue) sur l'intervalle Modèle:Math (en rouge).

Une variable aléatoire Modèle:Mvar est dite discrète si son support Modèle:Mvar est fini ou dénombrable, ou bien, de manière équivalente, s'il existe un ensemble Modèle:Mvar fini ou dénombrable tel que :

<math>\mathbb P(X \in A) = 1.</math>

La loi de Modèle:Mvar est déterminée sans ambiguïté par la donnée de Modèle:Math ou de Modèle:Math, où

<math>p_s = \mathbb P(X = s).</math>

Si, par exemple, Modèle:Mvar est une variable aléatoire réelle, on a

<math>F_X(x) = \sum_{s \in S} p_s 1_{[s, +\infty[}(x).</math>

Modèle:Math est la fonction indicatrice de l'ensemble E.

Pour les variables aléatoires discrètes les plus courantes (par exemple, les lois uniformes, binomiales, de Poisson) Modèle:Mvar est un ensemble bien ordonné : on peut alors numéroter ses éléments de manière croissante, p.e. Modèle:Math et numéroter les probabilités Modèle:Mvar en conséquence, p.e. en posant Modèle:Math. On a alors, si Modèle:Math,

<math>F_X(x) = \sum_{1 \le j\le i}p_j.</math>

Soit encore, plus généralement :

<math>

\begin{align} F_X(x) &= \sum_{i \ge 1}\ q_i\ 1_{[s_i, s_{i + 1}[}(x), \\ q_i &= \sum_{1 \le j \le i} p_j. \end{align}

</math>

La fonction de répartition est alors une fonction constante par intervalles et sa représentation graphique est en escalier. Les sauts d'une marche à l'autre de l'escalier se situent aux abscisses Modèle:Mvar, et l'amplitude du saut d'abscisse Modèle:Mvar est Modèle:Math. En particulier la fonction de répartition d'une variable discrète Modèle:Mvar est discontinue exactement aux points Modèle:Mvar tels que <math>\mathbb P(X = s)> 0.</math> Voir la section Propriétés de la fonction de répartition pour une démonstration.

Cas spécial : fonction de répartition continue purement singulière

L'escalier de Cantor Modèle:Mvar est un exemple de fonction de répartition continue mais dont la dérivée est presque partout nulle. Ainsi, les formules précédentes ne sont plus vraies pour l'escalier de Cantor : par exemple pour Modèle:Math, on n'a pas

<math>

F(x)=\int_{-\infty}^xF^{\prime}(t)\, \mathrm dt

</math>,

car Modèle:Mvar prend des valeurs strictement positives sur Modèle:Math, alors que l'intégrale constituant le membre de droite est identiquement nulle. En effet, l'ensemble

<math>

\{t\in\R\mid F^{\prime}(t)\neq 0\}

</math>

est de mesure de Lebesgue nulle. Par ailleurs, la loi de probabilité associée à l'escalier de Cantor est diffuse (sans atome), puisque Modèle:Mvar est une fonction continue sur <math>\R</math>. L'escalier de Cantor est en fait un exemple de fonction de répartition continue mais qui n'est pas absolument continue sur chaque intervalle : on dit alors qu'elle est continue purement singulière.

Propriétés de la fonction de répartition

Propriétés caractéristiques

Modèle:Théorème

Modèle:Démonstration Réciproquement, toute fonction définie sur <math>\R</math> et satisfaisant ces quatre propriétés est la fonction de répartition d’une certaine variable aléatoire. Autrement dit, les points 1 à 4 sont caractéristiques de la fonction de répartition d'une variable aléatoire réelle Modèle:Mvar : étant donné une fonction réelle de la variable réelle, notons Modèle:Mvar, satisfaisant les points 1 à 4, on peut construire concrètement une variable aléatoire réelle Modèle:Mvar ayant Modèle:Mvar pour fonction de répartition, voir ci-dessous le théorème de la réciproque. Notons que la construction utilisant le théorème de la réciproque sert concrètement à produire, sur ordinateur, des échantillons de taille arbitraire d'une loi de probabilité arbitraire, ce qui est l'ingrédient de base des méthodes de Monte-Carlo.

Remarque

On peut ainsi définir la notion de fonction de répartition sans introduire celle de variable aléatoire : il suffit juste qu'elle vérifie les points 1 à 4 précédents. Si on ajoute à cela la notion de fonction arithmétique, on arrive rapidement dans la théorie probabiliste des nombres.

Autres propriétés

À cause des points 1, 3 et 4, Modèle:Mvar est bornée, plus précisément

<math>

\forall x \in\R,\ \ \ 0\leq F_X(x)\leq 1. </math>

Comme toute fonction monotone bornée, Modèle:Mvar admet en tout point Modèle:Mvar une limite à gauche Modèle:Math, limite à gauche égale ou non à Modèle:Math selon que Modèle:Mvar est continue en x ou non. Modèle:Mvar est une fonction càdlàg.

La connaissance de la fonction de répartition permet de calculer la probabilité de tout intervalle

  • <math>\mathbb P(X \in ]- \infty, x])\,=\,\mathbb P(X \le x)\,=\,F_X(x),</math>
  • <math>\mathbb P(X \in ]x, + \infty[)\,=\,\mathbb P(X > x)\,=\,1-F_X(x),</math>
  • <math>\mathbb P(X \in ]x, y])\,=\,\mathbb P(x < X \le y)\,=\,F_X(y) - F_X(x),</math>
  • <math>\mathbb P(X \in ]- \infty, x[)\,=\,\mathbb P(X < x)\,=\,F_X(x_-),</math>
  • <math>\mathbb P(X \in ]x, y[ )\,=\,\mathbb P(x < X < y)\,=\,F_X(y_-)-F_X(x),</math>
  • <math>\mathbb P(X \in [x, y[)\,=\,\mathbb P(x\le X < y)\,=\,F_X(y_-) - F_X(x_-),</math>
  • <math>\mathbb P(X \in [x, y])\,=\,\mathbb P(x \le X \le y)\,=\,F_X(y) - F_X(x_-),</math>

et

  • <math>\mathbb P(X=x) = F_X(x) - F_X(x_-)\,</math>

Modèle:Démonstration

On appelle atome de la variable aléatoire Modèle:Mvar tout réel Modèle:Mvar pour lequel <math> \mathbb P(X=a)> 0</math>. Ainsi, en vertu de la dernière propriété de la liste ci-dessus, Modèle:Théorème La fonction de répartition d'une variable aléatoire Modèle:Mvar est donc continue si et seulement si Modèle:Mvar n'a aucun atome, i.e. si et seulement si

<math>\forall x\in\R,\ \mathbb P(X = x)=0.</math>

On dit alors que la loi de Modèle:Mvar est diffuse, ou bien sans atome, et, par extension, que la variable aléatoire Modèle:Mvar elle-même est diffuse ou sans atome. En particulier, les variables aléatoires réelles possédant une densité de probabilité sont diffuses. Il existe cependant des variables aléatoires diffuses mais ne possédant pas pour autant une densité de probabilité, c'est le cas, par exemple, de la variable aléatoire ayant pour fonction de répartition l'escalier de Cantor.

Notons que l'ensemble des points de discontinuité de Modèle:Mvar est fini ou dénombrable, comme c'est le cas pour toute fonction monotone bornée : Modèle:Théorème

Caractérisation de la loi par la fonction de répartition

Modèle:Théorème Ou bien encore : si deux variables aléatoires réelles ont même fonction de répartition, alors elles ont même loi (et réciproquement). Modèle:Démonstration En d'autres termes, si deux variables aléatoires réelles, Modèle:Mvar et Modèle:Mvar, vérifient

<math>\forall x\in\R,\qquad \mathbb P(X\le x)=\mathbb P(Y\le x),</math>

alors elles vérifient aussi que pour tout borélien Modèle:Mvar,

<math>\mathbb P(X\in A)=\mathbb P(Y\in A).</math>

De plus, elles vérifient que pour toute fonction mesurable Modèle:Mvar,

<math>\mathbb E[\varphi(X)]=\mathbb E[\varphi(Y)],</math>

dès que l'un des deux termes de l'égalité a un sens.

Théorème de la réciproque

Soit Modèle:Mvar une fonction de <math> \R</math> dans <math> \R</math> satisfaisant les 4 propriétés caractéristiques. Notons Modèle:Mvar la fonction définie pour Modèle:Math par

<math>G(\omega)=\inf\left\{x\in\R\ |\ F(x)\ge\omega\right\}.</math>

Alors Modèle:Mvar est une variable aléatoire réelle définie sur l'espace probabilisé <math> \left(\Omega,\mathcal A,\mathbb P\right)</math> où <math> \left(\Omega,\mathcal A\right)=\left(]0,1[,\mathcal B(]0, 1[)\right)</math> et où <math> \mathbb P</math> désigne la restriction à <math> \mathcal B(]0, 1[)</math> de la mesure de Lebesgue sur <math> \R</math>. Le théorème stipule que :

Modèle:Théorème

Ainsi toute fonction Modèle:Mvar de <math> \R</math> dans <math> \R</math> satisfaisant les quatre propriétés caractéristiques est fonction de répartition d'une variable aléatoire réelle (de Modèle:Mvar, par exemple), ou encore d'une mesure de probabilité sur <math> \left(\R,\mathcal B(\R)\right)</math> (de la loi de Modèle:Mvar, par exemple). Modèle:Démonstration

Remarques.

Conséquences du théorème de la réciproque

Simulation de variables aléatoires réelles de loi arbitraire

Si Modèle:Mvar désigne une variable aléatoire réelle uniforme sur Modèle:Math, alors Modèle:Math a pour fonction de répartition Modèle:Mvar.

Ainsi dans tout langage de programmation possédant un générateur de nombres aléatoires, on peut simuler une suite de longueur arbitraire de v.a.r. indépendantes de même fonction de répartition Modèle:Mvar, pourvu que Modèle:Mvar soit connue : il suffit alors d'appeler ce générateur de manière répétée, et d'appliquer la fonction Modèle:Mvar aux nombres produits par ces appels répétés.

Exemples

Exemples
densité de probabilité fonction de répartition réciproque (généralisée) code
Loi de Cauchy <math> \frac1{\pi(1+x^2)}</math> <math> F(x)=\frac1{\pi}\left(\frac{\pi}2+\arctan(x)\right)</math> <math> G(\omega)=\tan\left(\pi(\omega-\frac12)\right)</math> <math> x\leftarrow\tan\left(\pi(\mathrm{rand()}-\frac12)\right)</math>
Loi exponentielle <math> \lambda\,e^{-\lambda x}\ 1_{x\ge 0}</math> <math> F(x)=\left(1-e^{-\lambda x}\right)\ 1_{x\ge 0}</math> <math> G(\omega)=-\frac1{\lambda}\ \ln(1-\omega)</math> <math> x\leftarrow\ -\frac1{\lambda}\ \ln(\mathrm{rand()})</math>
Loi uniforme sur Modèle:Math <math> \frac{1}{b-a}\ 1_{[a, b]}(x)</math> <math> F(x)=\frac{x-a}{b-a}\ 1_{[a, b]}(x)\ +\ 1_{]b, +\infty[}(x)</math> <math> G(\omega)=a+\omega(b-a)</math> <math> x\leftarrow a+(b-a)\mathrm{rand()}</math>
Loi de Bernoulli <math> F(x)=(1-p)\ 1_{[0, 1[}(x)\ +\ 1_{[1, +\infty[}(x)</math> <math> G(\omega)=\lfloor p+\omega\rfloor</math> <math> x\leftarrow \lfloor p+\ \mathrm{rand()}\rfloor</math>
Loi uniforme sur Modèle:Math <math> F(x)=\frac{\lfloor x\rfloor}n\ 1_{[0, n]}(x)\ +\ 1_{]n, +\infty[}(x)</math> <math> G(\omega)=\lceil n\omega\rceil</math> <math> x\leftarrow \lceil n\ \mathrm{rand()}\rceil</math>
Loi normale, Loi binomiale comme il n'y a pas de formule suffisamment explicite pour la fonction de répartition, et encore moins de formule explicite pour la réciproque de cette dernière, le théorème est alors inopérant.

La loi normale peut cependant être simulée, par la méthode de Box-Muller, à l'aide de deux variables aléatoires indépendantes suivant chacune une loi uniforme : si <math>U,V \sim \mathcal{U}([0, 1])</math> de manière indépendante alors <math>\sqrt{-2\ln(U)}\cos(2 \pi V)</math> suit une loi normale centrée réduite. L'établissement de ce résultat fait également appel au théorème de la réciproque.

On trouvera tout sur l'art d'engendrer des variables aléatoires de lois arbitraires, par exemple à l'aide de variables uniformes, dans Non-Uniform Random Variate Generation, édité chez Springer, disponible sur le web<ref>La version pdf (libre et autorisée) de Modèle:Ouvrage est disponible, ainsi qu'un récit humoristique des démêlés de Luc Devroye avec son éditeur.</ref>.

Autres conséquences du théorème de la réciproque

La réciproque généralisée de Modèle:Mvar est un exemple de v.a.r. dont la fonction de répartition est Modèle:Mvar, mais c'est un exemple privilégié. Ses utilisations sont nombreuses, allant de propriétés de l'ordre stochastique, à des propriétés de la distance de Wasserstein<ref>[1]</ref>, en passant par le théorème de représentation de Skorokhod, voir section suivante.

Convergence en loi et fonction de répartition

Considérons une suite de variables aléatoires Modèle:Math (resp. une variable aléatoire Modèle:Mvar) définies sur des espaces probabilisés <math> \left(\Omega_n,\mathcal A_n,\mathbb P_n\right)</math> (resp. <math> \left(\Omega,\mathcal A,\mathbb P\right)</math>) éventuellement différents, mais toutes à valeurs dans le même espace métrique Modèle:Math. On dit que Modèle:Math converge en loi vers Modèle:Mvar si, pour toute fonction continue bornée de Modèle:Math dans <math>\R</math>,

<math>\lim_{n\rightarrow\infty}\mathbb E\left[f(X_n)\right]=\mathbb E\left[f(X)\right].</math>

On a le théorème suivant : Modèle:Théorème L'implication 1.⇒3. reste vraie lorsque les variables aléatoires réelles sont remplacées par des variables aléatoires à valeurs dans un espace de Lusin Modèle:Math, i.e. un espace métrisable assez général (<math> S=\R^d</math> et <math> S=\mathcal C([0,1],\R)</math> en sont des exemples). L'implication 1.⇒3. porte alors le nom de théorème de représentation de Skorokhod. Modèle:Démonstration

Notes et références

Modèle:Références

Voir aussi

Articles connexes

Modèle:Portail