Variable aléatoire à densité
Modèle:Voir homonymes En théorie des probabilités, une variable aléatoire à densité est une variable aléatoire réelle, scalaire ou vectorielle, pour laquelle la probabilité d'appartenance à un domaine se calcule à l'aide d'une intégrale sur ce domaine. Modèle:Exemple encadré La fonction à intégrer est alors appelée « fonction de densité » ou « densité de probabilité », égale<ref>L’égalité s’entend ici au sens des fonctions presque partout définies.</ref> (dans le cas réel) à la dérivée de la fonction de répartition.
Les densités de probabilité sont les fonctions essentiellement positives et intégrables d'intégrale 1.
Informellement, une densité de probabilité peut être vue comme la limite d'un histogramme : si on dispose d'un échantillon suffisamment important de valeurs d'une variable aléatoire à densité, représenté par un histogramme des fréquences relatives des différentes classes de valeurs, alors cet histogramme va ressembler à la densité de probabilité de la variable aléatoire, pourvu que les classes de valeurs soient suffisamment étroites.
Variable aléatoire réelle
Une variable aléatoire réelle Modèle:Mvar est dite à densité s'il existe une fonction Modèle:Mvar positive et intégrable sur <math>\R</math>, appelée fonction de densité, telle que pour tout <math>(a,b)\in\R^2</math> on ait <math>\mathbb{P}(a\le X\le b) = \int_a^b f(t)\,\mathrm{d}t</math>.
Dans ce cas, pour tout réel Modèle:Mvar on trouve <math>\mathbb{P}(X = a) = 0</math>. En outre, la fonction de répartition <math>F : x \mapsto \int_{-\infty}^x f(t)\,\mathrm{d}t</math> est continue et même presque partout dérivable, et sa dérivée est alors presque partout égale à la fonction de densité.
On obtient aussi <math>\int_{-\infty}^{+\infty}f(t)\,\mathrm{d}t = 1</math>, ce qui correspond à la somme des probabilités élémentaires pour une variable aléatoire discrète, mais la fonction de densité peut très bien avoir des valeurs strictement supérieures à 1.
Le support d'une variable aléatoire à densité est l'adhérence de l'ensemble des réels pour lesquels la fonction de densité est essentiellement non nulle, c'est-à-dire le complémentaire de la réunion des intervalles ouverts sur lesquels la fonction de répartition est constante.
En traçant la représentation graphique de la densité de probabilité, la probabilité <math>\,\mathbb{P}(a < X \le b)\ </math> se lit comme l'aire sous la courbe sur l'intervalle Modèle:Math.
Exemples
On peut classer les lois à densité selon leur type de support : borné, semi-infini ou infini. Chacune d'elles représente en général une famille de lois dépendant d'un ou plusieurs paramètres.
Parmi les lois à densité à support borné, on trouve notamment les lois uniforme, triangulaire, ou la loi bêta.
Beaucoup de lois à densité ont pour support l'ensemble <math>\R^+</math>, comme la loi exponentielle, le χ² (« khi-deux »), la loi Gamma ou la loi de Pareto.
D'autres ont pour support l'ensemble <math>\R</math> comme la loi normale et la loi de Cauchy.
Critères d'existence d'une densité
En vertu d'un théorème dû à Lebesgue<ref>Modèle:HewittStromberg, Théorème 17.12, p. 264 et Théorème 18.16, p. 285.</ref>, la fonction de répartition d'une variable aléatoire réelle Modèle:Mvar étant croissante est dérivable presque partout sur <math>\mathbb{R}</math>, et la dérivée ainsi obtenue est positive et intégrable sur <math>\mathbb{R}</math>, d'intégrale inférieure ou égale à 1.
Une variable aléatoire réelle est à densité si et seulement si l'un des critères équivalents suivants est satisfait :
- Sa fonction de répartition est absolument continue ;
- L'intégrale de la dérivée de sa fonction de répartition vaut 1.
La continuité de la fonction de répartition exclut les variables aléatoires discrètes mais ne suffit pas pour définir une fonction de densité, comme dans le cas d'une variable aléatoire dont la fonction de répartition est l'escalier de Cantor. Une telle loi est dite diffuse, mais la dérivée de la fonction de répartition est presque partout nulle.
On dispose également d'une condition suffisante souvent utilisée dans les cas pratiques : une variable aléatoire réelle dont la fonction de répartition est continue et de classe <math>\,\mathcal{C}^1</math> par morceaux sur <math>\mathbb{R}</math> est une variable à densité.
Espérance, variance et moments
Soit Modèle:Mvar une variable aléatoire réelle ayant une densité de probabilité Modèle:Mvar. D'après le théorème de transfert, Modèle:Mvar possède un moment d'ordre Modèle:Mvar si et seulement si l'intégrale
est finie. On a dans ce cas
En particulier, lorsque le moment d'ordre 2 existe :
et, d'après le théorème de König-Huyghens,
Définition informelle de la densité de probabilité
La définition qui suit est une reformulation de la définition intégrale proposée en début d'article. C'est la définition utilisée en général par les physiciens, en particulier ceux issus du domaine de la physique statistique.
Si Modèle:Math est un nombre réel positif infiniment petit, alors la probabilité que Modèle:Mvar soit inclus dans l'intervalle Modèle:Math est égale à Modèle:Math soit :
Cette « définition » est très utile pour comprendre intuitivement à quoi correspond une densité de probabilité, et est correcte dans beaucoup de cas importants. On peut tracer une analogie avec la notion de densité de masse, ou encore avec la notion de densité de population. Une formulation plus mathématique serait
ce qui permet de comprendre en quoi la définition donnée en physique n'est pas complètement rigoureuse :
et il est alors facile de vérifier que si Modèle:Mvar possède une limite à droite en Modèle:Mvar, notons-la Modèle:Math on a alors
ce qui corrobore la définition physique lorsque Modèle:Mvar est continue à droite en Modèle:Mvar, mais la met en défaut quand Modèle:Math. Bien sûr, les densités de probabilités usuelles sont continues à droite sauf éventuellement en un nombre fini (et en un petit nombre) de points.
Notons que ce genre d'interprétation infinitésimale (ou issue de la physique) s'étend aux dimensions Modèle:Math, voir la section suivante. Modèle:Exemple
Modèle:Exemple F(t)^{4} (1-F(t))^{4} f(t)\ =\ {9 \choose 4,1,4}F(t)^{4} (1-F(t))^{4} f(t),
</math>
puis
\int_{\mathbb R}F(t)^{4} (1-F(t))^{4} f(t)\,\mathrm{d}t = \int_{0}^1 x^{4} (1-x)^{4}\,\mathrm{d}x = \frac{\Gamma(5)^2}{\Gamma(10)} = \frac{4!\cdot 4!}{9!}.
</math>Pour les deux dernières égalités, se référer aux pages sur la fonction bêta et sur la fonction gamma. Il en découle que Modèle:Mvar satisfait le critère 1. CQFD.
On pourra consulter le livre de David<ref name="david" /> (pages 8-13) pour plus de détails.}}
Densité de probabilité d'un vecteur aléatoire
Cette définition est en particulier valable pour Modèle:Math et est donc équivalente à la première définition, dans le cas particulier Modèle:Math. Il existe une définition (équivalente) en termes d'espérance mathématique :
Modèle:Théorème Si une fonction Modèle:Mvar est la densité de probabilité d'une variable aléatoire à valeur dans <math>\,\mathbb{R}^d</math>, cette fonction vérifie les propriétés suivantes
- Modèle:Mvar est intégrable sur <math>\,\mathbb{R}^d</math> ;
- <math>\int_{\mathbb{R}^d}f(t)\,\mathrm{d}t = 1</math> ;
- Modèle:Mvar est presque partout positive ou nulle sur <math>\,\mathbb{R}^d</math>.
Réciproquement, si une fonction Modèle:Mvar vérifie les 3 propriétés ci-dessus, on peut construire une variable aléatoire Modèle:Mvar à valeur dans <math>\,\mathbb{R}^d</math> ayant Modèle:Mvar pour densité de probabilité. Les variables aléatoires qui possèdent une densité de probabilité sont appelées parfois variables à densité, parfois variables continues.
Existence
En vertu du théorème de Radon-Nikodym, le vecteur aléatoire Modèle:Mvar possède une densité si et seulement si, pour chaque borélien Modèle:Mvar de <math>\,\mathbb{R}^d\ </math> dont la mesure de Lebesgue est nulle, on a
Ce critère est rarement employé dans la pratique pour démontrer que Modèle:Mvar possède une densité, mais il est en revanche utile pour démontrer que certaines probabilités sont nulles. Par exemple, si le vecteur aléatoire Modèle:Math possède une densité, alors
- <math>\mathbb{P}\left(X=Y\right)=0</math> ,
- <math>\mathbb{P}\left(X^2+Y^2-1=0\right)=0</math> ,
ou bien encore, plus généralement,
- <math>\mathbb{P}\left(Y=\varphi(X)\right)=0</math> ,
- <math>\mathbb{P}\left(\psi(X,Y)=0\right)=0</math> ,
pour des fonctions Modèle:Mvar et Modèle:Mvar suffisamment régulières<ref>Il suffit que Modèle:Mvar soit mesurable, ce qui est une forme de régularité minimale. Pour Modèle:Mvar, c'est plus compliqué, en effet il faut éviter des phénomènes de type « courbe de Peano », mais il faut aussi exclure le cas où Modèle:Mvar est identiquement nulle. Il faut donc que Modèle:Mvar soit suffisamment régulière, par exemple au sens où on peut lui appliquer le théorème des fonctions implicites, de sorte que la courbe d'équation Modèle:Math soit de mesure nulle.</ref>, parce que la mesure de Lebesgue (c'est-à-dire la surface) de la Modèle:1re (resp. du cercle unité, du graphe de la fonction Modèle:Mvar, ou de la courbe d'équation Modèle:Math) sont nulles.
Le critère de Radon-Nikodym peut aussi être utilisé pour démontrer qu'un vecteur aléatoire ne possède pas de densité : par exemple, si
où Modèle:Math désigne une variable aléatoire à valeur dans Modèle:Math (par exemple, si Modèle:Mvar est tiré au hasard uniformément sur le cercle unité, c'est-à-dire si Modèle:Math suit la loi uniforme sur Modèle:Math), alors Modèle:Mvar ne possède pas de densité car
Cas des variables aléatoires réelles à densité
En spécialisant à Modèle:Math, on note que, parmi les boréliens Modèle:Mvar de <math>\,\mathbb{R}\ </math> dont la mesure de Lebesgue est nulle, figurent en particulier les parties finies de <math>\,\mathbb{R}.\ </math> Donc une variable aléatoire réelle Modèle:Mvar à densité vérifie, en particulier :
pour tout nombre réel Modèle:Mvar, et, par conséquent,
Il suit que les variables aléatoires réelles à densité ont nécessairement une fonction de répartition continue sur <math>\,\mathbb{R}.\ </math> La continuité de la fonction de répartition n'est pas, toutefois, une propriété caractéristique des variables aléatoires réelles à densité, comme le montre l'exemple de la loi de Cantor, dont la fonction de répartition est l'escalier de Cantor.
Non-unicité de la densité de probabilité
Si Modèle:Mvar et Modèle:Mvar sont deux densités de probabilités de la même variable aléatoire Modèle:Mvar alors Modèle:Mvar et Modèle:Mvar sont égales presque partout. Réciproquement, si Modèle:Mvar est presque partout égale à une densité de probabilité de Modèle:Mvar, alors Modèle:Mvar est une densité de probabilité de Modèle:Mvar. Ainsi une variable aléatoire à densité possède-t-elle toujours une infinité de densités de probabilité : par exemple, en perturbant l'une des densités de Modèle:Mvar de manière arbitraire en un nombre fini de points, on obtient encore une densité de Modèle:Mvar.
En revanche, la densité de probabilité est par conséquent unique modulo l'égalité presque partout.
Densité jointe de plusieurs variables aléatoires réelles
La fonction Modèle:Mvar définie de <math>\,\mathbb{R}^d\ </math> dans <math>\,\mathbb{R}\ </math> est une densité jointe de la suite de variables aléatoires réelles Modèle:Math si Modèle:Mvar est une densité de probabilité du vecteur aléatoire Modèle:Mvar à valeurs dans <math>\,\mathbb{R}^d,</math> défini par
On peut alors calculer la probabilité d'événements concernant les variables aléatoires réelles Modèle:Math de la manière suivante : Modèle:Exemple\,\left(\int_{-\infty}^{z_1}f(z_2)\,\mathrm{d}z_2\right)f(z_1)\,\mathrm{d}z_1, \\ &= \int_{\mathbb{R}}F(z_1)f(z_1)\,\mathrm{d}z_1 \\ &= \frac12\left[F^2\right]_{-\infty}^{+\infty}=\frac12.
\end{array}</math>
Si par contre Modèle:Math p.s., le vecteur Modèle:Math a les mêmes lois marginales (Modèle:Math et Modèle:Math ont Modèle:Mvar pour densité de probabilité), mais n'a pas la même loi jointe, puisqu'alors <math>\,\mathbb{P}(Z_2\le Z_1)=1.</math> Ainsi la donnée des densités marginales de Modèle:Math et Modèle:Math, seules, ne permet pas de calculer la probabilité d'événements faisant intervenir à la fois Modèle:Math et Modèle:Math, comme l'évènement Modèle:Math. Pour effectuer le calcul, on utilise ordinairement la loi jointe de Modèle:Math et Modèle:Math, définie dans le cas ci-dessus par leur densité jointe. }}
Densité marginale
Soit Modèle:Mvar un vecteur aléatoire à valeurs dans <math>\,\mathbb{R}^2\ </math> de densité Modèle:Mvar et pour Modèle:Math soit Modèle:Math et Modèle:Math les deux coordonnées de Modèle:Math. On notera
Alors
Modèle:Théorème f_Z(x,y)\,\mathrm{d}y,\quad f_Y(y)= \int_{\mathbb{R}}\ f_Z(x,y)\,\mathrm{d}x.</math>
Les densités de probabilités Modèle:Mvar et Modèle:Mvar sont appelées les densités marginales de Modèle:Mvar.}} Modèle:Démonstration\left(\int_{\mathbb{R}}\ \psi(x,y)\,f_Z(x,y)\,\mathrm{d}y\right)\,\mathrm{d}x \\[5pt] &=\displaystyle \int_{\mathbb{R}}\left(\int_{\mathbb{R}}\ \varphi(x)\,f_Z(x,y)\,\mathrm{d}y\right)\,\mathrm{d}x \\[5pt] &=\displaystyle \int_{\mathbb{R}}\varphi(x)\,\left(\int_{\mathbb{R}}\ f_Z(x,y)\,\mathrm{d}y\right)\,\mathrm{d}x. \end{array}
</math>
Cela a lieu pour tout Modèle:Mvar borélien borné, car Modèle:Math est borné donc intégrable, et <math>\,\mathbb{E}\left[\psi(Z)\right]\ </math> est donc bien définie. En comparant le premier et le dernier terme de la série d'égalités ci-dessus, on voit que la marginale <math>\,\int_{\mathbb{R}}\ f_Z(x,y)\,\mathrm{d}y\ </math> satisfait la condition requise pour être une densité de probabilité de Modèle:Mvar. CQFD.
Le cas de Modèle:Mvar peut être traité de la même manière. }} Plus généralement, si Modèle:Mvar définie de <math>\,\mathbb{R}^d\ </math> dans <math>\,\mathbb{R}\ </math> est une densité jointe de :
on peut calculer une densité Modèle:Mvar de (par exemple) Modèle:Math de la manière suivante (si Modèle:Math par exemple) :
g(x_2,x_5,x_6) = \int_{\mathbb{R}^5}\ f(x_1,x_2,\dots,x_8)\,\mathrm{d}x_1\,\mathrm{d}x_3\,\mathrm{d}x_4\,\mathrm{d}x_7\,\mathrm{d}x_8,
</math>c'est-à-dire en intégrant par rapport à toutes les coordonnées qui ne figurent pas dans le triplet Modèle:Mvar. La fonction Modèle:Mvar est elle aussi appelée « densité marginale » ou « marginale » de Modèle:Mvar. Une formulation générale serait lourde. La démonstration générale est calquée sur la démonstration de la propriété ci-dessus. Modèle:Exempleg(z)\,\mathrm{d}z_1 &= \displaystyle 9!\ F(z_2)\ \prod_{i=2}^9 f(z_i)\ 1_{z_2<z_3<\dots<z_9}, \\[5pt] \displaystyle \int_{\mathbb{R}^2}g(z)\,\mathrm{d}z_1\,\mathrm{d}z_2 &= \displaystyle \frac{9!}{2!}\ F(z_3)^2\ \prod_{i=3}^9 f(z_i)\ 1_{z_3<\dots<z_9}, \\[5pt] \displaystyle \int_{\mathbb{R}^4}g(z)\,\mathrm{d}z_1\,\mathrm{d}z_2\,\mathrm{d}z_3\,\mathrm{d}z_4 &= \displaystyle \frac{9!}{4!}\ F(z_5)^4\ \prod_{i=5}^9 f(z_i)\ 1_{z_5<\dots<z_9}, \\[5pt] \displaystyle \int_{\mathbb{R}^4}g(z)\,\mathrm{d}z_1\,\mathrm{d}z_2\,\mathrm{d}z_3\,\mathrm{d}z_4\,\mathrm{d}z_9 &= \displaystyle \frac{9!}{4!\times 1!}\ F(z_5)^4\ \left(1-F(z_8)\right)\ \prod_{i=5}^8 f(z_i)\ 1_{z_5<\dots<z_8}, \\ &\dots \\ {f}_{M}(z_5) &= \displaystyle \frac{9!}{4!\times 4!}F(z_5)^4\left(1-F(z_5)\right)^4f(z_5). \end{array}
</math>}}
Indépendance des variables aléatoires à densité
Soit une suite Modèle:Math de variables aléatoires réelles définies sur le même espace de probabilité <math>\,(\Omega, \mathcal{A}, \mathbb{P}).\ </math> Modèle:Théorème
Fonction de variables aléatoires à densité
Dans cette section, on considère la question suivante : étant donné une variable aléatoire Modèle:Mvar de densité Modèle:Mvar et une fonction Modèle:Mvar, quelle est la loi de la variable aléatoire Modèle:Math ? En particulier, sous quelles conditions Modèle:Mvar possède-t-elle aussi une densité de probabilité Modèle:Mvar ? Et comment peut-on la calculer ? Une réponse rapide est que, localement, on doit pouvoir appliquer à la fonction Modèle:Mvar le théorème d'inversion locale sauf sur un ensemble de points de mesure de Lebesgue nulle). Le calcul de Modèle:Mvar se résume alors à un changement de variable dans une intégrale simple ou multiple, comme cela est illustré dans les quelques exemples ci-dessous.
Somme de variables aléatoires indépendantes
La densité de probabilité de la somme de deux variables aléatoires indépendantes Modèle:Mvar et Modèle:Mvar, chacune ayant une densité Modèle:Mvar et Modèle:Mvar, est donnée par une convolution de ces densités :
Modèle:Démonstration\varphi(u+v)f_{X}(u,v)dudv \\ &= \int_{\mathbb{R}^{2}}\varphi(y)f_{X}(t,y-t)\ |J(y,t)|\ dydt,
\end{array}</math>
où Modèle:Math désigne le déterminant jacobien correspondant au changement de variable
\\ t&=&u,
\end{matrix}</math>c'est-à-dire
\\ \frac{\partial v}{\partial y} &\frac{\partial v}{\partial t} \end{vmatrix}=\begin{vmatrix}0 &1 \\ 1 &-1
\end{vmatrix}=-1.</math>Donc, pour toute fonction Modèle:Mvar mesurable bornée,
\\ &= \int_{\mathbb{R}}\varphi(y)\left(\int_{\mathbb{R}}f_{U}(t)f_{V}(y-t)dt\right)\ dy \\ &= \int_{\mathbb{R}}\varphi(y)\ (f_{U}\ast f_{V})(y)\ dy.
\end{array}</math>CQFD }} Pour déterminer la loi de la somme de variables indépendantes, on peut aussi passer par la fonction génératrice des moments ou par la fonction caractéristique d'une variable aléatoire<ref>Que ces variables aléatoires ait une densité de probabilité, ou qu'elles n'en aient pas. Notons que, si une variable aléatoire possède une densité de probabilité, alors sa fonction caractéristique est la transformée de Fourier de cette densité.</ref>. C'est ainsi qu'est démontré le théorème central limite.
La densité de probabilité de la moyenne de deux variables aléatoires indépendantes Modèle:Mvar et Modèle:Mvar, chacune ayant une densité Modèle:Mvar et Modèle:Mvar, s'obtient alors en utilisant la fonction suivante :
Fonction d'une variable aléatoire réelle à densité
Notons Modèle:Mvar la densité de la variable aléatoire réelle Modèle:Mvar. Il est possible de considérer un changement de variable, dépendant de Modèle:Mvar. La transformation est la suivante : Modèle:Math où la fonction Modèle:Mvar est strictement monotone et dérivable, de dérivée qui ne s'annule nulle part. La densité Modèle:Math de la transformée est Modèle:Théorème où Modèle:Math représente la fonction réciproque de Modèle:Mvar et Modèle:Mvar la dérivée de Modèle:Mvar. Modèle:Démonstration
Pour une transformation Modèle:Mvar non monotone, la densité de probabilité de Modèle:Mvar est
où Modèle:Math est le nombre de solutions en Modèle:Mvar de l'équation Modèle:Math, et Modèle:Math sont les solutions. La fonction Modèle:Mvar doit vérifier certaines hypothèses, toutefois : essentiellement on doit pouvoir lui appliquer le théorème d'inversion locale sauf sur un ensemble de points de mesure de Lebesgue nulle. Par exemple un ensemble d'hypothèses peu limitatif mais simple à vérifier serait : Modèle:Mvar est de classe C1 et l'ensemble des zéros de la dérivée Modèle:Mvar est localement fini. Il s'agit d'exclure entre autres (mais pas seulement) le cas où Modèle:Mvar est constante sur un ensemble de mesure non nulle pour la loi de Modèle:Mvar, cas où Modèle:Math n'a pas une loi à densité, car la loi de Modèle:Math peut alors avoir une partie discrète. Modèle:Exemple\varphi(ax+b)f_X(x)\,\mathrm{d}x \\[7pt] &= \displaystyle \int_{+\infty}^{-\infty}\varphi(u)f_X\left(\frac{u-b}{a}\right)\ \frac{\mathrm{d}u}{a} \\[7pt] &= \displaystyle \int_{-\infty}^{+\infty}\varphi(u)\ \left(\frac{1}{-a}\ f_X\left(\frac{u-b}{a}\right)\right)\,\mathrm{d}u,
\end{array}</math>
- ceci pour toute fonction Modèle:Mvar mesurable bornée. CQFD.
- Prenons l'exemple du carré d'une variable aléatoire ; on sait que, si Modèle:Math
\mathbb{E}[\varphi(Y)] &=\displaystyle \mathbb{E}[\varphi(X^2)] = \int_{\mathbb{R}}\varphi(x^2)f_X(x)\,\mathrm{d}x \\[7pt] &= \displaystyle \int_{-\infty}^{0}\varphi(x^2)f_X(x)\,\mathrm{d}x+\int_{0}^{+\infty}\varphi(x^2)f_X(x)\,\mathrm{d}x \\[7pt] &=\displaystyle \int_{+\infty}^{0}\varphi(u)f_X(-\sqrt{u})\ \left(-\frac{\mathrm{d}u}{2\sqrt{u}}\right)+ \int_{0}^{+\infty}\varphi(u)f_X(\sqrt{u})\ \left(\frac{\mathrm{d}u}{2\sqrt{u}}\right) \\[7pt] &= \displaystyle \int_{\mathbb{R}}\varphi(u)\ \frac{1}{2\sqrt{u}} \left[f_X(\sqrt{u}) + f_X(-\sqrt{u})\right] 1_{\mathbb{R}_+}(u)\,\mathrm{d}u,
\end{array}</math>- ceci pour toute fonction Modèle:Mvar mesurable bornée. Ainsi, on trouve que
- ce qui est conforme à la formule.
- Autre solution : on sait que,
- si Modèle:Math :
- si Modèle:Math, alors
- En dérivant, on trouve à nouveau
}}