Fonction de répartition
En théorie des probabilités ou en statistiques, la fonction de répartition d'une variable aléatoire réelle caractérise la loi de probabilité de cette variable aléatoire réelle.
Page(s) en rapport avec ce sujet :
- F (x) se nomme la fonction de répartition de la variable X. C'est la proportion de la... La fonction de répartition est clairement une fonction monotone croissante.... Nous montrons ici que deux v. a. X et Y de fonctions de répartition... (source : aiaccess)
- La théorie des fonctions d'une variable complexe :..... La fonction de répartition est facile à calculer puisque 1/ (1 + x2) n'est autre que la fonction... (source : serge.mehl.free)


En théorie des probabilités ou en statistiques, la fonction de répartition d'une variable aléatoire réelle caractérise la loi de probabilité de cette variable aléatoire réelle. La fonction de répartition de la variable aléatoire réelle est la fonction qui à tout réel associe

où le membre de droite réprésente la probabilité que la variable aléatoire réelle prenne une valeur inférieure ou égale à La probabilité que se trouve dans l'intervalle est par conséquent, si

La fonction de répartition d'une mesure de probabilité définie sur la tribu borélienne est la fonction qui à tout réel associe
![F(x) = \mathbb{P}(]-\infty, x]).](illustrations/57ec4f5b8b6fb7931aa32b030458ef10.png)
Exemples de calculs de la fonction de répartition
Variables à densité


La fonction de répartition d'une variable aléatoire de densité de probabilité est une des primitives (en un sens légèrement relaché, voir ci-dessous) de cette densité. Plus exactement, est définie, pour tout nombre réel x, par :
Cependant, ce n'est pas, en toute généralité, une primitive au sens strict du terme : on peut uniquement affirmer
- qu'une fonction de répartition est dérivable presque partout (pour la mesure de Lebesgue),
- que si la variable est à densité, alors la dérivée de est presque partout (pour la mesure de Lebesgue) égale à
Mais il y a énormément de "contre-exemples" : la fonction de répartition de la loi uniforme sur un intervalle, ou encore celle de la loi exponentielle, ne sont pas dérivables sur tout et ne sont par conséquent pas, au sens strict, des primitives de densités de probabilités.
Notons que, contrairement aux variables discrètes, une variable à densité X vérifie pour tout nombre réel a : en conséquence, la fonction de répartition des variables à densité est continue en tout point. En fait une variable aléatoire réelle X possède une densité de probabilité si et uniquement si sa fonction de répartition est totalement continue sur chaque intervalle borné.
Variables discrètes


Une variable aléatoire est dite discrète s'il existe un ensemble fini ou dénombrable tel que

La loi de est déterminée sans ambiguité par la donnée de, où
Si, par exemple, est une variable aléatoire réelle, on a

où est la fonction indicatrice de la totalité E.
Pour les variables aléatoires discrètes les plus courantes (par exemple, les lois uniformes, binomiales, de Poisson) est un ensemble bien ordonné : on peut alors numéroter ses éléments de manière croissante, p. e. et numéroter les probabilités en conséquence, p. e. en posant. On a alors, si

Soit toujours, d'une façon plus générale :

La fonction de répartition est alors une fonction constante par intervalles et sa représentation graphique est en escalier. Les sauts d'une marche à l'autre de l'escalier se situent aux abscisses, et l'amplitude du saut d'abscisse est Surtout la fonction de répartition d'une variable discrète X est discontinue précisément aux points s tels que 0. \ " src="http ://upload. wikimedia. org/math/6/0/f/60f9f6dbd466a173bba4925b57a5e06b. png" /> Voir la section Propriétés de la fonction de répartition pour une démonstration.
Miscellanées
L'escalier de Cantor F est un exemple de fonction de répartition continue mais dont la dérivée est presque partout nulle. Ainsi, les formules précédentes ne valent pas pour l'escalier de Cantor : pour x>0, on n'a pas

car l'intégrale de droite est semblablement nulle, tandis que l'escalier de Cantor prend des valeurs strictement positives sur En effet, la totalité

est de mesure de Lebesgue nulle. D'autre part, la loi de probabilité associée à l'escalier de Cantor est diffuse (sans atome), puisque F est une fonction continue sur L'escalier de Cantor est en fait un exemple de fonction de répartition continue mais qui n'est pas totalement continue sur chaque intervalle.
Propriétés de la fonction de répartition
Propriétés caractéristiques
Théorème — La fonction de répartition d'une variable aléatoire a les propriétés caractéristiques suivantes :
- est croissante ;
- Elle est partout continue à droite ;
;
Le point 1 découle de la propriété de croissance des mesures de probabilité
![\{x\le y\}\Rightarrow\{]-\infty, x]\ \subset\ ]-\infty, y]\}\Rightarrow\{\mathbb{P}_{X}(]-\infty, x])\le\mathbb{P}_{X}(]-\infty, y])\}.](illustrations/b4c475303f5772c740862a3d88198d59.png)
Comme est monotone, le point 2 se réduit à montrer que

ou encore, équivalemment,
![\lim_{n}\mathbb{P}_{X}\left(\left]-\infty, x+\tfrac{1}{n}\right]\right)=\mathbb{P}_{X}\left(\left]-\infty, x\right]\right).](illustrations/120df34deef4cb55a4243ad04db97d06.png)
Mais les boréliens forment une suite décroissante, et
![\bigcap_{n\ge 1}\left]-\infty, x+\tfrac1n\right]\ =\ \left]-\infty, x\right],](illustrations/ffad7c55f19bbad3e5270073a541c74e.png)
donc le point 2 est une conséquence des axiomes des probabilités. Comme est monotone, le point 3 se réduit à montrer que

Ceci est toujours une conséquence des axiomes des probabilités, puisque
![\bigcap_{n\ge 1}\left]-\infty, -n\right]\ =\ \emptyset.](illustrations/f9a54fdec983c67655f0bc598e48c6e3.png)
Le point 4 découle, de la même manière, de
![\bigcup_{n\ge 1}\left]-\infty, n\right]\ =\ \R.](illustrations/a6e48f3d1cc0a1b30c4dcdb4de99edc8.png)
Comme on l'a dit, les points 1 à 4 sont caractéristiques de la fonction de répartition d'une variable aléatoire réelle : étant donné une fonction réelle de la variable réelle, notons la, satisfaisant les points 1 à 4, on peut construire concrètement une variable aléatoire réelle ayant pour fonction de répartition, voir ci-dessous le théorème de la réciproque. Notons que la construction utilisant le théorème de la réciproque sert concrètement à produire, sur ordinateur, des échantillons de taille arbitraire d'une loi de probabilité arbitraire, ce qui est l'ingrédient de base des méthodes de Monte-Carlo.
Autres propriétés
A cause des points 1, 3 et 4, FX est bornée, plus exactement
Comme toute fonction monotone bornée, FX admet en tout point x une limite à gauche FX (x—) , limite à gauche égale ou non à FX (x) selon que FX est continue en x ou non.
La connaissance de la fonction de répartition sert à calculer la probabilité de tout intervalle
et
- est la définition d'une fonction de répartition.
- on obtient x) \, =\, 1-F_X (x) \ " src="http ://upload. wikimedia. org/math/6/d/0/6d0e253476ff836e11594cbe61492d86. png" /> par passage au complémentaire,
- pour on utilise pour et
- La relation est la plus délicate et fait intervenir une conséquence des axiomes des probabilités sur la probabilité de l'union d'une suite croissante d'ensembles. On considère une suite de réels croissante, convergeant vers x. L'intervalle est alors union dénombrable de la suite croissante d'intervalles. La probabilité de l'intervalle est par conséquent la limite des probabilités des intervalles, i. e. la limite de la suite Par propriété des fonctions croissantes, cette limite existe et vaut
Les 5 dernières propriétés découlent de pour différents choix de et
- pour
- pour
- pour
- pour
On nomme atome de la variable aléatoire X tout réel a pour lequel 0" src="http ://upload. wikimedia. org/math/3/5/1/351883ce7e7ade6bdd61ed0ef8401650. png" />. Ainsi, en vertu de la dernière propriété de la liste ci-dessus,
Propriété — Les atomes de la variable aléatoire X sont précisément les points de discontinuité de la fonction de répartition.
La fonction de répartition d'une variable aléatoire X est par conséquent continue si et uniquement si X n'a aucun atome, i. e. si et uniquement si
On dit tandis que la loi de X est diffuse, ou bien sans atome, et , par extension, que la variable aléatoire X elle-même est diffuse ou sans atome. Surtout, les variables aléatoires réelles possédant une densité de probabilité sont diffuses. Il existe cependant des variables aléatoires diffuses mais ne possédant pas pour tout autant une densité de probabilité, c'est le cas, par exemple, de la variable aléatoire ayant pour fonction de répartition l'escalier de Cantor.
Notons que la totalité des points de discontinuité de FX est fini ou dénombrable, comme c'est le cas pour toute fonction monotone bornée :
Conséquence — La totalité S des atomes de la variable aléatoire X est fini ou dénombrable.
Caractérisation de la loi par la fonction de répartition
Théorème — La loi de probabilité d'une variable aléatoire réelle est caractérisée par sa fonction de répartition.
Ou bien toujours : si deux variables aléatoires réelles ont même fonction de répartition, alors elles ont même loi (et réciproquement).
Sous l'hypothèse, on peut démontrer de manière élémentaire que dès que est un borélien "simple" (par exemple, si est un intervalle). Par contre, la démonstration générale (pour tout borélien) est un cas spécifique du lemme d'unicité des probabilités, lui-même corrolaire du lemme de classe monotone, appliqué à la classe
Il faut vérifier que
- la classe est stable par intersection finie,
- la tribu génèrée par contient (et en fait est égale à ) la tribu borélienne.
Le lemme d'unicité des probabilités permet alors de conclure.
Vérifions 1. Soit une partie finie de. Soit l'élément minimal de. Alors
Vérifions 2. La tribu génèrée par est notée. La tribu borélienne est notée, comme fréquemment. Notons
On a en vertu de la stabilité des tribus par passage au complémentaire, par conséquent par définition d'une tribu génèrée. On peut interchanger et dans ce qui précède, par conséquent, par double inclusion,
Comme est une partie de la totalité des ouverts, on en déduit que
Mais il nous faut en particulier démontrer l'inclusion en sens inverse, et , pour cela, démontrer que tout ouvert de est dans (ainsi est une tribu contenant l'ensemble des ouverts de, tandis que est la plus petite tribu contenant l'ensemble des ouverts de). Un argument rapide est de constater que
- tout ouvert de est réunion dénombrable d'intervalles ouverts, et que
- les intervalles ouverts sont dans.
Le premier point résulte de ce que
- un ouvert est réunion disjointe de ses composantes connexes (cela est vrai pour toute partie de),
- les parties connexes de (et surtout les composantes connexes ci-dessus) sont précisément les intervalles de
- comme est localement connexe, les composantes connexes d'un ouvert sont automatiquement ouvertes.
- dans chaque composante connexe de notre ouvert, on peut choisir un nombre rationnel. Les sont différents car les composantes sont disjointes. Ainsi est une bijection entre la famille des composantes connexes de et une partie de La famille des composantes connexes de est par conséquent finie ou dénombrable.
Le deuxième point tient à ce que
- comme on l'a vu plus haut ;
- ;
CQFD
En d'autres termes, si deux variables aléatoires réelles, et, vérifient
alors elles vérifient aussi que pour tout borélien,
De plus, elles vérifient que pour toute fonction mesurable,
dès que l'un des deux termes de l'égalite a un sens.
Théorème de la réciproque
Soit une fonction de dans satisfaisant les 4 propriétés caractéristiques. Notons la fonction définie pour par

Alors est une variable aléatoire réelle définie sur l'espace probabilisé où et où sert à désigner la restriction à de la mesure de Lebesgue sur. Le théorème stipule que :
Théorème — Sur l'espace, la fonction de répartition de est.
Ainsi toute fonction de dans satisfaisant les 4 propriétés caractéristiques dépend de répartition d'une variable aléatoire réelle (de, par exemple), ou encore d'une mesure de probabilité sur (de la loi de, par exemple).
Démonstration
Pour, notons

Donc. A cause du point 4,, ainsi qu'à cause du point 3, est bornée inférieurement, par conséquent est bien définie.
Commençons par un cas simple à titre d'entrainement :
F est continue strictement croissante
Si est continue strictement croissante sur, alors est une bijection de dans ]0, 1[, et est la réciproque de (on peut s'en convaincre en traçant à l'aide du graphe de). A ce titre, est continue et strictement croissante sur ]0, 1[, et surtout est mesurable (c'est par conséquent une v. a. r. ). On a, qui plus est ,

donc
![\begin{align}
\left\{\omega\in\Omega\ |\ G(\omega)\le x\right\}
&=
\left\{\omega\in\Omega\ |\ \omega\le F(x)\right\}
\\
&=
]0, F(x)].
\end{align}](illustrations/35865cf34891acce296bfba75db07b0a.png)
Ainsi
![\mathbb{P}\left(G\le x\right)
=
\mathbb{P}(]0, F(x)])
=F(x).](illustrations/98fe2fd37fd2810bf1ff9d6a14f0c56f.png)
Cas général
Dans le cas général, on a aussi

et on conclut par conséquent précisément de la même manière que auparavant, mais la démonstration de l'équivalence ci-dessus est moins directe. Dans un premier temps, pour,, et par conséquent. Du fait que est monotone, il résulte que est mesurable.
On a, par définition de et de,

La réciproque vient de ce que, i. e. ce qui, avec entraîne, par croissance de, et finalement Supposons en effet que, et considérons une suite strictement décroissante d'éléments de telle que

Par continuité à droite de,

mais également, par définition de,

ce qui conduit à, d'où une contradiction (démonstration beaucoup reprise de Sidney Resnick, A Probability Path).
Remarques.
- Quand est une bijection bicontinue d'un intervalle dans (i. e. est continue strictement croissante), est tout simplement la réciproque de (i. e. et). Pour cette raison, est quelquefois nommée réciproque généralisée de
- L'intérêt pratique de ce Théorème est développé dans l'article Méthode de la transformée inverse, mais aussi dans la section suivante.
Conséquences du théorème de la réciproque
Simulation de variables aléatoires réelles de loi arbitraire
- Si sert à désigner une variable aléatoire réelle uniforme sur [0, 1], alors a pour fonction de répartition.
Ainsi dans tout langage de programmation possédant un générateur de nombres aléatoires, on peut simuler une suite de longueur arbitraire de v. a. r. indépendantes de même fonction de répartition, pourvu que soit connue : il suffit alors d'appeler ce générateur de manière répétée, et d'appliquer la fonction aux nombres produits par ces appels répétés.
Exemples
densité de probabilité | fonction de répartition | réciproque (généralisée) | code | |
---|---|---|---|---|
Loi de Cauchy | ||||
Loi exponentielle | ||||
Loi uniforme sur [a, b] | ||||
Loi de Bernoulli | ||||
Loi uniforme sur | ||||
Loi normale, Loi binomiale | comme il n'y a pas de formule suffisamment explicite pour la fonction de répartition, et toujours moins de formule explicite pour la réciproque de cette dernière, le théorème est alors inopérant. |
Autres conséquences du théorème de la réciproque
La réciproque généralisée de est un exemple de v. a. r. dont la fonction de répartition est, mais c'est un exemple privilégié. Ses utilisations sont nombreuses, allant de propriétés de l'ordre stochastique, à des propriétés de la distance de Wasserstein [1], en passant par le théorème de représentation de Skorohod, voir section suivante.
Convergence en loi et fonction de répartition
Considérons une suite de variables aléatoires (resp. une variable aléatoire) définies sur des espaces probabilisés (resp.) peut-être différents, mais toutes à valeurs dans le même espace métrique. On dit que converge en loi vers ssi, pour toute fonction continue bornée de dans,
On a le théorème suivant :
Théorème — Dans le cas de variables aléatoires réelles (), notons les fonctions de répartitions de et de. Il y a alors équivalence entre les 3 propositions ci-dessous :
- converge en loi vers,
- pour tout réel en lequel est continue,,
- il existe un espace probabilisé, et , définies sur cet espace, des variables aléatoires réelles et telles que, simultanément,
- a même loi que,
- pour chaque, a même loi que,
- converge presque sûrement vers.
L'implication 1. 3. reste vraie quand les variables aléatoires réelles sont remplacées par des variables aléatoires à valeurs dans un espace de Lusin, i. e. un espace métrisable assez général (et en sont des exemples). L'implication 1. 3. porte alors le nom de Théorème de représentation de Skorohod.
Une structure envisageable pour la démonstration est 3. 1. 2. 3.
3. implique 1.
C'est le plus simple. Il faut démontrer que
ou bien, équivalemment,
Mais la continuité de assure que converge presque sûrement vers. Qui plus est , étant borné, on a que
pour tout. Le théorème de convergence dominée de Lebesgue peut par conséquent être appliqué ici, et donne la conclusion voulue.
1. implique 2.


On utilise la famille de fonctions continues bornées définies par le graphe ci-contre. Elles vérifient, pour toute variable aléatoire réelle,
et surtout
On remarque tandis que, pour tout 0" src="http ://upload. wikimedia. org/math/1/7/3/173492210ac388d942717dc205144675. png" />,
et
En faisant tendre vers 0, on obtient
Ainsi, dès que est un point de continuité de,
2. implique 3.
Notons, les réciproques généralisées de. Pour le triplet, choisissons, et prenons pour la tribu des boréliens et la mesure de Lebesgue correspondantes (i. e. restreintes à). Le choix de satisfait à 3.1. ainsi qu'à 3.2. en vertu du théorème de la réciproque. Qui plus est , en conséquence de 2., converge presque sûrement vers (mais cela mériterait d'être développé).
Voir aussi
- Article principal : Variable aléatoire
- Convergence de variables aléatoires
- Convergence en loi
- en :Wasserstein metric
- Inégalité de réarrangement
Recherche sur Amazon (livres) : |
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 10/03/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.