Variable aléatoire réelle
Une variable aléatoire réelle est une variable aléatoire à valeurs dans, ou une partie de ; c'est une fonction définie depuis la totalité des résultats envisageables d'une expérience aléatoire, dont on doit pouvoir déterminer la probabilité...
Page(s) en rapport avec ce sujet :
- Une variable aléatoire réelle (en abrégé v. a. r. ).... si X est discr`ete, FX est une fonction en escalier, et vice versa. • si X est `a densité, ... (source : perso.centrale-marseille)
- La fonction de répartition d'une variable discrète exprime les valeurs F (xi)... Quand une variable aléatoire X pouvant prendre toute valeur réelle (son... (source : serge.mehl.free)
- Exercice 11.3 (Simulation de variables aléatoires. ). Soient X une variable aléatoire réelle définie sur un espace de probabilité (Ω, A, P) et F sa fonction de ... (source : fimfa.ens)


la fonction qui associe au résultat du jet de deux dés la somme de leurs valeurs
Une variable aléatoire réelle est une variable aléatoire à valeurs dans, ou une partie de ; c'est une fonction définie depuis la totalité des résultats envisageables d'une expérience aléatoire, dont on doit pouvoir déterminer la probabilité qu'elle prenne une valeur donnée ou un ensemble donné de valeurs. Les variables aléatoires réelles sont les variables aléatoires les plus fréquemment étudiées, ce qui conduit certains auteurs à omettre l'adjectif réel, ainsi qu'à parler de variable aléatoire tout court.
Les variables aléatoires sont particulièrement utilisées en théorie des probabilités et en statistiques. Dans les applications, les variables aléatoires sont utilisées pour modéliser le résultat d'un mécanisme non-déterministe ou encore comme le résultat d'une expérience non-déterministe qui génère un résultat aléatoire. En statistique mathématique ou inférentielle, les variables aléatoires servent le plus souvent à modéliser des populations supposées illimitées.
- L'article qui suit traite les variables aléatoires réelles
- L'article Variable aléatoire généralise cet article au cas non réel sous l'angle de la théorie de la mesure
- L'article Variables aléatoires élémentaires aborde la notion de variable aléatoire d'une manière plus intuitive
Détails
- Au départ, une variable était une fonction de gain, qui représentait le gain obtenu à l'issue du résultat d'un jeu. A titre d'exemple, supposons qu'un joueur lance un dé et que ce dernier gagne 1€ s'il amène un six et perde 10€ s'il amène un autre résultat. Alors il est envisageable de définir la variable aléatoire de gain qui associe 1 au résultat «six» et -10 à un résultat inintéressant. La probabilité pour que la variable aléatoire prenne la valeur 1 correspond précisément à la probabilité pour que le joueur gagne 1€.
- La variable aléatoire réelle la plus simple est donnée par le résultat d'un lancer au jeu de pile ou face, qui vaut pile ou face. Un autre exemple simple est donné par le résultat d'un jet de dés, pour lequel les valeurs envisageables sont 1, 2, 3, 4, 5, 6 (si le dé est classiquement cubique). De telles variables aléatoires réelles sont qualifiées de discrètes car elles prennent des valeurs bien scindées. A contrario, la mesure de la taille d'un individu pris au hasard dans une population ressemble davantage à un nombre réel positif (cela n'est pas particulièrement vrai non plus, car des questions ergonomiques rendent d'autant plus improbable l'énoncé d'un nombre qu'il comporte de décimales significatives; l'attracteur est en fait un fractal). Cette variable aléatoire réelle est tandis qualifiée par convention de continue. L'étude de la répartition des valeurs prises par une variable aléatoire conduit à la notion de loi de probabilité.
- En mathématiques, et plus exactement en théorie des probabilités, une variable aléatoire est une fonction mesurable définie sur un espace de probabilités. La mesure image correspondante est nommée loi de la variable aléatoire. Ce type de fonction sert à modéliser un phénomène aléatoire, comme par exemple le résultat d'un jet de dés. Une propriété intéressante de l'intégrale de Lebesgue fait qu'un évènement de probabilité strictement nulle n'est pas obligatoirement impossible au sens strict du terme (ainsi, considérons un réel tiré au hasard dans l'intervalle [0, 1] ; la probabilité qu'il soit rationnel est nulle, tandis que les rationnels forment dans cet intervalle un ensemble illimité, et même partout dense).
Quelques variables aléatoires réelles
En guise d'introduction aux définitions concernant les variables aléatoires réelles, il semble intéressant de présenter brièvement une famille de variables particulièrement utilisées.
Outre la variable certaine qui prend une valeur donnée avec une probabilité égale à 1, la variable aléatoire réelle la plus simple est nommée variable de Bernoulli. Celle-ci peut prendre deux états, qu'il est toujours envisageable de coder 1 et 0, avec les probabilités p et 1-p. Une interprétation simple concerne un jeu de dé dans lequel on gagnerait un euro en tirant le six (p = 1/6). Sur une séquence de parties, la moyenne des gains tend vers p quand le nombre de parties tend vers l'infini.
Si on considère qu'une partie est constituée par n tirages au lieu d'un seul, le total des gains est une réalisation d'une variable binomiale qui peut prendre l'ensemble des valeurs entières de 0 à n. Cette variable a pour moyenne le produit np. On obtient un exemple moins futile en considérant le score d'un candidat dans un sondage électoral.
Si n est assez grand et p pas trop petit, on peut trouver une approximation convenable en utilisant la variable de Gauss. Dans les sondages cela permet d'associer un intervalle de confiance au résultat brut. Ainsi, il y a 95 chances sur 100 pour qu'une enquête portant sur 1 000 personnes donne un résultat correct à ± 3 % près.
Toujours avec n grand, l'approximation de Poisson est préférable si p est assez petit pour que la moyenne np ne soit pas trop grande, de l'ordre de quelques unités. Dans un sondage ce serait la loi applicable aux «petits» candidats. C'est en particulier la loi utilisée dans des problèmes de files d'attente.
La somme des carrés de ν variables de Gauss indépendantes est une variable de χ2 à ν degrés de liberté (la variable exponentielle en est un cas spécifique). Le test du χ2 est utilisé pour apprécier la valeur de l'correction d'une loi de probabilité sur une distribution empirique.
Si on divise une variable de Gauss par une variable de χ (racine carrée de la précédente), on obtient une variable de Student. Le rapport de deux variables de χ2 indépendantes définit une variable de Snedecor. Ces deux lois sont utilisées dans l'analyse de populations supposées gaussiennes.
Notions de base
Loi de probabilité
- La loi d'une variable aléatoire réelle décrit en détail la répartition des valeurs de cette variable. La loi de la variable X contient l'ensemble des informations nécessaires pour calculer sa fonction de répartition, son espérance et d'une façon plus générale ses moments, sa fonction caractéristique, sa médiane et ses quantiles.
- En d'autres termes, si deux variables aléatoires réelles X et Y ont même loi de probabilité, alors elles ont même fonction de répartition, même espérance et d'une façon plus générale mêmes moments, même fonction caractéristique, même médiane et mêmes quantiles.
- La loi de probabilité d'une variable aléatoire réelle X est la donnée des valeurs pour une classe particulièrement large de parties de, la tribu borélienne, incluant surtout les intervalles. A titre d'exemple, la loi de X donne la valeur de, pour tout choix de nombres réels, qui correspond au calcul de pour le choix, ou encore la valeur de, pour tout choix du nombre réel, ce qui correspond au calcul de pour le choix.
- Selon sa définition mathématique (voir l'article variable aléatoire pour plus de détail), la loi de X est la mesure de probabilité définie, pour tout élément de la tribu borélienne de par la relation
- La loi d'une variable aléatoire réelle peut être discrète ou posséder une densité (comparé à la mesure de Lebesgue sur). Ce sont les deux cas les plus habituels dans les applications.
Fonction de répartition


Il serait envisageable d'introduire cette notion à partir de l'une quelconque des variables auparavant reconnues mais il paraît plus clair d'étudier le cas du dé sous un angle différent. En effet, il définit une variable aléatoire X qui prend avec la même probabilité d'apparition (1/6) des valeurs dans la totalité {1, 2, 3, 4, 5, 6}. On peut alors associer à toute valeur réelle x la probabilité d'obtenir un tirage inférieur ou égal à x, ce qui définit une courbe en escalier dont les marches ont une hauteur égale à 1/6.
Formellement, cela conduit à une fonction de répartition

Dans celle-ci, la majuscule X représente la variable aléatoire réelle, ensemble de valeurs numériques, et la minuscule x représente la variable d'état, variable au sens courant du terme.
Si les événements ne sont plus équiprobables, cela ne fait que déformer la courbe. Pour introduire une notion nouvelle, on peut commencer par remplacer le dé par une roulette à six numéros (ce qui conduit à un problème rigoureusement semblable). Par la suite, on ne change rien d'essentiel si on remplace les six nombres entiers par les repères des centres d'arcs de 60 degrés. À partir de là il est envisageable d'augmenter le nombre de secteurs en réduisant leur taille : les échelons deviendront de plus en plus petits jusqu'à être indiscernables sur un dessin. Le passage à la limite remplace la variable discrète par une variable continue qui prend l'ensemble des valeurs réelles dans l'intervalle ]0, 360] : c'est une variable uniforme.
Une fonction de répartition est croissante (au sens large) sur l'intervalle ]-∞, +∞[, et continue à droite en tout point ; elle tend vers 0 en -∞ et vers 1 en +∞. Réciproquement, toute fonction vérifiant les propriétés (caractéristiques) précédentes peut être reconnue comme la fonction de répartition d'une variable aléatoire.
L'intérêt de la fonction de répartition réside dans le fait qu'elle est bien définie autant pour les variables continues définies sur un ensemble continu que pour les variables discrètes définies sur un ensemble dénombrable (dans la majorité des cas pratiques il se réduit à un ensemble de valeurs équidistantes qu'on peut ramener à un ensemble d'entiers). Le remplacement progressif (l'approximation) d'une fonction de répartition dont la courbe est en escalier par une fonction de répartition dont la courbe est continue sert à voir intuitivement comment une variable continue peut apporter une approximation fréquemment plus facile à manipuler que la variable discrète originale. Voir l'article Convergence en loi pour une formulation plus mathématique de ce type d'approximation de variables discrètes par des variables continues.
Densité de probabilité d'une variable continue

Une variable continue possède fréquemment une fonction de répartition continue en tout point et dérivable par morceaux. Il est alors commode de la dériver pour obtenir la densité de probabilité, vérifiant :

qui est définie ainsi qu'à valeurs positives (ou nulles) sur , telle que
.
On reconstruit la fonction de répartition par la relation :

Dans les raisonnements généraux, il est fréquemment commode d'écrire ces formules sous forme différentielle :

Si on effectue un changement de variable selon la formule , la nouvelle densité de probabilité se calcule par :

Fonction de probabilité et densité de probabilité d'une variable discrète
La loi d'une variable discrète est déterminée par la totalité des probabilités de ses valeurs appelé fonction de probabilité (mass function en anglais). Si on suppose qu'elle prend des valeurs entières (de signe quelconque), cela s'écrit :

On reconstruit la fonction de répartition (dont les valeurs sont alors nommées probabilités cumulées) par la relation :
si , alors
En considérant la fonction de répartition comme une somme d'échelons ou fonctions de Heaviside, sa dérivée peut s'interpréter comme une somme d'impulsions ou fonctions de Dirac. En posant , elle s'écrit :

Cette «densité de probabilité» présente un intérêt dans un problème spécifique. Quand une intégrale porte sur une densité de probabilité, la propriété principale de la fonction de Dirac sert à transformer l'intégrale en une simple somme impliquant la fonction de probabilité.
Espérance mathématique
Définitions
L'espérance mathématique d'une variable aléatoire réelle se définit comme la valeur de cette variable pondérée par sa probabilité. Pour une variable continue, la formule différentielle donnée auparavant s'intègre, sous réserve d'intégrabilité, en
![\mathbb{E}[X] = \int_{-\infty}ˆ{+\infty} x\ p_X(x)\ \textrm{d}x.](illustrations/a25705eebf6103e52601ed07a793e5f5.png)
Cette quantité est plus connue sous le nom de moyenne.
X étant une variable aléatoire réelle, une fonction f supposée régulière définit une nouvelle variable aléatoire notée f (X) dont l'espérance, quand elle existe, s'écrit en remplaçant x par f (x) dans la formule précédente (théorème de transfert).
![\mathbb{E}[f(X)] = \int_{-\infty}ˆ{+\infty} f(x)\ p_X(x)\ \textrm{d}x.](illustrations/ee89bc246b13fceb34553cb7ca62867b.png)
Pour une variable discrète, la «densité de probabilité» conduit, sous réserve de sommabilité, à
![\mathbb{E}[f(X)] = \sum_{k=-\infty}ˆ{+\infty} f(k)\ P_X(k).](illustrations/a1b5506408f3280ba827b4a5898497b1.png)
Fonction caractéristique
Si la densité de probabilité d'une variable aléatoire réelle X possède une transformée de Fourier, celle-ci (ou, plus exactement, la transformée inverse), fonction à valeurs complexes définie sur
![\phi_X(t) = \mathbb{E}[\textrm{e}ˆ{itX}]\,](illustrations/2517b0eb24225415468de75f614e8da9.png)
se nomme fonction caractéristique de la variable.
Fonction génératrice des moments
La fonction génératrice des moments d'une variable aléatoire est définie par
quand son espérance existe. Cette fonction, comme son nom l'indique, est utilisée pour générer les moments associés à la distribution de probabilités de la variable aléatoire . Elle permet en outre de déterminer l'additivité d'une loi.
Moments
Si la fonction caractéristique (ou la fonction génératrice) d'une variable aléatoire est développable en série, celle- fait apparaître les moments de celle-ci, le moment d'ordre k étant défini comme
![m_k \equiv \mathbb{E}[Xˆk] \,](illustrations/72f81c526a3fb354ab241cc93dc07cf9.png)
Dans le cas, important quasiment, d'une variable assez régulière, celle-ci peut par conséquent être caractérisée ensuite de ses moments, sa fonction caractéristique ou sa fonction génératrice, sa densité de probabilité ou, peut-être, sa fonction de probabilité ou par sa fonction de répartition.
Dans le cas général, seuls les premiers moments peuvent exister.
Outils pratiques
Moments et moments centrés
Le moment d'ordre un, espérance ou moyenne de la variable,
![\mu \equiv m_1= \mathbb{E}[X], \,](illustrations/fb1fbe6d11066aaada72be36a3ba42c3.png)
est un indicateur de tendance centrale,
Les moments d'ordre supérieur éliminent ce paramètre de position en considérant la variable centrée par soustraction de sa moyenne.
Le moment centré d'ordre deux,
![\sigmaˆ2\equiv m'_2 = \mathbb{E} \left [\left(X-\mu\right)ˆ2\right], \,](illustrations/b20cedcd6803631d85db864586f93347.png)
est un indicateur de dispersion nommé variance. Sa racine carrée σ, grandeur homogène à la grandeur de base, se nomme écart type. Quand la variable aléatoire est une valeur à un instant donné d'un processus aléatoire, l'expression moyenne quadratique est le plus souvent préférée.
Ces deux moments fournissent une partie importante de l'information sur la variable, la totalité si celle-ci peut être reconnue comme normale.
Les moments d'ordre supérieur, qui apportent pour les autres variables des précisions supplémentaires sur la forme de la distribution, portent sur la variable centrée réduite, rendue adimensionnelle par division par son écart type.
Le moment d'ordre trois de la variable centrée réduite,
![m'_3 =\mathbb{E} \left[ \left(\frac{X-\mu}{\sigma} \right)ˆ3 \right], \,](illustrations/74f024a4bb7d0c2dfc3c79f9ba9c6b7c.png)
est un indicateur d'asymétrie.
Le moment d'ordre quatre de la variable centrée réduite,
![m'_4 =\mathbb{E}\left[\left(\frac{X-\mu}{\sigma}\right)ˆ4\right], \,](illustrations/ca024f3e1c739b245dc221f703c15d4f.png)
est un indicateur d'aplatissement des extrêmes des distributions nommé kurtosis.
Médiane et quantiles
On nomme médiane d'une variable aléatoire X, un réel m tel que
Dans le cas d'une variable aléatoire discrète, cette définition est peu intéressante car elle permet l'existence de plusieurs médianes
- si X est le numéro apparaissant sur la face supérieure d'un dé à 6 faces idéalement équilibré, pour tout réel m strictement compris entre 3 et 4, on a :
ou bien l'existence d'une médiane qui ne donne pas une probabilité de 0, 5
- Si X est la somme obtenue en lançant deux dés à 6 faces idéalement équilibrés. X ne possède qu'une seule médiane 7 mais
Dans le cas d'une variable continue, si la fonction de répartition est strictement croissante, la définition est équivalente à la suivante :
- la médiane de X est le réel unique m tel que
Le fait que la fonction de répartition soit continue, et supposée strictement croissante, à valeurs dans ]0 ; 1[, assure l'existence et l'unicité de la médiane.
Si la médiane a comme valeur m=0.5, il est envisageable cependant de s'intéresser à d'autres valeurs de m (que on appelle les quantiles) :
- Quartile : m = 0, 25, 0, 75
- Décile : m = 0, 1, 0, 2, 0, 3...
- Centile : m = 0, 01, 0, 02...
Simulation d'une variable aléatoire
On utilise fréquemment des générateurs pseudo aléatoires pour simuler le hasard. Il existe aussi des moyens d'exploiter l'indétermination de phénomènes physiques, par exemple en analysant les variations d'un film de lampe à lave, en analysant le bruit thermique, ou mieux toujours, en demandant à la nature quantique de jeter des dés pour nous.
Voir aussi
- Convergence de variables aléatoires
- Loi de probabilité à plusieurs variables
- Générateur de nombres pseudo-aléatoires
- Générateur de nombres aléatoires
- Loi de probabilité
- Variables aléatoires élémentaires
Recherche sur Amazon (livres) : |
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 10/03/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.