Formule des probabilités totales

Dans cet arbre de probabilité, la probabilité de l'événement B s'obtient en sommant les probabilités des chemins conduisant à la réalisation de B.

En théorie des probabilités, la formule des probabilités totales est un théorème qui permet de calculer la probabilité d'un événement en le décomposant suivant un système exhaustif d'événements.

Énoncé

Formule des probabilités totales — On se donne un espace probabilisé ( Ω , A , P ) . {\displaystyle (\Omega ,{\mathcal {A}},\mathbb {P} ).} Si ( B i ) i I {\displaystyle (B_{i})_{\,i\in I}} est un système exhaustif (fini ou dénombrable) d'évènements, et si quel que soit i I , {\displaystyle i\in I,} P ( B i ) 0 , {\displaystyle \mathbb {P} (B_{i})\neq 0,} alors, pour tout évènement A , {\displaystyle A,}

P ( A ) = i I P ( A | B i ) P ( B i ) = i I P ( A B i ) . {\displaystyle \mathbb {P} (A)=\sum _{i\in I}\mathbb {P} (A|B_{i})\mathbb {P} (B_{i})=\sum _{i\in I}\mathbb {P} (A\cap B_{i}).}
Remarques :
  • Lorsque P ( B i ) = 0 , {\displaystyle \mathbb {P} (B_{i})=0,} définir P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} pose problème : P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} serait la probabilité conditionnelle de A {\displaystyle A} sachant un évènement qui ne se produit jamais, à savoir B i . {\displaystyle B_{i}.} La définition usuelle de P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} conduirait alors à diviser par 0 ... Une convention qui est rarement nocive consiste, lorsque P ( B i ) = 0 , {\displaystyle \mathbb {P} (B_{i})=0,} à attribuer à P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} une valeur arbitraire entre 0 et 1 : on n'a jamais besoin de pronostiquer la vraisemblance de l'évènement A {\displaystyle A} sachant B i , {\displaystyle B_{i},} puisque B i {\displaystyle B_{i}} ne se produit jamais, donc attribuer à P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} une valeur arbitraire ne provoquera aucune erreur. Par ailleurs, dans la formule des probabilités totales, attribuer à P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} une valeur arbitraire entre 0 et 1 n'a aucune importance, puisqu'on multiplie ensuite cette valeur par 0 = P ( B i ) . {\displaystyle 0=\mathbb {P} (B_{i}).} En résumé, avec cette convention, l'hypothèse P ( B i ) 0 {\displaystyle \mathbb {P} (B_{i})\neq 0} est superflue pour la formule des probabilités totales.
  • L'hypothèse selon laquelle ( B i ) i I {\displaystyle (B_{i})_{\,i\in I}} est un système exhaustif peut être affaiblie : i I B i = Ω {\displaystyle \cup _{\,i\in I}B_{i}=\Omega } peut être remplacée par i I B i A . {\displaystyle \cup _{\,i\in I}B_{i}\supset A.} Il est par contre essentiel que les B i {\displaystyle B_{i}} soient disjoints.

.

Une variante

Théorème — On se donne un espace probabilisé ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},\mathbb {P} )} et un évènement A. Si ( B i ) i I {\displaystyle (B_{i})_{\,i\in I}} est une partition (finie ou dénombrable) de l'évènement B,

P ( A | B ) = i I P ( A | B i ) P ( B i | B ) . {\displaystyle \mathbb {P} (A|B)=\sum _{i\in I}\mathbb {P} (A|B_{i})\mathbb {P} (B_{i}|B).}
Démonstration
P ( A B ) = i I P ( A B i ) = i I P ( A | B i ) P ( B i ) = i I P ( A | B i ) P ( B i | B ) P ( B ) , {\displaystyle {\begin{aligned}\mathbb {P} (A\cap B)&=\sum _{i\in I}\mathbb {P} (A\cap B_{i})\\&=\sum _{i\in I}\mathbb {P} (A|B_{i})\mathbb {P} (B_{i})\\&=\sum _{i\in I}\mathbb {P} (A|B_{i})\mathbb {P} (B_{i}|B)\mathbb {P} (B),\end{aligned}}}

car B i B = B i . {\displaystyle B_{i}\cap B=B_{i}.} CQFD

Corollaire — Si ( B i ) i I {\displaystyle (B_{i})_{\,i\in I}} est une partition (finie ou dénombrable) de l'évènement B, et si P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} ne dépend pas de i, alors la valeur commune des probabilités conditionnelles P ( A | B i ) {\displaystyle \mathbb {P} (A|B_{i})} est P ( A | B ) . {\displaystyle \mathbb {P} (A|B).}

Démonstration

Notons x la valeur commune des probabilités conditionnelles P ( A | B i ) . {\displaystyle \mathbb {P} (A|B_{i}).} Alors

P ( A | B ) = i I P ( A | B i ) P ( B i | B ) = x   i I P ( B i | B ) = x . {\displaystyle {\begin{aligned}\mathbb {P} (A|B)&=\sum _{i\in I}\mathbb {P} (A|B_{i})\mathbb {P} (B_{i}|B)\\&=x\ \sum _{i\in I}\mathbb {P} (B_{i}|B)\\&=x.\end{aligned}}}

CQFD

Ce corollaire permet de ramener le calcul de P ( A | B ) {\displaystyle \mathbb {P} (A|B)} au calcul des P ( A | B i ) , {\displaystyle \mathbb {P} (A|B_{i}),} parfois plus facile, car l'évènement Bi, étant plus petit que l'évènement B, fournit une information plus précise, et facilite ainsi le pronostic (pronostic = calcul de la probabilité conditionnelle). Le cas se présente souvent lorsqu'on étudie deux chaines de Markov dont l'une est image de l'autre. La démonstration de la propriété de Markov pour les processus de Galton-Watson est un exemple parmi beaucoup d'autres.

En particulier, le corollaire est fréquemment utilisé dans le cas où B=Ω, et permet alors de ramener le calcul de P ( A ) {\displaystyle \mathbb {P} (A)} au calcul des P ( A | B i ) . {\displaystyle \mathbb {P} (A|B_{i}).}

Voir aussi

  • icône décorative Portail des probabilités et de la statistique