Binomiale verdeling

Binomiale verdeling
Kansfunctie
Verdelingsfunctie
Parameters n 0 {\displaystyle n\geq 0} aantal pogingen (geheel)
0 p 1 {\displaystyle 0\leq p\leq 1} kans op succes (reëel)
Drager k { 0 , , n } {\displaystyle k\in \{0,\dots ,n\}}
Kansfunctie ( n k ) p k ( 1 p ) n k {\displaystyle {\tbinom {n}{k}}p^{k}(1-p)^{n-k}}
Verdelingsfunctie I 1 p ( n k , 1 + k ) {\displaystyle I_{1-p}(n-\lfloor k\rfloor ,1+\lfloor k\rfloor )}
met I {\displaystyle I} de onvolledige bètafunctie.
Verwachtingswaarde n p {\displaystyle n\,p}
Mediaan een uit { n p 1 , n p , n p + 1 } {\displaystyle \{\lfloor n\,p\rfloor -1,\lfloor n\,p\rfloor ,\lfloor n\,p\rfloor +1\}}
Modus ( n + 1 ) p {\displaystyle \lfloor (n+1)\,p\rfloor }
Variantie n p ( 1 p ) {\displaystyle n\,p\,(1-p)}
Scheefheid 1 2 p n p ( 1 p ) {\displaystyle {\frac {1-2\,p}{\sqrt {n\,p\,(1-p)}}}}
Kurtosis 1 6 p ( 1 p ) n p ( 1 p ) {\displaystyle {\frac {1-6\,p\,(1-p)}{n\,p\,(1-p)}}}
Moment-
genererende functie
( 1 p + p e t ) n {\displaystyle (1-p+p\,e^{t})^{n}}
Karakteristieke functie ( 1 p + p e i t ) n {\displaystyle (1-p+p\,e^{i\,t})^{n}}
Portaal  Portaalicoon   Wiskunde

In de kansrekening en de statistiek is de binomiale verdeling een discrete kansverdeling die de verdeling is van het aantal successen X {\displaystyle X} in een reeks van n {\displaystyle n} onafhankelijke alternatieven alle met succeskans p {\displaystyle p} . Zo'n experiment wordt ook wel een bernoulli-experiment genoemd.

In het geval n = 1 {\displaystyle n=1} , komt de binomiale verdeling overeen met de bernoulli-verdeling.

Definitie

In een reeks van n {\displaystyle n} bernoulli-experimenten kunnen 0 , 1 , , n {\displaystyle 0,1,\ldots ,n} successen voorkomen. Het aantal successen is een stochastische variabele X {\displaystyle X} . Als p {\displaystyle p} de kans op succes is, zegt men dat X {\displaystyle X} binomiaal verdeeld is met parameters n {\displaystyle n} en succeskans p {\displaystyle p} , en noteert:

X B ( n , p ) {\displaystyle X\sim B(n,p)} ,

of ook

X B i n ( n , p ) {\displaystyle X\sim \mathrm {Bin} (n,p)}

De kans op precies k {\displaystyle k} successen kan gemakkelijk berekend worden door te bedenken dat elke reeks uitkomsten met k {\displaystyle k} successen en n k {\displaystyle n-k} mislukkingen dezelfde kans p k ( 1 p ) n k {\displaystyle p^{k}(1-p)^{n-k}} heeft. Omdat er ( n k ) {\displaystyle {\tbinom {n}{k}}} (zie binomiaalcoëfficiënt) verschillende reeksen zijn met precies k {\displaystyle k} successen, wordt de kansfunctie voor k = 0 , 1 , , n {\displaystyle k=0,1,\ldots ,n} gegeven door:

f ( k ; n , p ) = P ( X = k ) = ( n k ) p k ( 1 p ) n k {\displaystyle f(k;n,p)=P(X=k)={\tbinom {n}{k}}p^{k}(1-p)^{n-k}}

Voorbeeld

We gooien 4 keer met een (eerlijke) dobbelsteen. We kunnen 0, 1, 2, 3 of 4 keer een 6 gooien. Het aantal keren dat we 6 gooien, X {\displaystyle X} , is B ( 4 , 1 / 6 ) {\displaystyle B(4,1/6)} -verdeeld. Hoe groot is de kans dat we van de 4 worpen 1 keer een 6 gooien? Hier is n = 4 ,   p = 1 / 6 {\displaystyle n=4,\ p=1/6} en k = 1 {\displaystyle k=1} , dus:

P ( X = 1 ) = f ( 1 ; 4 , 1 6 ) = ( 4 1 ) ( 1 6 ) 1 ( 1 1 6 ) 3 = 4 × 1 6 × 125 216 = 0,386 {\displaystyle P(X=1)=f(1;4,{\tfrac {1}{6}})={\tbinom {4}{1}}({\tfrac {1}{6}})^{1}(1-{\tfrac {1}{6}})^{3}=4\times {\tfrac {1}{6}}\times {\tfrac {125}{216}}=0{,}386}

Momenten

De verwachtingswaarde en de variantie van een B ( n , p ) {\displaystyle B(n,p)} -verdeelde stochastische variabele X {\displaystyle X} laten zich het eenvoudigst bepalen door X {\displaystyle X} te schrijven als de som van n {\displaystyle n} onafhankelijke, B ( 1 , p ) {\displaystyle B(1,p)} -verdeelde variabelen: X = X 1 + + X n {\displaystyle X=X_{1}+\ldots +X_{n}} . Dan volgt:

E X = E ( X 1 + + X n ) = n E ( X 1 ) = n p {\displaystyle EX=E(X_{1}+\ldots +X_{n})=nE(X_{1})=np}

en

var ( X ) = var ( X 1 + + X n ) = n var ( X 1 ) = n p ( 1 p ) {\displaystyle \operatorname {var} (X)=\operatorname {var} (X_{1}+\ldots +X_{n})=n\,\operatorname {var} (X_{1})=np(1-p)} .

De bovenstaande relaties kunnen ook afgeleid worden met behulp van berekeningen soortgelijk aan de volgende:

E X ( X 1 ) ( X 2 ) = k = 0 n k ( k 1 ) ( k 2 ) n ! k ! ( n k ) ! p k ( 1 p ) n k {\displaystyle EX(X-1)(X-2)=\sum _{k=0}^{n}k(k-1)(k-2){\frac {n!}{k!(n-k)!}}p^{k}(1-p)^{n-k}}
= n ( n 1 ) ( n 2 ) p 3 k = 3 n ( n 3 ) ! ( k 3 ) ! ( n k ) ! p k 3 ( 1 p ) n k = n ( n 1 ) ( n 2 ) p 3 {\displaystyle =n(n-1)(n-2)p^{3}\sum _{k=3}^{n}{\frac {(n-3)!}{(k-3)!(n-k)!}}p^{k-3}(1-p)^{n-k}=n(n-1)(n-2)p^{3}} .

Uit deze betrekking kan het derde moment E X 3 {\displaystyle EX^{3}} bepaald worden, en daarmee de scheefheid van de verdeling.

Ook volgt daaruit direct:

E X = k = 0 n k n ! k ! ( n k ) ! p k ( 1 p ) n k = n p {\displaystyle EX=\sum _{k=0}^{n}k{\frac {n!}{k!(n-k)!}}p^{k}(1-p)^{n-k}=np}

en

E X ( X 1 ) = k = 0 n k ( k 1 ) n ! k ! ( n k ) ! p k ( 1 p ) n k = n ( n 1 ) p 2 {\displaystyle EX(X-1)=\sum _{k=0}^{n}k(k-1){\frac {n!}{k!(n-k)!}}p^{k}(1-p)^{n-k}=n(n-1)p^{2}} .

Uit deze laatste relatie volgt weer:

E X 2 = n ( n 1 ) p 2 + n p {\displaystyle EX^{2}=n(n-1)p^{2}+np} ,

zodat

var ( X ) = E X 2 ( E X ) 2 = n ( n 1 ) p 2 + n p n 2 p 2 = n p ( 1 p ) {\displaystyle \operatorname {var} (X)=EX^{2}-(EX)^{2}=n(n-1)p^{2}+np-n^{2}p^{2}=np(1-p)} .

Benadering

Het is nogal bewerkelijk of bijna ondoenlijk om voor grote waarden van het aantal experimenten n {\displaystyle n} de exacte kansen te berekenen. Dit is ook niet nodig omdat de binomiale verdeling voor grote n {\displaystyle n} benaderd kan worden door een normale verdeling of door een Poissonverdeling.

Als vuistregel neemt men wel dat de B ( n , p ) {\displaystyle B(n,p)} -verdeling voor n > 25 {\displaystyle n>25} goed benaderd kan worden door een geschikte normale verdeling, mits de succeskans p {\displaystyle p} niet te klein of te groot is. Als vuistregel geldt: n p > 5 {\displaystyle np>5} en n ( 1 p ) > 5 {\displaystyle n(1-p)>5} . Voor kleinere en grotere waarden van p {\displaystyle p} is de binomiale verdeling te scheef om door de symmetrische normale verdeling goed benaderd te worden. Een benadering door een geschikte Poissonverdeling is dan mogelijk.

Normale benadering

De stochastische variabele X {\displaystyle X} is B ( n , p ) {\displaystyle B(n,p)} -verdeeld. Voor toenemende n {\displaystyle n} nadert de verdeling van X {\displaystyle X} naar een normale verdeling, dus met verwachtingswaarde E X = n p {\displaystyle EX=np} en variantie v a r ( X ) = n p ( 1 p ) {\displaystyle \mathrm {var} (X)=np(1-p)} . Er geldt dus:

P ( X k ) P ( Y k ) = P ( Z k n p n p ( 1 p ) ) {\displaystyle P(X\leq k)\approx P(Y\leq k)=P\left(Z\leq {\frac {k-np}{\sqrt {np(1-p)}}}\right)} .

Daarin is Y   N ( n p , n p ( 1 p ) ) {\displaystyle Y\ N(np,np(1-p))} -verdeeld en Z {\displaystyle Z} standaardnormaal verdeeld.

Omdat de binomiale verdeling een discrete verdeling is, geldt

P ( X k ) = P ( X < k + 1 ) P ( Y k + 1 ) {\displaystyle P(X\leq k)=P(X<k+1)\approx P(Y\leq k+1)} ,

hetgeen leidt tot twee (en meer) mogelijke benaderingen, die voor niet al te grote waarden van n {\displaystyle n} nogal verschillen. Om dit probleem te ondervangen past men wel de zogenaamde continuïteitscorrectie toe, en neemt als betere benadering een waarde tussen de genoemde uitersten, en wel:

P ( X k ) = P ( X < k + 1 ) P ( Y k + 1 2 ) = P ( Z k + 1 2 n p n p ( 1 p ) ) {\displaystyle P(X\leq k)=P(X<k+1)\approx P(Y\leq k+{\begin{matrix}{\frac {1}{2}}\end{matrix}})=P\left(Z\leq {\frac {k+{\begin{matrix}{\frac {1}{2}}\end{matrix}}-np}{\sqrt {np(1-p)}}}\right)} .

Voorbeeld

Hoe groot is de kans om in 25 worpen met een zuivere munt ten hoogste 10 keer kruis te gooien? Noem X {\displaystyle X} het aantal keren kruis; X {\displaystyle X} is dus B ( 25 , 1 2 ) {\displaystyle B(25,{\tfrac {1}{2}})} -verdeeld is. De gevraagde kans is:

P ( X 10 ) = 0,212 2 {\displaystyle P(X\leq 10)=0{,}2122} .

Omdat E X = n p = 12 , 5 {\displaystyle EX=np=12{,}5} en v a r ( X ) = n p ( 1 p ) = 6 , 25 {\displaystyle \mathrm {var} (X)=np(1-p)=6{,}25} , kan deze kans benaderd worden met behulp van een N ( 12 , 5 ; 6 , 25 ) {\displaystyle N(12{,}5;6{,}25)} -verdeling.

P ( X 10 ) P ( Y 10 ) = P ( Z 10 12 , 5 6 , 25 ) = P ( Z < 1 ) = 0,158 7 {\displaystyle P(X\leq 10)\approx P(Y\leq 10)=P\left(Z\leq {\frac {10-12{,}5}{\sqrt {6{,}25}}}\right)=P(Z<-1)=0{,}1587} .

Men kan ook berekenen:

P ( X < 11 ) P ( Y < 11 ) = P ( Z 11 12 , 5 6 , 25 ) = P ( Z < 0 , 6 ) = 0,274 3 {\displaystyle P(X<11)\approx P(Y<11)=P\left(Z\leq {\frac {11-12{,}5}{\sqrt {6{,}25}}}\right)=P(Z<-0{,}6)=0{,}2743} .

Dat zijn twee benaderingen die nogal uiteenlopen, maar waar de werkelijke waarde wel tussen ligt. Met de continuïteitscorrectie wordt de benadering:

P ( X 10 ) P ( Y 10 , 5 ) = P ( Z 10 , 5 12 , 5 6 , 25 ) = P ( Z < 0 , 8 ) = 0,211 9 {\displaystyle P(X\leq 10)\approx P(Y\leq 10{,}5)=P\left(Z\leq {\frac {10{,}5-12{,}5}{\sqrt {6{,}25}}}\right)=P(Z<-0{,}8)=0{,}2119} .

Poissonbenadering

Omdat de B ( n , p ) {\displaystyle B(n,p)} -verdeling voor toenemende n {\displaystyle n} en constante waarde van n p = μ {\displaystyle np=\mu } nadert naar de Poissonverdeling met parameter μ {\displaystyle \mu } , kan de B ( n , p ) {\displaystyle B(n,p)} -verdeling voor grote waarden van n {\displaystyle n} en waarden van p {\displaystyle p} in de buurt van 0 benaderd worden door een geschikte Poissonverdeling. In dat geval geldt dus: X B ( n , p ) {\displaystyle X\sim B(n,p)} :

P ( X k ) P ( Y k ) {\displaystyle P(X\leq k)\approx P(Y\leq k)} .

Daarin is Y {\displaystyle Y} Poissonverdeeld met parameter n p {\displaystyle np} .

Ook voor waarden van p {\displaystyle p} in de buurt van 1 kan deze benadering gebruikt worden, zij het dat men niet de verdeling van X {\displaystyle X} benadert, maar de verdeling van n X {\displaystyle n-X} , die B ( n , 1 p ) {\displaystyle B(n,1-p)} -verdeeld is, dus met een kleine waarde van B p {\displaystyle Bp} .

Voorbeeld

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen ten hoogste 2 keer 6 te gooien? Noem X {\displaystyle X} het aantal keren 6. Dus X {\displaystyle X} is B ( 25 , 1 / 6 ) {\displaystyle B(25,1/6)} -verdeeld. De gevraagde kans is:

P ( X 2 ) = 0,188 7 {\displaystyle P(X\leq 2)=0{,}1887} .

Omdat E X = n p = 25 / 6 {\displaystyle EX=np=25/6} kan we deze kans benaderd worden met behulp van een Poissonverdeling met parameter 25/6.

P ( X 2 ) P ( Y 2 ) = 0,214 7 {\displaystyle P(X\leq 2)\approx P(Y\leq 2)=0{,}2147} .

Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen minstens 20 keer geen 6 te gooien? Noem X {\displaystyle X} het aantal keren dat geen 6 gegooid wordt. X {\displaystyle X} is dus B ( 25 , 5 / 6 ) {\displaystyle B(25,5/6)} -verdeeld. De gevraagde kans is:

P ( X 20 ) = 0,772 0 {\displaystyle P(X\geq 20)=0{,}7720} .

Nu is p {\displaystyle p} tamelijk groot, maar de vraag kan ook geformuleerd worden als de kans op ten hoogste 5 keer 6.

P ( X 20 ) = P ( 25 X 5 ) {\displaystyle P(X\geq 20)=P(25-X\leq 5)} .

En 25 X {\displaystyle 25-X} is weer B ( 25 , 1 / 6 ) {\displaystyle B(25,1/6)} -verdeeld, dus:

P ( X 20 ) = P ( 25 X 5 ) P ( Y 5 ) = 0,758 6 {\displaystyle P(X\geq 20)=P(25-X\leq 5)\approx P(Y\leq 5)=0{,}7586} .

Zie ook

· · Sjabloon bewerken
Kansverdelingen
Discrete verdelingen:Bernoulli · binomiaal · geometrisch · hypergeometrisch · negatief-binomiaal · Poisson · uniform · zèta
Continue verdelingen:bèta · Cauchy · chi-kwadraat · Erlang · exponentieel · F-verdeling · gamma · Gumbel · hyperexponentieel · logistisch · lognormaal · normaal · Pareto · Rayleigh · student (t-) · uniform · Weibull
Meerdimensionale verdelingen:multinomiaal · multivariaat normaal
Mediabestanden
Zie de categorie Binomial distributions van Wikimedia Commons voor mediabestanden over dit onderwerp.