Covariantiematrix

Een covariantiematrix is in de kansrekening en statistiek een matrix met als elementen de paarsgewijze covarianties van een m {\displaystyle m} -tal toevalsvariabelen of hun schattingen.

Populatie

Betreft het de populatie, en worden de m {\displaystyle m} toevalsvariabelen X 1 , X 2 , , X m {\displaystyle X_{1},X_{2},\ldots ,X_{m}} voorgesteld door de vector X {\displaystyle X} , dan is de covariantiematrix:

c o v ( X ) = ( c o v ( X r , X k ) ) = E ( ( X E X ) ( X E X ) T ) {\displaystyle \mathrm {cov} (X)=(\mathrm {cov} (X_{r},X_{k}))=\mathrm {E} ((X-\mathrm {E} X)(X-\mathrm {E} X)^{T})} ,

dus een m × m {\displaystyle m\times m} -matrix c o v ( X ) {\displaystyle \mathrm {cov} (X)} met als r k {\displaystyle rk} -e element:

( c o v ( X ) ) r k = c o v ( X r , X k ) {\displaystyle (\mathrm {cov} (X))_{rk}=\mathrm {cov} (X_{r},X_{k})}

Steekproef

Gaat het om een steekproef van omvang n {\displaystyle n} uit de populatie van de m {\displaystyle m} toevalsvariabelen X 1 , X 2 , , X m {\displaystyle X_{1},X_{2},\ldots ,X_{m}} , dan wordt als schatter van de bovengenoemde covariantiematrix c o v ( X ) {\displaystyle \mathrm {cov} (X)} vaak de (steekproef)covariantiematrix C {\displaystyle C} berekend, bepaald door de schattingen van de elementen van c o v ( X ) {\displaystyle \mathrm {cov} (X)} , dus:

C r k = 1 n 1 i ( x r i x r ) ( x k i x k ) , {\displaystyle C_{rk}={\tfrac {1}{n-1}}\sum _{i}(x_{ri}-x_{r\,\cdot })(x_{ki}-x_{k\,\cdot }),}

waarin een stip als index aangeeft dat over de betrokken index gemiddeld is.

Eigenschappen

  • Een (reële) covariantiematrix is symmetrisch en positief semi-definiet.
  • Op de hoofddiagonaal van de covariantiematrix staan de varianties van de afzonderlijke toevalsvariabelen.
  • Voor een m × m {\displaystyle m\times m} -matrix A {\displaystyle A} geldt: c o v ( A X ) = A   c o v ( X ) A T {\displaystyle \mathrm {cov} (AX)=A\ \mathrm {cov} (X)A^{T}} .
  • Voor verschuiving over een vector b {\displaystyle b} geldt: c o v ( X + b ) = c o v ( X ) {\displaystyle \mathrm {cov} (X+b)=\mathrm {cov} (X)} .
  • Als X {\displaystyle X} en Y {\displaystyle Y} ongecorreleerde vectoren van toevalsvariabelen zijn, geldt: c o v ( X + Y ) = c o v ( X ) + c o v ( Y ) {\displaystyle \mathrm {cov} (X+Y)=\mathrm {cov} (X)+\mathrm {cov} (Y)} .

Zie ook

  • Simultane verdeling
  • Multivariate normale verdeling