Matrice delle covarianze

Niente fonti!
Questa voce o sezione sull'argomento statistica non cita le fonti necessarie o quelle presenti sono insufficienti.

In statistica multivariata e in probabilità, la matrice delle covarianze (o matrice di varianza e covarianza) si indica di solito con Σ {\displaystyle \Sigma } ed è una generalizzazione della covarianza al caso di dimensione maggiore di due. Essa è una matrice che rappresenta la variazione di ogni variabile rispetto alle altre (inclusa se stessa). È una matrice simmetrica.

Statistica

Sia data una popolazione di n {\displaystyle n} elementi su cui sono rilevati k {\displaystyle k} caratteri quantitativi X i {\displaystyle X_{i}} . Cioè ogni X i {\displaystyle X_{i}} con i = 1 , , k {\displaystyle i=1,\dots ,k} è un vettore di n {\displaystyle n} elementi, indicati con x h i {\displaystyle x_{hi}} con h = 1 , , n {\displaystyle h=1,\dots ,n} . L'elemento x h i {\displaystyle x_{hi}} rappresenta quindi la modalità dell' h {\displaystyle h} -esima unità statistica rispetto al carattere X i {\displaystyle X_{i}} . La matrice delle covarianze ha dimensione k × k {\displaystyle k\times k} e ogni elemento è definito come

σ i j 2 = 1 n h = 1 n ( x h i μ i ) ( x h j μ j ) , {\displaystyle \sigma _{ij}^{2}={\frac {1}{n}}\sum _{h=1}^{n}(x_{hi}-\mu _{i})(x_{hj}-\mu _{j}),}

dove μ i {\displaystyle \mu _{i}} indica la media del carattere X i {\displaystyle X_{i}} .

Significato dei valori

Ogni elemento sulla diagonale σ i i 2 {\displaystyle \sigma _{ii}^{2}} è la varianza del carattere X i {\displaystyle X_{i}} ed è quindi sempre un valore non negativo. Ogni elemento σ i j 2 {\displaystyle \sigma _{ij}^{2}} (con i j {\displaystyle i\neq j} ) è la covarianza tra i caratteri X i {\displaystyle X_{i}} e X j {\displaystyle X_{j}} . Nel caso in cui questo valore sia positivo, significa che al crescere di un carattere, cresce anche l'altro. Nel caso in cui questo valore sia negativo, accade il contrario. Se i caratteri sono statisticamente indipendenti, questo valore è 0 {\displaystyle 0} (l'implicazione inversa non è necessariamente verificata).

Applicazioni

Oltre al significato statistico che possiamo dedurre dai termini, la matrice delle covarianze è un parametro della funzione gaussiana, nella statistica multivariata.

Può inoltre essere d'ausilio alla riduzione delle features, tramite l'analisi delle componenti principali (PCA).

Bibliografia

  • Richard O. Duda, Peter E. Hart, David G. Stork, Wiley Interscience - Pattern Classification (2nd ed.)

Voci correlate

  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica