Analyse canonique des corrélations

Cet article est une ébauche concernant les mathématiques et les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

L'analyse canonique des corrélations[i 1], parfois aussi nommé analyse des corrélations canoniques, (canonical-correlation analysis en anglais) permet de comparer deux groupes de variables quantitatives appliqués tous deux sur les mêmes individus. Le but de l'analyse canonique est de comparer ces deux groupes de variables pour savoir s'ils décrivent un même phénomène, auquel cas on pourra se passer d'un des deux groupes de variables.

Un exemple parlant est celui des analyses médicales effectuées sur les mêmes échantillons par deux laboratoires différents[b 1]. L'analyse canonique généralise des méthodes aussi diverses que la régression linéaire multiple, l'analyse discriminante et l'analyse factorielle des correspondances[b 1].

Définition mathématique

Analyse Canonique des Correlations : matrices des corrélations sur les données nutrimouse du package CCA de R d'après l'article d'Ignacio et al. dans « Journal of Statistical Software (volume 23, issue 12, January 2008) »[i 2]

Soient deux vecteurs colonnes X et Y de dimensions respectives n et m : X = ( x 1 , , x n ) T {\displaystyle X=(x_{1},\dots ,x_{n})^{\mathrm {T} }} et Y = ( y 1 , , y m ) T {\displaystyle Y=(y_{1},\dots ,y_{m})^{\mathrm {T} }} de variables aléatoires ayant un moment d'ordre deux fini. On peut définir la covariance croisée Σ X Y = cov ( X , Y ) {\displaystyle \Sigma _{XY}=\operatorname {cov} (X,Y)} comme la matrice de taille n × m dont l'élément (i,j) est la covariance de xi et yj. En pratique, cette covariance est souvent estimée à partir d'un échantillon de X et Y, c'est-à-dire d'après deux matrices dont chaque colonne est une réalisation de X et Y.

L'analyse canonique des corrélations recherche deux vecteurs a et b de dimensions respectives n et m qui maximisent la corrélation entre les produits scalaires (a·X) et (b·Y). En d'autres termes :

( a , b ) = argmax ( a , b ) corr ( a T X , b T Y ) {\displaystyle (a^{*},b^{*})={\underset {(a,b)}{\operatorname {argmax} }}\operatorname {corr} (a^{\mathrm {T} }X,b^{\mathrm {T} }Y)}

Les variables aléatoires U = a·X et V = b·Y sont la première paire de variables canoniques. On peut alors répéter la procédure pour obtenir une seconde paire de variables non corrélée à la première.

Analyse Canonique des Correlations : représentation des variables et des individus dans le plan des deux premières variables canoniques sur les données nutrimouse du package CCA de R d'après l'article d'Ignacio et al. dans « Journal of Statistical Software (volume 23, issue 12, January 2008) »[i 2]
Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Notes et références

Notes

Références

Ouvrages spécialisés

  1. a et b Saporta 2006, p. 189-190


Articles publiés sur internet

  1. [PDF]Frédéric Bertran, « Analyse canonique », (consulté le )
  2. a et b [PDF](en) Ignacio Gonzalez, Sébastien Déjean, Pascal G. P. Martin, Alain Baccini, « « CCA: An R Package to Extend Canonical Correlation Analysis » », (consulté le )

Voir aussi

Bibliographie

  • (fr) Gilbert Saporta, Probabilités, Analyse des données et Statistiques, Paris, Editions Technip, , 622 p. (ISBN 978-2-7108-0814-5, lire en ligne).Document utilisé pour la rédaction de l’article

Articles connexes

Liens externes


v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
  • icône décorative Portail des probabilités et de la statistique
  • icône décorative Portail de l’informatique