Matrice autoadjointe positive

En mathématiques, plus précisément en algèbre linéaire, une matrice réelle symétrique (ou : réelle autoadjointe) est dite positive[1] ou semi-définie positive si la forme bilinéaire symétrique associée est positive. Plus généralement, une matrice carrée complexe est dite positive si la forme sesquilinéaire associée est (hermitienne) positive, la matrice étant alors nécessairement autoadjointe.

Cas réel

Définitions

On dit qu'une matrice réelle symétrique M d'ordre n est positive (ou semi-définie positive) si elle vérifie l'une des propriétés équivalentes suivantes :

  1. M est un élément positif (en) de la C*-algèbre réelle Mn,n(ℝ), c'est-à-dire que son spectre est inclus dans ℝ+.
  2. La forme bilinéaire symétrique associée à M est positive : pour toute matrice colonne x à n éléments réels, xTMx ≥ 0 (où xT désigne la matrice transposée de x).
  3. Les valeurs propres de M (qui sont nécessairement réelles) sont positives ou nulles.
  4. Il existe une matrice réelle N telle que M = NTN.
  5. Tous les mineurs principaux[2] de M sont positifs ou nuls : pour toute partie non vide I de {1, … , n}, le déterminant de la sous-matrice MI,I de M (formée de ses éléments avec indices de lignes et de colonnes dans I) est positif ou nul.

Elle est dite définie positive si de plus elle est inversible.

Preuve des équivalences

1. et 3. sont clairement équivalents.

La propriété 2. signifie que M définit sur ℝn une forme quadratique positive, la propriété 3. que sur ℝn, vu comme espace euclidien avec le produit scalaire x , y = i = 1 n x i y i {\displaystyle \langle x,y\rangle =\sum _{i=1}^{n}{x_{i}y_{i}}} , M définit un endomorphisme autoadjoint positif. L'équivalence entre 2. et 3. vient de cette double interprétation, à la lumière de la réduction de Gauss et du théorème spectral. Puisque toute matrice symétrique réelle est diagonalisable (cf. Décomposition spectrale), il existe une matrice orthogonale P (dont les colonnes sont des vecteurs propres de M) et une matrice diagonale D (dont les coefficients diagonaux sont les valeurs propres de M) telles que M = PDPT.

Si 2. est vraie, sachant que les valeurs propres d'une matrice symétrique réelle sont réelles, on voit en appliquant 2. aux vecteurs propres que 3. est vraie.

Puisque P−1 = PT, la matrice M est aussi congrue à la matrice diagonale D. Donc réciproquement, si 3. est vraie alors 2. est vraie.

Si 4. est vraie (M = NTN), alors x R n , x T M x = ( N x ) T ( N x ) = N x 2 0 {\displaystyle \forall x\in \mathbb {R} ^{n},x^{\mathsf {T}}Mx=\left(Nx\right)^{\mathsf {T}}\left(Nx\right)=\|Nx\|^{2}\geqslant 0} , donc 2. est vraie.

Inversement, si 2. (donc 3.) est vraie, on peut en déduire une matrice réelle N telle que M = NTN (la matrice N n'est pas unique ; elle l'est si l'on impose qu'elle soit elle-même positive, cf. § « Propriétés » ci-dessous) : il suffit de définir la matrice Δ comme étant la matrice diagonale dont les termes diagonaux sont les racines carrées de ceux de D, et de poser N = ΔPT, car alors NTN = M. Si l'on veut une matrice symétrique positive, il suffit de poser plutôt N = PΔPT.

Si 4. (ou 2., ou 3.) est vraie pour M alors 4. est aussi vraie pour les sous-matrices mineures principales de M, donc 5. est vraie.

Réciproquement[3], supposons 5. vraie et démontrons 2.. Pour tout p de 1 à n, tous les mineurs principaux de la p-ième sous-matrice principale dominante Mp sont, par hypothèse, positifs ou nuls donc (d'après l'expression du polynôme caractéristique en fonction de ceux-ci) det(εIp + Mp) > 0 pour tout ε > 0. D'après le critère de Sylvester, εIn + M est donc (définie) positive, si bien qu'elle vérifie 2. On en déduit que M aussi, en faisant tendre ε vers 0.

Dans la suite de cet article, nous noterons S n {\displaystyle {\mathcal {S}}_{n}} l'ensemble des matrices carrées d'ordre n {\displaystyle n} symétriques à coefficients réels et S n + {\displaystyle {\mathcal {S}}_{n}^{+}} la partie de S n {\displaystyle {\mathcal {S}}_{n}} formée des matrices positives.

Exemples

  • Soit f {\displaystyle f} une fonction réelle de n {\displaystyle n} variables réelles, définie sur un ouvert de R n {\displaystyle \mathbb {R} ^{n}} , dérivable dans un voisinage d'un point x {\displaystyle x} de cet ouvert et deux fois dérivable en ce point. Si f {\displaystyle f} atteint un minimum local en x {\displaystyle x} , sa matrice hessienne y est positive[4] (condition nécessaire d'optimalité du second ordre sans contrainte).
  • Étant donné un vecteur aléatoire ( T 1 , , T n ) {\displaystyle (T_{1},\dots ,T_{n})} à valeurs dans R n {\displaystyle \mathbb {R} ^{n}} dont chaque composante admet une variance, on définit sa matrice de covariance par Γ = ( c o v ( T i , T j ) ) S n . {\displaystyle \Gamma ={\Big (}\mathrm {cov} (T_{i},T_{j}){\Big )}\in {\mathcal {S}}_{n}.} Celle-ci est positive. En effet, pour toute matrice colonne x {\displaystyle x} à n {\displaystyle n} éléments réels notés x 1 , , x n {\displaystyle x_{1},\dots ,x_{n}}  : x T Γ x = V a r ( x 1 T 1 + + x n T n ) 0. {\displaystyle x^{\mathsf {T}}\Gamma x=\mathrm {Var} (x_{1}\,T_{1}+\cdots +x_{n}\,T_{n})\geqslant 0.} [réf. souhaitée]
  • Elle est définie positive si et seulement si la seule combinaison linéaire de T 1 , , T n {\displaystyle T_{1},\dots ,T_{n}} qui soit certaine est celle dont tous les coefficients sont nuls.
  • Toute matrice de Gram est autoadjointe positive.
  • Soit A {\displaystyle A} une matrice réelle symétrique dont les termes diagonaux sont positifs et B {\displaystyle B} définie par B i j = A i j A i i A j j . {\displaystyle B_{ij}={\frac {A_{ij}}{\sqrt {A_{ii}A_{jj}}}}.} Alors A {\displaystyle A} est semi-définie positive si et seulement si B {\displaystyle B} l'est. On pense en particulier à la corrélation.
  • Réduire certains termes extra-diagonaux d’une matrice définie positive est une opération qui ne préserve pas nécessairement la positivité (bien que les rayons des disques de Gerschgorin diminuent). Dans le contre-exemple ci-dessous, A {\displaystyle A} est définie positive alors que B {\displaystyle B} ne l'est pas : A = ( 10 9 7 9 10 9 7 9 10 ) , B = ( 10 8 2 8 10 8 2 8 10 ) . {\displaystyle A={\begin{pmatrix}10&9&7\\9&10&9\\7&9&10\\\end{pmatrix}},B={\begin{pmatrix}10&8&2\\8&10&8\\2&8&10\\\end{pmatrix}}.}

Propriétés

  • Toute matrice réelle symétrique positive admet une unique racine carrée réelle symétrique positive. Plus formellement : M S n + N S n + N 2 = M . {\displaystyle \forall M\in {\mathcal {S}}_{n}^{+}\quad \exists N\in {\mathcal {S}}_{n}^{+}\quad N^{2}=M.} Ce résultat (dont la partie « existence » est démontrée au passage au § « Définitions » ci-dessus[5]) se généralise aux racines n-ièmes.
  • Si deux matrices réelles symétriques M et N sont positives et commutent, alors MN est symétrique positive.
  • Par la caractérisation 2. du § « Définitions », S n + {\displaystyle {\mathcal {S}}_{n}^{+}} est une intersection de demi-espaces (en nombre infini). Par la caractérisation 5., S n + {\displaystyle {\mathcal {S}}_{n}^{+}} est un ensemble semi-algébrique (en) de base (c.-à-d. caractérisé par un nombre fini d'inégalités polynomiales).
  • Les caractérisations du § « Définitions » montrent que S n + {\displaystyle {\mathcal {S}}_{n}^{+}} est un cône convexe fermé non vide de S n {\displaystyle {\mathcal {S}}_{n}} .
  • Dans l'espace euclidien S n {\displaystyle {\mathcal {S}}_{n}} (muni du produit scalaire usuel : A , B := tr ( A B ) {\displaystyle \langle A,B\rangle :=\operatorname {tr} (AB)} tr {\displaystyle \operatorname {tr} } désigne la trace), les cônes normal et tangent à S n + {\displaystyle {\mathcal {S}}_{n}^{+}} en A S n + {\displaystyle A\in {\mathcal {S}}_{n}^{+}} s'écrivent
    N S n + ( A ) = ( S n + ) ( A ) et T S n + ( A ) = { D S n v ker A v D v 0 } . {\displaystyle \operatorname {N} _{{\mathcal {S}}_{n}^{+}}{(A)}=(-{\mathcal {S}}_{n}^{+})\cap (A^{\bot })\quad {\text{et}}\quad \operatorname {T} _{{\mathcal {S}}_{n}^{+}}{(A)}=\{D\in {\mathcal {S}}_{n}\mid \forall v\in \ker A\;\;v^{\!\top \!}Dv\geqslant 0\}.}

Cas complexe

On étend les propriétés et définitions précédentes aux matrices complexes.

Soit M une matrice carrée d'ordre n. Elle est dite positive si elle vérifie l'une des propriétés équivalentes suivantes :

  1. M est un élément positif de la C*-algèbre complexe Mn,n(ℂ).
  2. M est autoadjointe (ou : hermitienne) et toutes ses valeurs propres sont positives ou nulles.
  3. La forme sesquilinéaire associée à M est (hermitienne) positive : pour toute matrice colonne z à n éléments complexes, z*Mz est un réel positif (où z* désigne la matrice adjointe de z).
  4. Il existe une matrice complexe N telle que M = N*N.

Elle est dite définie positive si elle est de plus inversible.

Remarques
  • La matrice n'est pas supposée autoadjointe a priori : cette propriété est une conséquence de chacune des caractérisations, en particulier — contrairement au cas réel — de la positivité de la forme associée.
  • Sur l'espace des matrices hermitiennes d'ordre n, l'ordre partiel associé au cône convexe des matrices positives est appelé l'ordre de Lowner (en) (nommé d'après Charles Loewner).

Toute matrice (hermitienne) positive admet une unique racine carrée (hermitienne) positive[5].

Notes et références

  • Cet article est partiellement ou en totalité issu de l'article intitulé « Matrice positive » (voir la liste des auteurs).
  1. Jean-Pierre Ramis, André Warusfel et al., Mathématiques Tout-en-un pour la Licence 2 : cours complet, exemples et exercices corrigés, Dunod, (lire en ligne), p. 134.
  2. La positivité des mineurs principaux dominants ne suffit pas, comme en témoigne la matrice ( 0 0 0 1 ) {\displaystyle {\begin{pmatrix}0&0\\0&-1\end{pmatrix}}} .
  3. (en) Roger A. Horn et Charles R. Johnson, Matrix Analysis, Cambridge University Press, , 2e éd. (1re éd. 1985) (lire en ligne), p. 439, démontrent que 5. ⇒ 3.
  4. L'exemple des fonctions constantes montre qu'elle n'est pas nécessairement définie positive
  5. a et b Pour une preuve complète, voir le § « Matrice positive » de l'article sur les racines carrées d'une matrice.

Article connexe

Matrice à diagonale dominante

v · m
Matrices
Forme
Transformée
Relation
Propriété
Famille
Associée
Résultats
Décompositions
Articles liés
  • icône décorative Portail des mathématiques