Cône dual

Un ensemble C {\displaystyle C} du plan euclidien et son cône dual C {\displaystyle C^{*}} .

En mathématiques, et plus précisément en analyse convexe, le cône dual d'une partie P {\displaystyle P} d'un espace euclidien E {\displaystyle E} est l'ensemble des vecteurs de E {\displaystyle E} qui font un angle plus petit que π / 2 {\displaystyle \pi /2} avec les vecteurs de P {\displaystyle P} . C'est un cône convexe fermé non vide.

On définit plus généralement, pour une partie P {\displaystyle P} d'un espace vectoriel réel E {\displaystyle E} , le cône dual (algébrique) de P {\displaystyle P} , qui est un cône de l'espace dual E {\displaystyle E^{*}} et, si E {\displaystyle E} est un espace vectoriel topologique, le cône dual topologique de P {\displaystyle P} , qui est un cône du dual topologique E {\displaystyle E'} .

Définitions

Soit P {\displaystyle P} une partie non vide d'un espace vectoriel réel E {\displaystyle E} . Le cône dual de P {\displaystyle P} est l'ensemble P E {\displaystyle P^{*}\subset E^{*}} défini par

P := { y E x P y , x 0 } , {\displaystyle P^{*}:=\{y\in E^{*}\mid \forall x\in P\;\;\langle y,x\rangle \geqslant 0\},}

c'est-à-dire l'ensemble des formes linéaires sur E {\displaystyle E} qui sont positives sur P {\displaystyle P} .

Ce cône porte aussi parfois le nom de cône dual positif, tandis que son opposé P {\displaystyle -P^{*}} porte le nom de cône dual négatif (ou parfois cône polaire[1], bien que ce dernier renvoie aussi à un autre concept).

Le cône bidual de P {\displaystyle P} est P := ( P ) {\displaystyle P^{**}:=(P^{*})^{*}} .

Lorsque E {\displaystyle E} est un espace vectoriel topologique réel , on définit de façon analogue le cône dual topologique : P P {\displaystyle P^{'}\subset P^{*}} est le cône des formes linéaires continues sur E {\displaystyle E} qui sont positives sur P {\displaystyle P} .

Si E {\displaystyle E} est de dimension finie, E = E {\displaystyle E'=E^{*}} et P = P {\displaystyle P'=P^{*}} .

Si E {\displaystyle E} est un espace de Hilbert réel, le théorème de représentation de Riesz permet d'identifier E {\displaystyle E'} à E {\displaystyle E} et donc P {\displaystyle P'} à un cône de E {\displaystyle E} . Un cône est alors dit autodual s'il est égal à son dual.

L'intersection de ces deux cas particuliers est celui où E {\displaystyle E} est un espace euclidien. Seul ce cas sera considéré dans la suite de cet article.

Notations

E {\displaystyle E} et F {\displaystyle F} désigneront des espaces euclidiens (produit scalaire et norme associés notés , {\displaystyle \langle \cdot ,\cdot \rangle } et {\displaystyle \|\cdot \|} respectivement).

Soit P {\displaystyle P} une partie de E {\displaystyle E} . On note

  • P ¯ {\displaystyle {\overline {P}}} l'adhérence de P {\displaystyle P} .
  • co P {\displaystyle \operatorname {co} P} l'enveloppe convexe de P {\displaystyle P} et co ¯ P := co P ¯ {\displaystyle {\overline {\operatorname {co} }}P:={\overline {\operatorname {co} P}}} son enveloppe convexe fermée.

On note aff C {\displaystyle \operatorname {aff} C} l'enveloppe affine d'un convexe non vide C {\displaystyle C} de E {\displaystyle E} et ir C {\displaystyle \operatorname {ir} C} son intérieur relatif.

Pour toute application linéaire A : E F {\displaystyle A:E\to F} , l'application A : F E {\displaystyle A^{*}:F\to E} est l'adjointe de A {\displaystyle A} .

Pour toute matrice A {\displaystyle A} , la matrice A {\displaystyle A^{\top }} est la transposée de A {\displaystyle A} .

Premières propriétés

P {\displaystyle P^{*}} est clairement un cône convexe fermé non vide de E {\displaystyle E} , comme intersection de la famille non vide des demi-espaces fermés { y E x , y 0 } {\displaystyle \{y\in E\mid \langle x,y\rangle \geqslant 0\}} , indexée par x P {\displaystyle x\in P} .

On a aussi les propriétés suivantes.

Soient P {\displaystyle P} et Q {\displaystyle Q} des parties non vides de E {\displaystyle E} et ( P i ) i I {\displaystyle (P_{i})_{i\in I}} une famille non vide de parties non vides de E {\displaystyle E} . Alors :

  1. ( i I P i ) = i I P i {\displaystyle (\cup _{i\in I}P_{i})^{*}=\cap _{i\in I}P_{i}^{*}} [2] ;
  2. P = ( co ¯ ( R + P ) ) {\displaystyle P^{*}=\left({\overline {\operatorname {co} }}(\mathbb {R} _{+}P)\right)^{*}}  ;
  3. le bidual de P {\displaystyle P} est le plus petit cône convexe fermé contenant P {\displaystyle P}  : P = co ¯ ( R + P ) {\displaystyle P^{**}={\overline {\operatorname {co} }}(\mathbb {R} _{+}P)}  ;
  4. ( P + Q ) P Q {\displaystyle (P+Q)^{*}\supset P^{*}\cap Q^{*}} , avec égalité si 0 P Q ¯ {\displaystyle 0\in {\overline {P\cap Q}}}  ;
  5. si P {\displaystyle P} et Q {\displaystyle Q} sont des cônes convexes fermés alors ( P Q ) = P + Q ¯ {\displaystyle (P\cap Q)^{*}={\overline {P^{*}+Q^{*}}}} .
Remarques
  • Dans l'égalité du point 3, l'inclusion immédiate co ¯ ( R + P ) P {\displaystyle {\overline {\operatorname {co} }}(\mathbb {R} _{+}P)\subset P^{**}} traduit le fait que P {\displaystyle P^{**}} est un cône convexe fermé contenant P {\displaystyle P} . L'inclusion réciproque, P co ¯ ( R + P ) {\displaystyle P^{**}\subset {\overline {\operatorname {co} }}(\mathbb {R} _{+}P)} , peut s'interpréter géométriquement comme suit. Elle signifie que si un vecteur b {\displaystyle b} n'appartient pas à co ¯ ( R + P ) {\displaystyle {\overline {\operatorname {co} }}(\mathbb {R} _{+}P)} , alors b P {\displaystyle b\notin P^{**}} , ce qui revient à dire qu'il existe un vecteur y 0 P = ( co ¯ ( R + P ) ) {\displaystyle y_{0}\in P^{*}=\left({\overline {\operatorname {co} }}(\mathbb {R} _{+}P)\right)^{*}} tel que y 0 , b < 0 {\displaystyle \langle y_{0},b\rangle <0} , ou encore, tel qu'un certain hyperplan orthogonal à y 0 {\displaystyle y_{0}} sépare strictement { b } {\displaystyle \{b\}} de co ¯ ( R + P ) {\displaystyle {\overline {\operatorname {co} }}(\mathbb {R} _{+}P)} . La démonstration du point 3 peut d'ailleurs se faire par séparation stricte de ces deux convexes (théorème de Hahn-Banach).
  • Dans le point 5 (qui se déduit du 4 par dualité), on peut enlever l'adhérence si P {\displaystyle P} et Q {\displaystyle Q} sont polyédriques (comme l'orthant positif d'un certain R p {\displaystyle \mathbb {R} ^{p}} ) — car P + Q {\displaystyle P^{*}+Q^{*}} est alors polyédrique donc fermé — ou si ir P ir Q {\displaystyle \operatorname {ir} P\cap \operatorname {ir} Q\neq \varnothing } , mais il ne suffit pas que P ir Q {\displaystyle P\cap \operatorname {ir} Q\neq \varnothing } . Par exemple, dans R 3 {\displaystyle \mathbb {R} ^{3}} , si P {\displaystyle P} est le cornet R 3 {\displaystyle \mathbb {R} _{\triangledown }^{3}} et si Q = { x R 3 x 2 = x 3 } {\displaystyle Q=\{x\in \mathbb {R} ^{3}\mid x_{2}=x_{3}\}} , alors P = R 3 {\displaystyle P^{*}=\mathbb {R} _{\triangledown }^{3}} (autodualité du cornet), Q = { d R 3 d 1 = 0 , d 2 + d 3 = 0 } {\displaystyle Q^{*}=\{d\in \mathbb {R} ^{3}\mid d_{1}=0,\;d_{2}+d_{3}=0\}} , P ir Q = P Q = { x R 3 x 1 = 0 , x 2 = x 3 0 } {\displaystyle P\cap \operatorname {ir} Q=P\cap Q=\{x\in \mathbb {R} ^{3}\mid x_{1}=0,\;x_{2}=x_{3}\geq 0\}\neq \varnothing } , alors que P + Q = { d R 3 d 2 + d 3 > 0 } { d R 3 d 1 = 0 , d 2 + d 3 = 0 } {\displaystyle P^{*}+Q^{*}=\{d\in \mathbb {R} ^{3}\mid d_{2}+d_{3}>0\}\cup \{d\in \mathbb {R} ^{3}\mid d_{1}=0,\;d_{2}+d_{3}=0\}} n'est pas fermé.

Lemme de Farkas et conséquences

Article détaillé : Lemme de Farkas.

Le lemme de Farkas a diverses interprétations. Nous le voyons ici comme un moyen de calculer le cône dual d'un ensemble défini au moyen d'une application linéaire.

Un lemme de Farkas généralisé

La notion de cône dual généralise celle de sous-espace vectoriel orthogonal, puisque si P {\displaystyle P} est un sous-espace vectoriel, P = P {\displaystyle P^{*}=P^{\perp }} . On connaît bien, pour une matrice A {\displaystyle A} , la relation

Ker ( A ) = Im ( A ) {\displaystyle {\operatorname {Ker} {(A^{\top })}}^{\perp }=\operatorname {Im} {(A)}} ,

qui nous apprend ce qu'est le cône dual d'un ensemble défini par un système d'équations linéaires homogènes. Une question naturelle est alors de se demander ce qu'est le cône dual d'un ensemble donné par des inégalités linéaires homogènes. La réponse à cette question est donnée par le lemme de Farkas (voir infra), que l'on peut généraliser comme suit.

Lemme de Farkas généralisé — Soient A : E F {\displaystyle A:E\to F} une application linéaire et K {\displaystyle K} un cône convexe non vide de E {\displaystyle E} . Alors,

( A 1 ( K ) ) = A ( K ) ¯ . {\displaystyle \left({A^{*}}^{-1}(K^{*})\right)^{*}={\overline {A(K)}}.}
Lemme de Farkas généralisé.

Un calcul immédiat montre que pour toute partie non vide K {\displaystyle K} de E {\displaystyle E} , ( A 1 ( K ) ) = A ( K ) {\displaystyle \left({A^{*}}^{-1}(K^{*})\right)^{*}=A(K)^{**}} . Par conséquent, le « lemme de Farkas généralisé » est un simple avatar de la propriété 3 ci-dessus (pour tout cône convexe P {\displaystyle P} , P = P ¯ {\displaystyle P^{**}={\overline {P}}} ) et s'interprète donc géométriquement de la même manière.

Remarquons que l'identité du « lemme de Farkas généralisé » s'écrit aussi A 1 ( K ) = ( A ( K ) ) {\displaystyle {A^{*}}^{-1}(K^{*})=(A(K))^{*}} car — contrairement à A ( K ) {\displaystyle A(K)} — le cône convexe A 1 ( K ) {\displaystyle {A^{*}}^{-1}(K^{*})} est nécessairement fermé, donc égal à son bidual.

L'identité du « lemme de Farkas généralisé » permet de donner une condition nécessaire pour que le système linéaire A x = b {\displaystyle Ax=b} ait une solution x {\displaystyle x} dans K {\displaystyle K} . Il faut en effet que b A ( K ) A ( K ) ¯ {\displaystyle b\in A(K)\subset {\overline {A(K)}}} et donc que

pour tout   y   tel que   A y K   on ait   y , b 0. {\displaystyle {\mbox{pour tout}}~y~{\mbox{tel que}}~A^{*}y\in K^{*}~{\mbox{on ait}}~\langle y,b\rangle \geqslant 0.}

Si A ( K ) {\displaystyle A(K)} est fermé (par exemple si K {\displaystyle K} — donc aussi A ( K ) {\displaystyle A(K)} — est polyédrique, ou si K {\displaystyle K} est fermé et K Ker A K {\displaystyle -K\cap \operatorname {Ker} A\subset K} ), cette condition sur A {\displaystyle A} et b {\displaystyle b} est aussi suffisante. Si A ( K ) {\displaystyle A(K)} n'est pas fermé, on peut trouver des conditions nécessaires et suffisantes pour que b A ( K ) {\displaystyle b\in A(K)} , qui renforcent l'expression ci-dessus[3]. Lorsque K {\displaystyle K} est l'orthant positif de R n {\displaystyle \mathbb {R} ^{n}} , A ( K ) {\displaystyle A(K)} est fermé et le résultat, exprimé sous une forme différente, est alors connu sous le nom de théorème de l'alternative (diverses variantes sont considérées dans l'article Théorèmes de l'alternative).

Corollaires

Corollaire 1 (Farkas) — Pour toute matrice B {\displaystyle B} ,

{ y B y 0 } = { B x x 0 } , {\displaystyle \{y\mid B^{\top }y\geqslant 0\}^{*}=\{Bx\mid x\geqslant 0\},}

{ } {\displaystyle \{\cdot \}^{*}} désigne le cône dual pour le produit scalaire euclidien.

On retrouve l'identité Ker ( A ) = Im ( A ) {\displaystyle {\operatorname {Ker} {(A^{\top })}}^{\perp }=\operatorname {Im} {(A)}} lorsque B = ( A A ) {\displaystyle B={\begin{pmatrix}A&-A\end{pmatrix}}} (par blocs).

Corollaire 2 (dual d'un polyèdre convexe) — Le cône dual d'un polyèdre convexe de E {\displaystyle E} est un polyèdre convexe.

Aspects topologiques

Intérieur et intérieur relatif du cône dual — Soient P E {\displaystyle P\subset E} et P ( aff P ) {\displaystyle P_{(\operatorname {aff} {P^{*}})}} le projecteur orthogonal sur le sous-espace vectoriel aff P {\displaystyle \operatorname {aff} {P^{*}}} . Alors

d int P ε > 0 ,   x P ,   on a   d , x ε x . d ir P ε > 0 ,   x P ,   on a   d , x ε P ( aff P ) x . {\displaystyle {\begin{array}{rcl}d\in \operatorname {int} {P^{*}}&\Longleftrightarrow &\exists \,\varepsilon >0,~\forall \,x\in P,~{\mbox{on a}}~\langle d,x\rangle \geqslant \varepsilon \|x\|.\\d\in \operatorname {ir} {P^{*}}&\Longleftrightarrow &\exists \,\varepsilon >0,~\forall \,x\in P,~{\mbox{on a}}~\langle d,x\rangle \geqslant \varepsilon \|P_{(\operatorname {aff} {P^{*}})}x\|.\end{array}}}

Décomposition de Moreau

Clairement, tout x R n {\displaystyle x\in \mathbb {R} ^{n}} est la somme de ses parties positive et négative max ( 0 , x ) {\displaystyle \max(0,x)} et min ( 0 , x ) {\displaystyle \min(0,x)} (composante par composante), c'est-à-dire de ses projetés orthogonaux (pour le produit scalaire euclidien) sur R + n {\displaystyle \mathbb {R} _{+}^{n}} et R n {\displaystyle \mathbb {R} _{-}^{n}} . La décomposition de Moreau[1] généralise l'identité pour des cônes différents de l'orthant positif R + n {\displaystyle \mathbb {R} _{+}^{n}} .

Décomposition de Moreau — Soient K {\displaystyle K} un cône convexe fermé de E {\displaystyle E} et K = K {\displaystyle K^{-}=-K^{*}} son cône dual négatif. On note P K {\displaystyle P_{K}} et P K {\displaystyle P_{K^{-}}} les projecteurs orthogonaux sur K {\displaystyle K} et K {\displaystyle K^{-}} respectivement. Alors, pour x {\displaystyle x} , y {\displaystyle y} et z {\displaystyle z} donnés dans E {\displaystyle E} , les propriétés suivantes sont équivalentes :

  1. z = x + y {\displaystyle z=x+y} , x K {\displaystyle x\in K} , y K {\displaystyle y\in K^{-}} et x , y = 0 {\displaystyle \langle x,y\rangle =0} ,
  2. x = P K ( z ) {\displaystyle x=P_{K}(z)} et y = P K ( z ) {\displaystyle y=P_{K^{-}}(z)} .

La décomposition de z {\displaystyle z} en x + y {\displaystyle x+y} comme au point 1 ci-dessus est appelée la décomposition de Moreau de z {\displaystyle z} , correspondant au cône K {\displaystyle K} .

Notes et références

  1. a et b J.-J. Moreau, « Proximité et dualité dans un espace hilbertien », Bull. Soc. Math. Fr., no 93, 1965, p. 273-299.
  2. En particulier, P Q P Q {\displaystyle P\subset Q\Rightarrow P^{*}\supset Q^{*}} .
  3. Voir (en) J. B. Lasserre, « A Farkas lemma without a standard closure condition », SIAM Journal on Control and Optimization, vol. 35,‎ , p. 265-272.

Articles connexes

  • icône décorative Portail de l'analyse