Fonction conjuguée

En mathématiques, et plus précisément en analyse convexe, la fonction conjuguée est une fonction construite à partir d'une fonction réelle f {\displaystyle f} définie sur un espace vectoriel E {\displaystyle \mathbb {E} } , qui est utile :

  • pour convexifier une fonction (en prenant sa biconjuguée, c'est-à-dire la conjuguée de sa conjuguée) ;
  • dans le calcul du sous-différentiel d'une fonction convexe ;
  • dans la dualisation par perturbation des problèmes d'optimisation ;
  • pour passer de la mécanique lagrangienne à la mécanique hamiltonienne ;
  • en thermodynamique, etc.

La fonction conjuguée de f {\displaystyle f} est le plus souvent notée f {\displaystyle f^{*}} . C'est une fonction convexe, même si f {\displaystyle f} ne l'est pas, définie sur les pentes, c'est-à-dire sur les éléments de l'espace vectoriel dual de E {\displaystyle \mathbb {E} } . La définition est motivée et précisée ci-dessous.

L'application f f {\displaystyle f\to f^{*}} est appelée transformation de Fenchel ou transformation de Legendre ou encore transformation de Legendre-Fenchel, d'après Adrien-Marie Legendre et Werner Fenchel.

Connaissances supposées : l'algèbre linéaire, le calcul différentiel, les bases de l'analyse convexe (notamment les principales notions attachées aux ensembles et aux fonctions convexes) ; le sous-différentiel d'une fonction convexe n'est utilisé que pour motiver la définition de fonction conjuguée.

Motivations

La complexité apparente du concept de fonction conjuguée requiert d'en motiver la définition.

Convexification de fonction

Par définition, une fonction est convexe si son épigraphe est convexe. Convexifier une fonction f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} consiste à déterminer la plus grande fonction convexe, disons fermée, minorant f {\displaystyle f} . En termes d'épigraphe, cela revient à trouver le plus petit convexe fermé contenant l'épigraphe de f {\displaystyle f} , c'est-à-dire à prendre l'enveloppe convexe fermée de l'épigraphe

epi f E × R . {\displaystyle \operatorname {epi} \,f\subset \mathbb {E} \times \mathbb {R} .}

Comme toute enveloppe convexe fermée, celle de epi f {\displaystyle \operatorname {epi} \,f} est l'intersection de tous les demi-espaces fermés contenant epi f {\displaystyle \operatorname {epi} \,f} , c'est-à-dire d'ensembles de la forme

H ( ξ , τ , t ) := { ( x , α ) E × R : ξ , x + τ α t } , {\displaystyle H^{-}(\xi ,\tau ,t):=\{(x,\alpha )\in \mathbb {E} \times \mathbb {R} :\langle \xi ,x\rangle +\tau \alpha \leqslant t\},}

( ξ , τ , t ) E × R × R {\displaystyle (\xi ,\tau ,t)\in \mathbb {E} \times \mathbb {R} \times \mathbb {R} } . Il est facile de voir que lorsque H ( ξ , τ , t ) {\displaystyle H^{-}(\xi ,\tau ,t)} contient un épigraphe, on doit avoir τ 0 {\displaystyle \tau \leqslant 0} . Il est plus fin de montrer que, dans l'expression de l'enveloppe convexe fermée de epi f {\displaystyle \operatorname {epi} \,f} comme intersection des H ( ξ , τ , t ) {\displaystyle H^{-}(\xi ,\tau ,t)} , on peut ne garder que les demi-espaces avec τ < 0 {\displaystyle \tau <0} . Or ceux-ci sont les épigraphes des minorantes affines de f {\displaystyle f} de la forme

x ξ τ , x + t τ . {\displaystyle x\mapsto \left\langle {\frac {-\xi }{\tau }},x\right\rangle +{\frac {t}{\tau }}.}

Résumons. Comme on pouvait s'y attendre, la convexifiée fermée de f {\displaystyle f} est l'enveloppe supérieure de toutes les minorantes affines de f {\displaystyle f} . Parmi les minorantes affines x s , x + α {\displaystyle x\mapsto \langle s,x\rangle +\alpha } ayant une pente s E {\displaystyle s\in \mathbb {E} } fixée, on peut aussi ne garder que celle qui est la plus haute, c'est-à-dire celle qui a le plus grand α {\displaystyle \alpha } . Il faut donc déterminer le plus grand α {\displaystyle \alpha } tel que

x E : s , x + α f ( x ) ou s , x f ( x ) α . {\displaystyle \forall \,x\in \mathbb {E} \,:\quad \langle s,x\rangle +\alpha \leqslant f(x)\quad {\mbox{ou}}\quad \langle s,x\rangle -f(x)\leqslant -\alpha .}

On voit clairement que la plus petite valeur de α {\displaystyle -\alpha } est donnée par

f ( s ) := sup x E ( s , x f ( x ) ) . {\displaystyle f^{*}(s):=\sup _{x\in \mathbb {E} }{\Bigl (}\langle s,x\rangle -f(x){\Bigr )}.}

C'est la valeur de la conjuguée de f {\displaystyle f} en s {\displaystyle s} . On s'intéresse à α {\displaystyle -\alpha } plutôt qu'à α {\displaystyle \alpha } pour définir f {\displaystyle f^{*}} dans le but d'obtenir ainsi une fonction conjuguée convexe.

Voie d'accès au sous-différentiel

Dans cette section, nous montrons l'intérêt du concept de fonction conjuguée comme un outil permettant de calculer le sous-différentiel d'une fonction convexe.

Le sous-différentiel f ( x ) {\displaystyle \partial f(x)} d'une fonction convexe f {\displaystyle f} en x {\displaystyle x} est l'ensemble des pentes des minorantes affines de f {\displaystyle f} (i.e., des fonctions affines qui minorent f {\displaystyle f} ), qui sont exactes en x {\displaystyle x} (i.e., qui ont la même valeur que f {\displaystyle f} en x {\displaystyle x} ). Pour x {\displaystyle x} donné, il n'est pas toujours aisé de spécifier toutes les minorantes affines exactes en x {\displaystyle x} . Il est parfois plus facile de se donner une pente s {\displaystyle s} de minorante affine x s , x + α {\displaystyle x\mapsto \langle s,x\rangle +\alpha } et de chercher les points auxquels elle peut être exacte par modification de α {\displaystyle \alpha } . De ce point de vue, on cherche le plus grand α {\displaystyle \alpha } tel que

x E : s , x + α f ( x ) ou s , x f ( x ) α . {\displaystyle \forall \,x\in \mathbb {E} \,:\quad \langle s,x\rangle +\alpha \leqslant f(x)\quad {\mbox{ou}}\quad \langle s,x\rangle -f(x)\leqslant -\alpha .}

On voit clairement que la plus petite valeur de α {\displaystyle -\alpha } est donnée par

f ( s ) := sup x E ( s , x f ( x ) ) . {\displaystyle f^{*}(s):=\sup _{x\in \mathbb {E} }{\Bigl (}\langle s,x\rangle -f(x){\Bigr )}.}

C'est la valeur de la conjuguée de f {\displaystyle f} en s {\displaystyle s} . On s'intéresse à α {\displaystyle -\alpha } plutôt qu'à α {\displaystyle \alpha } pour définir f {\displaystyle f^{*}} dans le but d'obtenir ainsi une fonction conjuguée convexe. Revenons au problème que nous nous posions au début de ce paragraphe : si x {\displaystyle x} est solution du problème de maximisation ci-dessus, alors s , x f ( x ) s , y f ( y ) {\displaystyle \langle s,x\rangle -f(x)\geqslant \langle s,y\rangle -f(y)} pour tout y E {\displaystyle y\in \mathbb {E} } ou encore

y E : f ( y ) f ( x ) + s , y x . {\displaystyle \forall \,y\in \mathbb {E} \,:\quad f(y)\geqslant f(x)+\langle s,y-x\rangle .}

Ces inégalités montrent que y f ( x ) + s , y x {\displaystyle y\mapsto f(x)+\langle s,y-x\rangle } est une minorante affine de f {\displaystyle f} , exacte en x {\displaystyle x} .

Fonction définie sur un espace euclidien

On suppose dans cette section que les fonctions sont définies sur un espace vectoriel euclidien E {\displaystyle \mathbb {E} } (de dimension finie donc), dont le produit scalaire est noté , {\displaystyle \langle \cdot ,\cdot \rangle } et la norme associée {\displaystyle \|\cdot \|} .

On note

  • Conv ( E ) {\displaystyle \operatorname {Conv} (\mathbb {E} )} l'ensemble des fonctions définies sur E {\displaystyle \mathbb {E} } à valeurs dans R ¯ := R { , + } {\displaystyle {\bar {\mathbb {R} }}:=\mathbb {R} \cup \{-\infty ,+\infty \}} qui sont convexes (i.e., leur épigraphe est convexe) et propres (i.e., elles ne prennent pas la valeur {\displaystyle -\infty } et ne sont pas identiquement égales à + {\displaystyle +\infty } ),
  • C o n v ¯ ( E ) {\displaystyle \operatorname {C{\overline {onv}}} (\mathbb {E} )} la partie de Conv ( E ) {\displaystyle \operatorname {Conv} (\mathbb {E} )} formée des fonctions qui sont aussi fermées (i.e., leur épigraphe est fermé).

La conjuguée et ses propriétés

On a choisi de désigner par s {\displaystyle s} l'argument de f {\displaystyle f^{*}} pour se rappeler qu'il s'agit d'une pente (slope en anglais), c'est-à-dire un élément de l'espace dual de E {\displaystyle \mathbb {E} } , ici identifié à E {\displaystyle \mathbb {E} } via le produit scalaire.

Fonction conjuguée — Soit f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} une fonction (non nécessairement convexe). Sa fonction conjuguée est la fonction f : E R ¯ {\displaystyle f^{*}:\mathbb {E} \to {\bar {\mathbb {R} }}} définie en s E {\displaystyle s\in \mathbb {E} } par

f ( s ) := sup x E ( s , x f ( x ) ) . {\displaystyle f^{*}(s):=\sup _{x\in \mathbb {E} }{\Bigl (}\langle s,x\rangle -f(x){\Bigr )}.}

L'application f f {\displaystyle f\mapsto f^{*}} est appelée transformation de Legendre-Fenchel.

On s'intéresse ci-dessous à la convexité et au caractère propre et fermé de la conjuguée f {\displaystyle f^{*}} . La convexité de f {\displaystyle f^{*}} est une propriété remarquable de la conjuguée, puisqu'on se rappelle que f {\displaystyle f} n'est pas nécessairement convexe.

Conjuguée convexe fermée — Quelle que soit f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} , sa conjuguée f {\displaystyle f^{*}} est convexe et fermée. Par ailleurs, on a les équivalences suivantes

f + f > f , {\displaystyle f\not \equiv +\infty \qquad \Longleftrightarrow \qquad f^{*}>-\infty \qquad \Longleftrightarrow \qquad f^{*}\not \equiv -\infty ,}

f   a une minorante affine f + . {\displaystyle f~{\mbox{a une minorante affine}}\qquad \Longleftrightarrow \qquad f^{*}\not \equiv +\infty .}

Enfin, les propriétés suivantes sont équivalentes :

  1. f {\displaystyle f} est propre et a une minorante affine,
  2. f {\displaystyle f^{*}} est propre,
  3. f C o n v ¯ ( E ) {\displaystyle f^{*}\in \operatorname {C{\overline {onv}}} (\mathbb {E} )} .

On se rappellera qu'une fonction convexe et propre a nécessairement une minorante affine ; elle vérifie donc les propriétés du point 1 ci-dessus, si bien que

f Conv ( E ) f C o n v ¯ ( E ) . {\displaystyle f\in \operatorname {Conv} (\mathbb {E} )\quad \Longrightarrow \quad f^{*}\in \operatorname {C{\overline {onv}}} (\mathbb {E} ).}

La biconjuguée et ses propriétés

On peut bien sûr appliquer la transformation de Legendre-Fenchel à la fonction conjuguée f {\displaystyle f^{*}}  ; on obtient ainsi la biconjuguée de f {\displaystyle f} , notée f {\displaystyle f^{**}} .

Fonction biconjuguée — Soit f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} une fonction (non nécessairement convexe). Sa fonction biconjuguée est la fonction f : E R ¯ {\displaystyle f^{**}:\mathbb {E} \to {\bar {\mathbb {R} }}} définie en x E {\displaystyle x\in \mathbb {E} } par

f ( x ) := sup s E ( s , x f ( s ) ) , {\displaystyle f^{**}(x):=\sup _{s\in \mathbb {E} }{\Bigl (}\langle s,x\rangle -f^{*}(s){\Bigr )},}

f : E R ¯ {\displaystyle f^{*}:\mathbb {E} \to {\bar {\mathbb {R} }}} est la conjuguée de f {\displaystyle f} .

Le caractère convexe, fermé et propre de la biconjuguée est examiné dans le résultat suivant.

Biconjuguée convexe fermée — Quelle que soit f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} , sa biconjuguée f {\displaystyle f^{**}} est convexe et fermée. Par ailleurs, les propriétés suivantes sont équivalentes :

  1. f {\displaystyle f} est propre et a une minorante affine,
  2. f C o n v ¯ ( E ) {\displaystyle f^{**}\in \operatorname {C{\overline {onv}}} (\mathbb {E} )} .

Si l'argument s {\displaystyle s} de f {\displaystyle f^{*}} est une pente (identifiée à un élément de E {\displaystyle \mathbb {E} } ), l'argument x {\displaystyle x} de f {\displaystyle f^{**}} est dans l'espace de départ E {\displaystyle \mathbb {E} } . On peut alors se demander s'il y a un lien entre f {\displaystyle f} et f {\displaystyle f^{**}} . La proposition suivante examine cette question. On y a noté f ¯ {\displaystyle {\bar {f}}} , la fermeture de f {\displaystyle f} .

Enveloppe convexe fermée — Soit f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} une fonction propre ayant une minorante affine. Alors

  1. f {\displaystyle f^{**}} est l'enveloppe supérieure des minorantes affines de f {\displaystyle f} ,
  2. f Conv ( E )         f = f ¯ {\displaystyle f\in \operatorname {Conv} (\mathbb {E} )~~\Longrightarrow ~~f^{**}={\bar {f}}} ,
  3. f C o n v ¯ ( E )         f = f {\displaystyle f\in \operatorname {C{\overline {onv}}} (\mathbb {E} )~~\Longleftrightarrow ~~f^{**}=f} ,
  4. la transformation de Legendre-Fenchel f f {\displaystyle f\mapsto f^{*}} est une bijection sur l'ensemble C o n v ¯ ( E ) {\displaystyle \operatorname {C{\overline {onv}}} (\mathbb {E} )} .

Ce résultat permet de comparer les valeurs de f {\displaystyle f^{**}} et f {\displaystyle f} .

Comparaison de f {\displaystyle f^{**}} et f {\displaystyle f}  — Quelle que soit la fonction f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} , on a

f f . {\displaystyle f^{**}\leqslant f.}

Si f Conv ( E ) {\displaystyle f\in \operatorname {Conv} (\mathbb {E} )} et x dom f {\displaystyle x\in \operatorname {dom} \,f} , alors

f ( x ) = f ( x ) f   est semi-continue inférieurement en   x . {\displaystyle f^{**}(x)=f(x)\qquad \Longleftrightarrow \qquad f~{\mbox{est semi-continue inférieurement en}}~x.}

Si on prend la conjuguée de la biconjuguée, on trouve la conjuguée. Il n'y a donc pas de notion de triconjuguée.

Pas de triconjuguée — Soit f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} une fonction propre ayant une minorante affine. Alors ( f ) = f {\displaystyle (f^{**})^{*}=f^{*}} .

Règles de calcul de conjuguée

Inf-image sous une application linéaire

Rappelons la définition de l'inf-image d'une fonction sous une application linéaire. On se donne deux espaces euclidiens E {\displaystyle \mathbb {E} } et F {\displaystyle \mathbb {F} } (on aura besoin ici d'un produit scalaire sur E {\displaystyle \mathbb {E} } et F {\displaystyle \mathbb {F} } , alors que cette structure n'est pas nécessaire dans la définition de f A {\displaystyle f\veebar A} ), une fonction f : E R ¯ {\displaystyle f:\mathbb {E} \to {\bar {\mathbb {R} }}} et une application linéaire A : E F {\displaystyle A:\mathbb {E} \to \mathbb {F} } . Alors l'inf-image de f {\displaystyle f} sous A {\displaystyle A} est l'application notée f A : F R ¯ {\displaystyle f\veebar A:\mathbb {F} \to {\bar {\mathbb {R} }}} et définie en y F {\displaystyle y\in \mathbb {F} } par

( f A ) ( y ) = inf x E A x = y f ( x ) . {\displaystyle (f\veebar A)(y)=\inf _{{x\in \mathbb {E} } \atop {Ax=y}}\;f(x).}

Conjuguée d'une inf-image sous une application linéaire — Dans les conditions énoncées ci-dessus, on a

( f A ) = f A . {\displaystyle (f\veebar A)^{*}=f^{*}\circ A^{*}.}

Par ailleurs, si f {\displaystyle f} est propre et a une minorante affine et si A {\displaystyle A} vérifie

R ( A ) dom f , {\displaystyle {\mathcal {R}}(A^{*})\cap \operatorname {dom} \,f^{*}\neq \varnothing ,}

alors f A {\displaystyle f\veebar A} est propre et a une minorante affine, si bien qu'alors ( f A ) C o n v ¯ ( F ) {\displaystyle (f\veebar A)^{*}\in \operatorname {C{\overline {onv}}} (\mathbb {F} )} .

Pré-composition avec une application linéaire

Exemples

Norme

Soit

f : E R : x x {\displaystyle f:\mathbb {E} \to \mathbb {R} :x\mapsto \|x\|}

une norme sur un espace euclidien E {\displaystyle \mathbb {E} } , non nécessairement dérivée du produit scalaire , {\displaystyle \langle \cdot ,\cdot \rangle } de E {\displaystyle \mathbb {E} } . On introduit la norme duale

s D := sup x 1 s , x {\displaystyle \|s\|_{_{D}}:=\sup _{\|x\|\leqslant 1}\;\langle s,x\rangle }

et la boule-unité duale fermée

B ¯ D := { s E : s D 1 } . {\displaystyle {\bar {B}}_{_{D}}:=\{s\in \mathbb {E} :\|s\|_{_{D}}\leqslant 1\}.}

La fonction conjuguée f : E R {\displaystyle f^{*}:\mathbb {E} \to \mathbb {R} } de f {\displaystyle f} est l'indicatrice de la boule unité duale ; elle prend donc en s E {\displaystyle s\in \mathbb {E} } la valeur suivante

f ( s ) = I B ¯ D ( s ) := { 0 si s D 1 + sinon . {\displaystyle f^{*}(s)={\mathcal {I}}_{{\bar {B}}_{_{D}}}(s):=\left\{{\begin{array}{lll}0&{\mbox{si}}&\|s\|_{_{D}}\leq 1\\+\infty &{\mbox{sinon}}.\end{array}}\right.}


Considérons à présent, la puissance p > 1 {\displaystyle p>1} d'une norme

f : E R : x 1 p x p . {\displaystyle f:\mathbb {E} \to \mathbb {R} :x\mapsto {\frac {1}{p}}\,\|x\|^{p}.}

Sa fonction conjuguée f : E R {\displaystyle f^{*}:\mathbb {E} \to \mathbb {R} } prend en s E {\displaystyle s\in \mathbb {E} } la valeur suivante

f ( s ) = 1 p s D p , {\displaystyle f^{*}(s)={\frac {1}{p'}}\,\|s\|_{_{D}}^{p'},}

p := p / ( p 1 ) > 1 {\displaystyle p':=p/(p-1)>1} est le nombre conjugué de p {\displaystyle p}  :

1 p + 1 p = 1. {\displaystyle {\frac {1}{p}}+{\frac {1}{p'}}=1.}

Distance à un convexe

Valeur propre maximale

Annexes

Éléments d'histoire

La fonction conjuguée fut introduite par Mandelbrojt (1939) pour une fonction d'une seule variable réelle ; puis précisée et améliorée par Fenchel (1949) aux fonctions convexes dépendant d'un nombre fini de variables. Ce dernier introduit la notation f {\displaystyle f^{*}} pour la conjuguée de f {\displaystyle f} . La conjugaison généralise une transformation de fonction introduite bien plus tôt par Legendre (1787). L'extension aux espaces vectoriels topologiques est due à Brønsted (1964), Moreau (1967) et Rockafellar.

Articles connexes

Bibliographie

  • (en) J. M. Borwein et A. S. Lewis, Convex Analysis and Nonlinear Optimization, New York, Springer, .
  • (en) A. Brøndsted, « Conjugate convex functions in topological vector spaces. », Matematiskfysiske Meddelelser udgivet af det Kongelige Danske Videnskabernes Selskab, no 34,‎ , p. 1–26.
  • (en) W. Fenchel, « On conjugate functions », Canadian Journal of Mathematics, vol. 1,‎ , p. 73–77.
  • (en) J.-B. Hiriart-Urruty et C. Lemaréchal, « Convex Analysis and Minimization Algorithms », Grundlehren der mathematischen Wissenschaften, Springer-Verlag,‎ , p. 305-306.
  • (en) J.-B. Hiriart-Urruty et C. Lemaréchal, Fundamentals of convex analysis, Berlin, Springer-Verlag, .
  • (en) A.M. Legendre, Mémoire sur l’intégration de quelques équations aux différences partielles, coll. « Mém. Acad. Sciences », , p. 309–351.
  • (en) S. Mandelbrojt, « Sur les fonctions convexes », C. R. Acad. Sci. Paris, vol. 209,‎ , p. 977-978.
  • J.J. Moreau, Fonctionnelles convexes, Collège de France, coll. « Séminaire Équations aux dérivees partielles », .
  • (en) R.T. Rockafellar, « Convex Analysis », Princeton Mathematics, Princeton, New Jersey, Princeton University Press,, 28e série,‎ .
  • icône décorative Portail des mathématiques
  • icône décorative Portail de l'analyse