Réseau de neurones de Hopfield

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Le réseau de neurones d'Hopfield est un modèle de réseau de neurones récurrents à temps discret dont la matrice des connexions est symétrique et nulle sur la diagonale et où la dynamique est asynchrone (un seul neurone est mis à jour à chaque unité de temps). Il a été popularisé par le physicien John Hopfield en 1982[1]. Sa découverte a permis de relancer l'intérêt dans les réseaux de neurones qui s'était essoufflé durant les années 1970 à la suite d'un article de Marvin Minsky et Seymour Papert. Les réseaux de Hopfield rentrent dans le cadre des modèles à base d'énergie[2].

Un réseau de Hopfield est une mémoire adressable par son contenu : une forme mémorisée est retrouvée par une stabilisation du réseau, s'il a été stimulé par une partie adéquate de cette forme.

Structure

Un réseau de Hopfield à 4 neurones.

Ce modèle de réseau est constitué de N neurones à états binaires (-1, 1 ou 0, 1 suivant les versions) tous interconnectés. L'entrée totale d'un neurone i est donc :

I i = j w i j V j {\displaystyle I_{i}=\sum _{j}w_{ij}V_{j}}

où :

  • w i j {\displaystyle w_{ij}} est le poids de la connexion du neurone i au neurone j ;
  • V j {\displaystyle V_{j}} est l'état du neurone j.

L'état du réseau peut être caractérisé par un mot de N bits correspondant à l'état de chaque neurone.

Dynamique

Le fonctionnement du réseau est séquencé par une horloge. On notera :

  • V i ( t ) {\displaystyle V_{i}(t)} ou V i {\displaystyle V_{i}} l'état du neurone i à l'instant t ;
  • V i ( t + 1 ) {\displaystyle V_{i}(t+1)} l'état du neurone i à l'instant t + dt où dt désigne l'intervalle de temps entre 2 tops d'horloge.

Il existe plusieurs alternatives assez équivalentes pour la mise à jour de l'état des neurones :

  • le mode stochastique original de Hopfield où chaque neurone modifie son état à un instant aléatoire selon une fréquence moyenne égale pour tous les neurones. Plus simplement on peut considérer qu'à chaque top d'horloge, on tire au hasard un neurone afin de le mettre à jour ;
  • un mode synchrone où tous les neurones sont mis à jour simultanément ;
  • un mode séquentiel où les neurones sont mis à jour selon un ordre défini.

Le calcul du nouvel état du neurone i se fait ainsi :

V i ( t + 1 ) = { 1 s i j w i j V j > 0 , 1 s i n o n {\displaystyle V_{i}(t+1)=\left\{{\begin{matrix}1&\mathrm {si} \sum _{j}{w_{ij}V_{j}}>0,\\-1&\mathrm {sinon} \end{matrix}}\right.}

Apprentissage

L'apprentissage dans un réseau d'Hopfield consiste à faire en sorte que chacun des prototypes à mémoriser soit :

  • un état stable du réseau ;
  • un état attracteur permettant de le retrouver à partir d'états légèrement différents.

Règle d'apprentissage de Hebb pour les réseaux de Hopfield

Pour estimer les poids, on peut utiliser un apprentissage hebbien, inspiré de la règle de Hebb. Qui donne pour retenir p {\displaystyle p} motif d'entraînement :

w i j = 1 n k = 1 p x i k x j k {\displaystyle w_{ij}={\frac {1}{n}}\sum _{k=1}^{p}x_{i}^{k}x_{j}^{k}\,}

w i j {\displaystyle w_{ij}} est le poids de la connexion entre le neurone j {\displaystyle j} et le neurone i {\displaystyle i} , n {\displaystyle n} est la dimension du vecteur d'entrée, et x i k {\displaystyle x_{i}^{k}} et x j k {\displaystyle x_{j}^{k}} sont respectivement la k {\displaystyle k} ième entrée des neurones i {\displaystyle i} et j {\displaystyle j} .

Si les bits correspondant aux neurones i {\displaystyle i} et j {\displaystyle j} sont égaux dans le motif μ {\displaystyle \mu } , alors le produit ϵ i μ ϵ j μ {\displaystyle \epsilon _{i}^{\mu }\epsilon _{j}^{\mu }} sera sois positif. Cela aurait, à son tour, un effet positif sur le poids w i j {\displaystyle w_{ij}} et les valeurs de i {\displaystyle i} et j {\displaystyle j} auront tendance à devenir égales. L'inverse se produit si les bits correspondant aux neurones i {\displaystyle i} et j {\displaystyle j} sont différents.

L'apprentissage hebbien minimise la fonction d'énergie, c'est-à-dire que si deux unités sont actives simultanément, le poids de leurs connexions est augmenté ou diminué.

Règle d'apprentissage de Storkey

Cette règle a été introduite par Amos Storkey en 1997 et est à la fois locale et incrémentielle. Storkey a également montré qu'un réseau Hopfield entraîné à l'aide de cette règle a une plus grande capacité qu'un réseau correspondant entraîné à l'aide de la règle de Hebb[3]. Le réseaux suit la règle d'apprentissage de Storkey si il obéit :

w i j ν = w i j ν 1 + 1 n ϵ i ν ϵ j ν 1 n ϵ i ν h j i ν 1 n ϵ j ν h i j ν {\displaystyle w_{ij}^{\nu }=w_{ij}^{\nu -1}+{\frac {1}{n}}\epsilon _{i}^{\nu }\epsilon _{j}^{\nu }-{\frac {1}{n}}\epsilon _{i}^{\nu }h_{ji}^{\nu }-{\frac {1}{n}}\epsilon _{j}^{\nu }h_{ij}^{\nu }}

h i j ν = k = 1   :   i k j n w i k ν 1 ϵ k ν {\displaystyle h_{ij}^{\nu }=\sum _{k=1~:~i\neq k\neq j}^{n}w_{ik}^{\nu -1}\epsilon _{k}^{\nu }} est une forme de champ local[4] au niveau du neurone i.

Cette règle d'apprentissage est locale, puisque les synapses ne prennent en compte que les neurones à leurs côtés. La règle utilise plus d'informations provenant des modèles et des poids que la règle de Hebb généralisée, en raison de l'effet du champ local.

Limites

Le réseau de Hopfield a cependant des limites bien connues : il ne peut stocker qu'environ 0,14 n {\displaystyle n} motifs avec n {\displaystyle n} le nombre de neurones. Des modèles ultérieurs, s'inspirant du réseau de Hopfield mais en modifiant les règles de stockage et d'accès, permettent d'agrandir cette limite de stockage[5].

Voir aussi

Notes et références

  1. (en) J. J. Hopfield, « Neural networks and physical systems with emergent collective computational abilities », Proceedings of the National Academy of Sciences, vol. 79, no 8,‎ , p. 2554–2558 (ISSN 0027-8424 et 1091-6490, PMID 6953413, DOI 10.1073/pnas.79.8.2554, lire en ligne, consulté le )
  2. Par Tiernan Ray |, « EXCLUSIF : Yann LeCun (Meta) explore la frontière énergétique de l'apprentissage profond », sur ZDNet France (consulté le ).
  3. Amos Storkey, Artificial Neural Networks – ICANN'97, vol. 1327, Springer, coll. « Lecture Notes en informatique », , 451–6 p. (ISBN 978-3-540-69620-9, DOI 10.1007/BFb0020196, CiteSeerx 10.1.1.33.103), « Augmenter capacité d'un réseau Hopfield sans sacrifier la fonctionnalité »
  4. A.J. Storkey et R. Valabregue, « Les bassins d'attraction d'une nouvelle règle d'apprentissage de Hopfield », Neural Networks, vol. 12, no 6,‎ , p. 869–876 (PMID 12662662, DOI 10.1016/S0893-6080(99 )00038-6, CiteSeerx 10.1.1.19.4681)
  5. Ala ABOUDIB, Vincent GRIPON et Xiaoran JIANG, « A study of retrieval algorithms of sparse messages in networks of neural cliques », COGNITIVE 2014 : the 6th International Conference on Advanced Cognitive Technologies and Applications,‎ , p. 140–146 (lire en ligne, consulté le ).

Articles connexes

Liens externes

  • Neural Lab - interface graphique en Python et Gtk permettant de manipuler un reseaux de hopfield
v · m
Problèmes
Apprentissage supervisé
Classement
Régression
Réseau de neurones artificiels (ANN)
Apprentissage non supervisé
Clustering
Réduction de dimensions
Réseau de neurones artificiels (ANN)
Optimisation
Théorie
Logiciels
  • icône décorative Portail de l'informatique théorique