Réseau de neurones de Hopfield

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Le réseau de neurones d'Hopfield est un modèle de réseau de neurones récurrents à temps discret dont la matrice des connexions est symétrique et nulle sur la diagonale et où la dynamique est asynchrone (un seul neurone est mis à jour à chaque unité de temps). Il a été popularisé par le physicien John Hopfield en 1982^[1]. Sa découverte a permis de relancer l'intérêt dans les réseaux de neurones qui s'était essoufflé durant les années 1970 à la suite d'un article de Marvin Minsky et Seymour Papert. Les réseaux de Hopfield rentrent dans le cadre des modèles à base d'énergie^[2].

Un réseau de Hopfield est une mémoire adressable par son contenu : une forme mémorisée est retrouvée par une stabilisation du réseau, s'il a été stimulé par une partie adéquate de cette forme.

Structure

Ce modèle de réseau est constitué de N neurones à états binaires (-1, 1 ou 0, 1 suivant les versions) tous interconnectés. L'entrée totale d'un neurone i est donc :

I_{i}=\sum _{j}w_{ij}V_{j}

où :

$w_{ij}$ est le poids de la connexion du neurone i au neurone j ;
$V_{j}$ est l'état du neurone j.

L'état du réseau peut être caractérisé par un mot de N bits correspondant à l'état de chaque neurone.

Dynamique

Le fonctionnement du réseau est séquencé par une horloge. On notera :

$V_{i}(t)$ ou $V_{i}$ l'état du neurone i à l'instant t ;
$V_{i}(t+1)$ l'état du neurone i à l'instant t + dt où dt désigne l'intervalle de temps entre 2 tops d'horloge.

Il existe plusieurs alternatives assez équivalentes pour la mise à jour de l'état des neurones :

le mode stochastique original de Hopfield où chaque neurone modifie son état à un instant aléatoire selon une fréquence moyenne égale pour tous les neurones. Plus simplement on peut considérer qu'à chaque top d'horloge, on tire au hasard un neurone afin de le mettre à jour ;
un mode synchrone où tous les neurones sont mis à jour simultanément ;
un mode séquentiel où les neurones sont mis à jour selon un ordre défini.

Le calcul du nouvel état du neurone i se fait ainsi :

$V_{i}(t+1)=\left\{{\begin{matrix}1&\mathrm {si} \sum _{j}{w_{ij}V_{j}}>0,\\-1&\mathrm {sinon} \end{matrix}}\right.$

Apprentissage

L'apprentissage dans un réseau d'Hopfield consiste à faire en sorte que chacun des prototypes à mémoriser soit :

un état stable du réseau ;
un état attracteur permettant de le retrouver à partir d'états légèrement différents.

Règle d'apprentissage de Hebb pour les réseaux de Hopfield

Pour estimer les poids, on peut utiliser un apprentissage hebbien, inspiré de la règle de Hebb. Qui donne pour retenir $p$ motif d'entraînement :

w_{ij}={\frac {1}{n}}\sum _{k=1}^{p}x_{i}^{k}x_{j}^{k}\,

où $w_{ij}$ est le poids de la connexion entre le neurone $j$ et le neurone $i$ , $n$ est la dimension du vecteur d'entrée, et $x_{i}^{k}$ et $x_{j}^{k}$ sont respectivement la $k$ ième entrée des neurones $i$ et $j$ .

Si les bits correspondant aux neurones $i$ et $j$ sont égaux dans le motif $\mu$ , alors le produit $\epsilon _{i}^{\mu }\epsilon _{j}^{\mu }$ sera sois positif. Cela aurait, à son tour, un effet positif sur le poids $w_{ij}$ et les valeurs de $i$ et $j$ auront tendance à devenir égales. L'inverse se produit si les bits correspondant aux neurones $i$ et $j$ sont différents.

L'apprentissage hebbien minimise la fonction d'énergie, c'est-à-dire que si deux unités sont actives simultanément, le poids de leurs connexions est augmenté ou diminué.

Règle d'apprentissage de Storkey

Cette règle a été introduite par Amos Storkey en 1997 et est à la fois locale et incrémentielle. Storkey a également montré qu'un réseau Hopfield entraîné à l'aide de cette règle a une plus grande capacité qu'un réseau correspondant entraîné à l'aide de la règle de Hebb^[3]. Le réseaux suit la règle d'apprentissage de Storkey si il obéit :

$w_{ij}^{\nu }=w_{ij}^{\nu -1}+{\frac {1}{n}}\epsilon _{i}^{\nu }\epsilon _{j}^{\nu }-{\frac {1}{n}}\epsilon _{i}^{\nu }h_{ji}^{\nu }-{\frac {1}{n}}\epsilon _{j}^{\nu }h_{ij}^{\nu }$

où $h_{ij}^{\nu }=\sum _{k=1~:~i\neq k\neq j}^{n}w_{ik}^{\nu -1}\epsilon _{k}^{\nu }$ est une forme de champ local^[4] au niveau du neurone i.

Cette règle d'apprentissage est locale, puisque les synapses ne prennent en compte que les neurones à leurs côtés. La règle utilise plus d'informations provenant des modèles et des poids que la règle de Hebb généralisée, en raison de l'effet du champ local.

Limites

Le réseau de Hopfield a cependant des limites bien connues : il ne peut stocker qu'environ 0,14 $n$ motifs avec $n$ le nombre de neurones. Des modèles ultérieurs, s'inspirant du réseau de Hopfield mais en modifiant les règles de stockage et d'accès, permettent d'agrandir cette limite de stockage^[5].

Voir aussi

Notes et références

↑ (en) J. J. Hopfield, « Neural networks and physical systems with emergent collective computational abilities », Proceedings of the National Academy of Sciences, vol. 79, n^o 8,‎ 1^er avril 1982, p. 2554–2558 (ISSN 0027-8424 et 1091-6490, PMID 6953413, DOI 10.1073/pnas.79.8.2554, lire en ligne, consulté le 24 octobre 2018)
↑ Par Tiernan Ray |, « EXCLUSIF : Yann LeCun (Meta) explore la frontière énergétique de l'apprentissage profond », sur ZDNet France (consulté le 13 avril 2023).
↑ Amos Storkey, Artificial Neural Networks – ICANN'97, vol. 1327, Springer, coll. « Lecture Notes en informatique », 1997, 451–6 p. (ISBN 978-3-540-69620-9, DOI 10.1007/BFb0020196, CiteSeer^x 10.1.1.33.103), « Augmenter capacité d'un réseau Hopfield sans sacrifier la fonctionnalité »
↑ A.J. Storkey et R. Valabregue, « Les bassins d'attraction d'une nouvelle règle d'apprentissage de Hopfield », Neural Networks, vol. 12, n^o 6,‎ 1999, p. 869–876 (PMID 12662662, DOI 10.1016/S0893-6080(99 )00038-6, CiteSeer^x 10.1.1.19.4681)
↑ Ala ABOUDIB, Vincent GRIPON et Xiaoran JIANG, « A study of retrieval algorithms of sparse messages in networks of neural cliques », COGNITIVE 2014 : the 6th International Conference on Advanced Cognitive Technologies and Applications,‎ mai 2014, p. 140–146 (lire en ligne, consulté le 24 octobre 2018).

Liens externes

Neural Lab - interface graphique en Python et Gtk permettant de manipuler un reseaux de hopfield

v · m

Apprentissage automatique et exploration de données

Problèmes

Apprentissage supervisé

Classement	Arbre de décision Boosting Forêts aléatoires k-NN U-matrix CRF HMM Modèle graphique
Régression	Régression linéaire Analyse discriminante linéaire Naive Bayes Régression logistique Machine à vecteurs de support ou SVM
Réseau de neurones artificiels (ANN)	Réseau récurrents (RNN) LSTM GRU Calcul par réservoir RBF Réseau bayésien à action directe (FFN) Apprentissage profond Perceptron Perceptron multicouche Réseau neuronal convolutif (CNN) TDNN Réseau de neurones à impulsions (SNN)

Apprentissage non supervisé

Clustering	Regroupement hiérarchique K-means Algorithme espérance-maximisation DBSCAN OPTICS
Réduction de dimensions	Analyse factorielle Analyse canonique des corrélations Analyse en composantes indépendantes ACP Sélection de caractéristique Extraction de caractéristique t-SNE
Réseau de neurones artificiels (ANN)	Réseau de Hopfield RBM Cartes de Kohonen