Algorithme de Conway

En informatique théorique, l'algorithme de Conway est un algorithme, en théorie des automates, qui calcule une expression rationnelle pour le langage accepté par un automate fini. Cet algorithme est décrit par John Horton Conway dans son livre Regular Algebra and Finite Machines[1]. L'algorithme fait donc partie, avec l'algorithme de McNaughton et Yamada et la méthode de Brzozowski et McCluskey, des méthodes visant à donner une expression rationnelle pour un automate fini donné.

Principe

L'algorithme part d'une matrice contenant les transitions de l’automate. Le langage reconnu par l'automate est une union des coefficients de l'étoile de Kleene de la matrice. La particularité de l’algorithme de Conway est de calculer l'étoile de Kleene récursivement par une partition en blocs de la matrice. Dans le cas particulier où la partition consiste à choisir un bloc de taille 1, la méthode revient à l'élimination des états par le lemme d'Arden.

Description

Matrice de l'automate

Étant donné un automate fini, on suppose les états numérotés de 1 {\displaystyle 1} à n {\displaystyle n} , où n {\displaystyle n} est le nombre d'états. On définit une matrice carrée M d'ordre n, dont les coefficients sont des ensembles finis de lettres : le coefficient M p , q {\displaystyle M_{p,q}} d'indices p {\displaystyle p} et q {\displaystyle q} est l'ensemble des étiquettes des transitions de p {\displaystyle p} à q {\displaystyle q} dans l'automate :

M p , q = { a A ( p , a , q ) δ } {\displaystyle M_{p,q}=\{a\in A\mid (p,a,q)\in \delta \}}

A {\displaystyle A} est l’alphabet et δ {\displaystyle \delta } est l’ensemble des transitions de l'automate. La matrice M {\displaystyle M} peut être élevée au carré par la formule usuelle : M p , q 2 = 1 r n M p , r M r , q {\displaystyle M_{p,q}^{2}=\bigcup _{1\leq r\leq n}M_{p,r}M_{r,q}} . Les coefficients sont des ensembles de mots de longueur 2 {\displaystyle 2} . Plus généralement, on note M k {\displaystyle M^{k}} la k {\displaystyle k} -ième puissance de la matrice M {\displaystyle M}  : ses coefficients sont des ensembles de mots de longueur k {\displaystyle k} , et le coefficient d'indice p {\displaystyle p} et q {\displaystyle q} est formé des mots de longueur k {\displaystyle k} qui étiquettent des chemins de p {\displaystyle p} à q {\displaystyle q} . Il en résulte que la matrice M = k 0 M k {\displaystyle M^{*}=\bigcup _{k\geq 0}M^{k}} a la propriété que son coefficient d'indice p, q est l'ensemble des mots qui sont des étiquettes de chemins de p à q. Le langage L reconnu par l’automate est donc L = i I t T M i , t {\displaystyle L=\bigcup _{i\in I}\bigcup _{t\in T}M_{i,t}^{*}} I {\displaystyle I} et T {\displaystyle T} sont les ensembles d'états initiaux et terminaux de l’automate. Les coefficients de ces matrices peuvent être vus comme des expressions rationnelles sur A {\displaystyle A} .

Exemple
Un automate à états.

Pour l'automate à deux états de la figure, la matrice s'écrit

M = ( a b 0 b ) {\displaystyle M={\begin{pmatrix}a&b\\0&b\end{pmatrix}}} .

On a

M 2 = ( a a a b + b b 0 b b ) {\displaystyle M^{2}={\begin{pmatrix}aa&ab+bb\\0&bb\end{pmatrix}}} .

Les expressions pour M {\displaystyle M^{*}} sont

M = ( a a b b 0 b ) {\displaystyle M^{*}={\begin{pmatrix}a^{*}&a^{*}bb^{*}\\0&b^{*}\end{pmatrix}}}

Comme I {\displaystyle I} ={1} et T {\displaystyle T} ={1,2}, on a L = a b b + a = a b {\displaystyle L=a^{*}bb^{*}+a^{*}=a^{*}b^{*}}

Calcul de Conway

La méthode repose sur la formule suivante [2]:

Si M = ( A B C D ) {\displaystyle M={\begin{pmatrix}A&B\\C&D\end{pmatrix}}} , avec A {\displaystyle A} et D {\displaystyle D} des matrices carrées, alors

M = ( ( A + B D C ) A B ( D + C A B ) D C ( A + B D C ) ( D + C A B ) ) {\displaystyle M^{*}={\begin{pmatrix}(A+BD^{*}C)^{*}&A^{*}B(D+CA^{*}B)^{*}\\D^{*}C(A+BD^{*}C)^{*}&(D+CA^{*}B)^{*}\end{pmatrix}}}

On peut interpréter cette formule en considérant le graphe de l'automate. Quand ses états sont partitionnés en deux classes, la sous-matrice A {\displaystyle A} correspond aux arcs qui joignent deux éléments de la première classe, B {\displaystyle B} aux arcs de la première vers la deuxième classe, de même C {\displaystyle C} aux arcs de la deuxième vers la première, et enfin D {\displaystyle D} aux arcs entre deux états de la deuxième. L'expression ( A + B D C ) {\displaystyle (A+BD^{*}C)^{*}} décrit les chemins d'un élément de la première classe vers elle-même : ils se décomposent en sous-chemins qui sont soit un arc dans A {\displaystyle A} , soit d'un chemin qui quitte la première classe, chemine dans la deuxième classe, puis revient vers la première; ceci est décrit par la formule B D C {\displaystyle BD^{*}C} . Le tout peut être répété autant de fois qu'il faut.

La matrice de l’étoile se calcule plus aisément en calculant d'abord les sous-expressions U = ( A + B D C ) {\displaystyle U=(A+BD^{*}C)^{*}} et V = ( D + C A B ) {\displaystyle V=(D+CA^{*}B)^{*}} . La matrice M {\displaystyle M^{*}} s'écrit alors

M = ( U A B V D C U V ) {\displaystyle M^{*}={\begin{pmatrix}U&A^{*}BV\\D^{*}CU&V\end{pmatrix}}} .
Exemple

Reprenons l'automate précédent à deux états, la matrice s'écrit

M = ( a b 0 b ) {\displaystyle M={\begin{pmatrix}a&b\\0&b\end{pmatrix}}} .

Les expressions U et V sont respectivement U = a {\displaystyle U=a^{*}} et V = b {\displaystyle V=b^{*}} parce que C {\displaystyle C} est l'expression vide. Il en résulte que

M = ( a a b b 0 b ) {\displaystyle M^{*}={\begin{pmatrix}a^{*}&a^{*}bb^{*}\\0&b^{*}\end{pmatrix}}}

comme dans le calcul précédent.

Relation avec les autres méthodes

La méthode d'élimination ou méthode de Gauss revient à partitionner les états en deux classes particulières, la classe {1, etc., n-1} et la classe composée de {n}. En revanche, il ne semble pas avoir de lien avec l'algorithme de McNaughton et Yamada.[réf. nécessaire]

Notes et références

  1. Conway 1971.
  2. Conway 1971, Chapitre 3. Kleene's theory of regular event and expressions, Theorem 4, p. 27-28.

Bibliographie

  • John H. Conway, Regular Algebra and Finite Machines, Londres, Chapman and Hall, (lire en ligne) — réimpression : Dover Publications, 2012, (ISBN 978-0486485836).

Articles liés

  • icône décorative Portail de l'informatique théorique