Unification

{{#ifeq:||Un article de Ziki, l'encyclopédie libre.|Une page de Ziki, l'encyclopédie libre.}}

Modèle:Voir homonymes

Fichier:Unification animation.gif
Unifier deux termes, c'est les rendre identiques en remplaçant les variables.

En informatique et en logique, l'unification est un processus algorithmique qui, étant donnés deux termes, trouve une substitution qui appliquée aux deux termes les rend identiques<ref name=":3">Modèle:Article</ref>. Par exemple, <math>x + 3</math> et <math>2 + y</math> peuvent être rendus identiques par la substitution <math>x := 2</math> et <math>y := 3</math>, qui donne quand on l'applique à chacun de ces termes le terme <math>2 + 3</math>. Dit autrement, l'unification est la résolution d'une équation dans l'algèbre des termes (unification syntaxique) ou dans une algèbre quotient par un ensemble d'identités (unification modulo une théorie) ; la solution de l'équation est la substitution qui rend les deux termes identiques et que l'on appelle l'unificateur. L'unification a des applications en inférence de types, programmation logique, en démonstration automatique de théorèmes, en système de réécriture, en traitement du langage naturel<ref name=":3" />.

Souvent, on s'intéresse à l'unification syntaxique où il faut que les termes obtenus par application de l'unificateur soient syntaxiquement égaux, comme dans l'exemple ci-dessus. Par exemple, le problème d'unification syntaxique ayant pour données <math>x + 3</math> et <math>5</math> n'a pas de solution<ref>Attention, <math>x := 2</math> n'est pas une solution car les termes <math>2 + 3</math> et <math>5</math> sont syntaxiquement différents.</ref>. Le filtrage par motif (ou pattern matching) est une restriction de l'unification où l'unificateur n'est appliquée qu'à un seul des deux termes. Par exemple, <math>x + 3</math> et <math>2 + 3</math> sont rendus égaux par la substitution <math>x := 2</math>.

La fin de l'article présente aussi l'unification modulo une théorie, qui est le cas où on dispose de connaissances supplémentaires sur les fonctions (par exemple, <math>+</math> est commutatif).

Histoire

Fichier:John Alan Robinson IMG 0493.jpg
John Alan Robinson, considéré comme le fondateur de l'unification.

Invention de la notion d'unification

Le premier chercheur à évoquer un algorithme d'unification est Jacques Herbrand dans sa thèse en 1930<ref>Modèle:Article</ref>. Il s'agit d'un algorithme non-déterministe pour unifier deux termes. Herbrand était intéressé par la résolution d'équations. En 1960, Prawitz et Voghera<ref>Modèle:Article</ref> ont généralisé le calcul propositionnel à des formules du premier ordre non instanciées, ou tout au moins en les instanciant a minima. L'unification a ensuite été redécouverte en 1963, mais l'article qui la décrit est publié seulement en 1965, par John Alan Robinson<ref>Modèle:Article</ref>,<ref>John Alan Robinson: Logic and Logic Programming. Commun. ACM 35(3): 40-65 (1992)</ref> dans le cadre de sa méthode de résolution en démonstration automatique. Selon Baader et Snyder<ref name=":4">Modèle:Ouvrage</ref>, c'est Knuth et Bendix<ref>Modèle:Ouvrage</ref>,<ref>Donald Knuth, All Questions Answered, 318. NOTICES OF THE AMS. VOLUME 49, NUMBER 3</ref>, en 1970, qui ont introduit le concept de "substitution la plus générale" dans leur travail sur la confluence locale d'un système de réécriture. Un an avant la publication de l'article de Robinson, soit en 1964, Guard a indépendamment étudié le problème d'unification sous le nom de matching<ref>Modèle:Article</ref>.

Course vers l'efficacité

L'algorithme originel de Robinson est inefficace car il s'exécute en temps exponentiel et demande une quantité de mémoire exponentielle. Robinson écrit alors une note en 1971 où il exhibe une représentation des termes plus concise<ref>Modèle:Lien web</ref>. L'algorithme utilise alors un espace mémoire polynomial. Boyer et Moore donnent aussi un algorithme qui utilise un espace mémoire polynomial en temps exponentiel dans le pire cas<ref>Modèle:Lien web</ref>. Venturini-Zilli introduit un système de marquage pour que l'algorithme de Robinson s'exécute en temps quadratique, dans le pire cas, en la taille des termes<ref>Modèle:Article</ref>. Huet travaille sur l'unification d'ordre supérieur et améliore le temps d'exécution de l'algorithme syntaxique du premier ordre : son algorithme est quasi linéaire<ref>Modèle:Ouvrage</ref>. D'autres chercheurs ont exhibé des algorithmes quasi linéaires<ref>Modèle:Article</ref>,<ref>Modèle:Lien web</ref>,<ref>Modèle:Ouvrage</ref>.

Une étape importante est ensuite la découverte d'algorithmes linéaires en 1976 par Martelli et Montanari<ref>Modèle:Article</ref>, Paterson et Wegman<ref>Modèle:Article</ref>,<ref name="sciencedirect 0022000078900430">Modèle:Lien web</ref> et HuetModèle:Référence nécessaire. Comme les articles de Paterson et Wegman sont courts, Dennis de Champeaux a réexpliqué l'idée de l'algorithme en 1986<ref name="sciencedirect 0022000078900430" />.

En 1982, Martelli et Montanari présentent un algorithme presque-linéaire mais plus efficace en pratique<ref name=":1">Modèle:Article</ref>.

En 1984, Dwork et al. démontrent que l'unification est P-complet<ref name=":2">Modèle:Article</ref>, ce qui signifie qu'a priori l'unification est difficile à paralléliser. Par opposition, le problème de filtrage par motif (pattern matching) est dans NC<ref name=":2" />, c'est-à-dire facile à paralléliser.

Prolog a aussi beaucoup contribué à sa popularisationModèle:Passage évasif. Des algorithmes spécifiques pour les termes de certaines théories, appelés aussi unification équationnelle (en particulier associative et commutative par Stickel) ont été proposés (voir ci-dessus).

Description

Problèmes d'unification

Un problème d'unification peut être présenté comme la donnée de deux termes, ou alors comme une équation, ou alors comme un ensemble de termes à unifier, ou alors comme un ensemble de couples de termes, ou alors comme un ensemble d'équations. Le problème d'unification <math>f(x,y) = f(a,g(x))</math> a une solution <math>x = a, y = g(a)</math> car substituer (i.e. remplacer) le terme <math>a</math> à la variable <math>x</math> et le terme <math>g(a)</math> à la variable <math>y</math>, dans les deux termes <math>f(x,y)</math> et <math>f(a,g(x))</math> donne le même terme <math>f(a,g(a))</math>. En revanche, le problème d'unification <math>f(x,y) = h(a,x)</math> n'a pas de solution et le problème d'unification <math>x = g(x)</math> non plus.

Solution principale

Un problème d'unification peut avoir une infinité de solutions. Par exemple, <math>f(a,x) = f(a,g(y))</math> a une infinité de solutions : <math>x = g(f(a,a)), y = f(a,a)</math>, <math>x = g(f(a,w)), y = f(a,w)</math>, <math>x = g(z), y = z</math>, etc. De toutes ces solutions, on exhibe des solutions dites principales car elles permettent de construire toutes les autres solutions : c'est le concept de solution principale, ou unificateur le plus général (most general unifier, mgu).

Tout d'abord, une solution <math>\sigma_2</math> d'un problème d'unification est dite plus générale qu'une solution <math>\sigma_1</math>, si <math>\sigma_1</math> est obtenue en substituant des termes à des variables dans <math>\sigma_2</math>. Par exemple, si on considère le problème d'unification <math>f(a,x) = f(a,g(y))</math>, alors la solution <math>\sigma_2 = (x = g(f(a,w)), y = f(a,w))</math> est plus générale que la solution <math>\sigma_1 = (x = g(f(a,a)), y = f(a,a))</math> qui est obtenue en substituant le terme <math>a</math> à la variable <math>w</math> dans <math>\sigma_2</math>. De même, la solution <math>\sigma_3 = (x = g(z), y = z)</math> est plus générale que la solution <math>\sigma_2</math>, qui est obtenue en substituant le terme <math>f(a,w)</math> à la variable <math>z</math> dans la solution <math>\sigma_3</math>.

Une solution <math>\sigma</math> d'un problème d'unification est dite principale si elle est plus générale que toutes les solutions de ce problème, c'est-à-dire si toute solution est obtenue en substituant des termes à des variables dans <math>\sigma</math>. Dans cet exemple, la solution <math>\sigma_3</math> est une solution principale du problème<math>f(a,x) = f(a,g(y))</math>.

Le théorème de la solution principale exprime que si un problème d'unification a une solution, alors il a une solution principale. Un algorithme d'unification calcule une solution principale ou échoue si les termes ne sont pas unifiables.

Exemples

La table suivante donne des exemples de problèmes d'unification. En plus, nous donnons aussi, dans la colonne de gauche, les exemples avec la syntaxe de Prolog : une variable commence par une majuscule, les constantes et symboles de fonction commencent par une minuscule. Pour les notations mathématiques, x,y,z sont des variables, , f,g sont des symboles de fonction et a,b sont des constantes.

Notation Prolog Notation mathématique Solution (principale) Explication
a = a { a = a } {} Réussit
a = b { a = b } échoue a et b sont des symboles de constantes différents.
X = X { x = x } {} Réussit
a = X { a = x } { xa } x est unifié avec la constante a
X = Y { x = y } { xy } x est unifié avec y
f(a,X) = f(a,b) { f(a,x) = f(a,b) } { xb } Les symboles de fonction sont les mêmes. x est unifié avec la constante b
f(a) = g(a) { f(a) = g(a) } échoue f et g sont des symboles de fonction différents
f(X) = f(Y) { f(x) = f(y) } { xy } x est unifié avec y
f(X) = g(Y) { f(x) = g(y) } échoue f et g sont des symboles de fonction différents
f(X) = f(Y,Z) { f(x) = f(y,z) } échoue Le symbole de fonction f est d'arité 1 dans la partie gauche et d'arité 2 dans la partie droite.
f(g(X)) = f(Y) { f(g(x)) = f(y) } { yg(x) } y est unifié avec g(x)
f(g(X),X) = f(Y,a) { f(g(x),x) = f(y,a) } { xa, yg(a) } x est unifié avec la constante a, et y est unifié avec g(a)
X = f(X) { x = f(x) } échoue échoue car x apparaît dans f(x). Le test d'appartenance de x dans le terme droit f(x) s'appelle occur check. Il existe des implémentations de Prolog où il n'y a pas d'occur check. Pour ces dernières, on unifie x avec le terme infini x=f(f(f(f(...)))).
X = Y, Y = a { x = y, y = a } { xa, ya } x et y sont unifiés avec la constante a
a = Y, X = Y { a = y, x = y } { xa, ya } x et y sont unifiés avec la constante a
X = a, b = X { x = a, b = x } échoue a sont b sont des symboles de constantes différents. x ne peut s'unifier avec les deux à la fois.

Applications

Filtrage par motif dans les langages de programmation

Modèle:Article détaillé Le filtrage par motif est la restriction de l'unification dans laquelle, dans chaque équation, les variables n'apparaissent que dans le terme de gauche. Par exemple, le problème<math>f(a,x) = f(a,g(b))</math>est un problème de filtrage, car le terme <math>f(a,g(b))</math> ne contient pas de variables. Le filtrage est utilisé dans les langages fonctionnels comme Haskell, Caml, LISP.

Dans le cas du filtrage, l'algorithme de Martelli et Montanari se simplifie.

On choisit une équation dans le système.

Si cette équation a la forme

<math>f(t_1,\ldots,t_n) = f(u_1,\ldots,u_n)</math>

on la remplace par les équations <math>t_1 = u_1</math>, ..., <math>t_n = u_n</math> et on résout le système obtenu.

Si cette équation a la forme

<math>f(t_1,\ldots,t_n) = g(u_1,\ldots,u_m)</math>

où <math>f</math> et <math>g</math> sont des symboles différents, on échoue.


Si cette équation a la forme

<math>x = t</math>

on substitue le terme <math>t</math> à la variable <math>x</math> dans le reste du système, on résout le système obtenu, ce qui donne une solution <math>\sigma</math> et on retourne la solution <math>\sigma, x = t</math>.

Programmation logique

Modèle:Section vide ou incomplète

L'unification est ce qui distingue le plus le langage de programmation Prolog des autres langages de programmation.

En Prolog, l’unification est associée au symbole « = » et ses règles sont les suivantes :

  1. une variable X non-instanciée (c'est-à-dire ne possédant pas encore de valeur) peut être unifiée avec une autre variable (instanciée ou pas); les deux variables deviennent alors simplement des synonymes l'une de l'autre et représenteront dorénavant le même objet (ou la même structure) ;
  2. une variable X non-instanciée peut être unifiée avec un terme ou un atome et représentera dorénavant ce terme ou atome ;
  3. un atome peut être unifié seulement avec lui-même ;
  4. un terme peut être unifié avec un autre terme : si leurs Modèle:Quoi sont identiques, si leur nombres d'arguments sont identiques et si chacun des arguments du premier terme est unifiable avec l'argument correspondant du second terme.

En raison de sa nature déclarative, l'ordre dans une suite d'unifications ne joue aucun rôle.

Algorithmes

Algorithme de Robinson

L'algorithme de Robinson de 1965 a été reformulé, par Corbin et Bidoit en 1983 <ref>Jacques Corbin, Michel Bidoit: A Rehabilitation of Robinson's Unification Algorithm. IFIP Congress 1983: 909-914</ref>, puis amélioré par Ruzicka et Prívara en 1989<ref>Peter Ruzicka, Igor Prívara: An Almost Linear Robinson Unification Algorithm. Acta Inf. 27(1): 61-71 (1989)</ref>, puis repris par Melvin Fitting en 1990 comme un algorithme non-déterministe<ref>Modèle:Ouvrage</ref>, présentation également reprise par Apt en 1996<ref>Modèle:Ouvrage</ref>. Nous présentons cette version également. L'algorithme prend en entrée deux termes t1 et t2 à unifier, donnés sous la forme de deux arbres. Il repose sur la notion de disagreement pair qui est la donnée d'un sous-terme de t1 et d'un sous-terme de t2, dont les nœuds dans les arbres de t1 et t2 sont à la même position depuis les racines mais avec des étiquettes différentes. Une telle disagreement pair est simple si l'un des sous-termes est une variable qui n'apparaît pas dans l'autre sous-terme. L'algorithme calcule une substitution, initialement vide. L'algorithme continue tant que la substitution ne rend pas les deux termes égaux. Il choisit de façon non-déterministe un disagreement pair. S'il n'est pas simple, l'algorithme échoue. Sinon, il enrichit la substitution.

Modèle:Boîte déroulante/début

entrée : deux termes t1, t2
sortie : vrai si les termes sont unifiables, non sinon
fonction unifier(t1, t2)
      σ := id
      tant que  σ(t1) différent de σ(t2)
                 choisir une disagreement pair (w, u)
                 si (w, u) est simple
                           soit γ la substitution donnée par (w, u)
                           σ := σγ
                sinon
                        retourner faux;     
     retourner vrai

Modèle:Boîte déroulante/fin

Algorithme de Martelli et Montanari

En 1982, Martelli et Montanari décrivent un algorithme sous la forme d'un ensemble de règles qui transforment un ensemble d'équations<ref name=":1" />. L'algorithme est présenté dans des ouvrages pédagogiques<ref>Alg.1, p.261. Leur règle (a) correspond à notre règle échanger, (b) à supprimer, (c) à décomposer et conflit, et (d) à éliminer et vérifier.</ref>,<ref>Modèle:Ouvrage</ref>,<ref name=":0" />. Il est similaire à l'algorithme proposé par Herbrand dans sa thèse<ref>Modèle:Ouvrage</ref>. Selon Baader et Snyder<ref>Modèle:Ouvrage</ref>, un algorithme sous la forme d'un ensemble de règles dégage les concepts essentiels et permet de démontrer la correction de plusieurs algorithmes pratiques en même temps.

On se donne un ensemble fini d'équations G = { s1t1, ..., sntn } où les si et ti sont des termes du premier ordre. L'objectif est de calculer une substitution la plus générale. On applique alors les règles suivantes à l'ensemble G jusqu'à épuisement :

G ∪ { tt } G supprimer
G ∪ { f(s1,...,sk) ≐ f(t1,...,tk) } G ∪ { s1t1, ..., sktk } décomposer
G ∪ { f(t⃗) ≐ x } G ∪ { xf(t⃗) } échanger
G ∪ { xt } G{xt} ∪ { xt } si xvars(t) et xvars(G) éliminer

La règle supprimer supprime une équation tt, c'est-à-dire où les termes de la partie gauche et de la partie droite sont les mêmes. La règle décomposer supprime une équation de la forme f(s1,...,sk) ≐ f(t1,...,tk) et la remplace par les équations s1t1, ..., sktk. La règle échanger oriente les équations pour que la variable x soit en partie gauche. En présence d'une équation xt où la variable x n'apparaît pas dans le terme t, la règle éliminer remplace les occurrences de x par t dans les autres équations.

Les règles suivantes sont également ajoutées en guise d'optimisation<ref name=":0">Modèle:Ouvrage</ref> :

G ∪ { f(s⃗) ≐ g(t⃗) } si fg or km conflit
G ∪ { xf(s⃗) } si xvars(f(s⃗)) vérifier (occurs-check)

Si l'ensemble contient une équation de la forme f(s⃗) ≐ g(t⃗) où f et g ne sont pas les mêmes symboles de fonctions ou alors si les nombres d'arguments ne sont pas les mêmes (km) la règle conflit fait échouer le processus d'unification. La règle vérifier (occurs-check), quant à elle, fait échouer l'unification si l'ensemble contient une équation xf(s⃗) où x apparaît dans f(s⃗).

L'algorithme est en temps exponentiel et demande un espace mémoire au plus exponentiel si l'on représente les termes par leurs arbres syntaxiques. Néanmoins, on peut n'utiliser qu'un espace mémoire linéaire si on représente les termes par des graphes.

Améliorations de l'algorithme de Robinson

Implémentation avec des graphes

Fichier:Unification dag exemple.svg
L'algorithme d'unification prend en entrée deux termes représentés par des graphes, ici f(x, g(x, x)) et f(h(y), g(z, h(1))). En sortie, une substitution la plus générale est représentée par des pointeurs (en bleu).

En implémentant l'algorithme avec des graphes, l'espace mémoire est linéaire en la taille de l'entrée même si le temps reste exponentiel dans le pire des cas. L'algorithme prend en entrée deux termes sous la forme de graphes, c'est-à-dire un graphe acyclique où les nœuds sont les sous-termes. En particulier, il y a un unique nœud par variables (cf. figure à droite). L'algorithme retourne en sortie une substitution la plus générale : elle est écrite en place dans le graphe représentant les termes à l'aide de pointeurs (en bleu dans la figure à droite). c'est-à-dire, en plus du graphe décrivant la structure des termes (qui sont des pointeurs aussi), nous avons des pointeurs particuliers pour représenter la substitution. Par exemple si x := h(1) est la substitution courante, x pointe vers le nœud correspondant au terme h(1).


Modèle:Boîte déroulante/début

entrée : deux termes t1, t2
sortie : vrai si les termes sont unifiables, non sinon
fonction unifier(t1, t2)
      t1 = find(t1);
      t2 = find(t2);
      si t1 = t2
              retourner vrai;
      sinon etude de cas sur (t1, t2)
                (x, y):
                        faire pointer x vers y
                        retourner vrai;
                (x, t) ou (t, x):
                        si x apparaît dans t
                               retourner faux
                        sinon
                               faire pointer x vers t
                               retourner vrai;
               (f(L), g(M)):
                          si f = g
                                       retourner unifierlistes(L, M)
                          sinon
                                       retourner faux

où unifierListes unifient les termes de deux listes :

entrée : deux listes de termes L, M
sortie : vrai si les termes des listes sont deux à deux sont unifiables, non sinon
fonction unifierlistes(L, M)
            etude de cas sur (L, M)
                       ([], []): retourner vrai;
                       ([], t::t') ou (t::t', []): retourner faux;
                       (s::L', t::M'):
                                   si unifier(s, t)
                                             retourner unifierlistes(L', M')
                                   sinon
                                             retourner faux

où find trouve la fin d'une chaîne :

entrée : un terme t
sortie : le terme en bout de chaîne de t
fonction find(t)
         si t n'est pas une variable
                    retourner t
         sinon
                    si t est déjà assigné à un terme u
                           retourner find(u)
                    sinon
                           retourner t

et où une implémentation naïve de "x apparaît dans t" est donné par :

entrée : une variable x et un terme t
sortie : vrai si la variable x apparaît dans le terme t, non sinon
fonction apparaîtdans(x, t)
          etude de cas sur t
                    y: retourner x = y
                    f(L): retourner apparaîtdansliste(x, L)

entrée : une variable x et une liste de termes L
sortie : vrai si la variable x apparaît dans l'un des termes de L, non sinon
fonction apparaîtdansliste(x, L)
         etude de cas sur L
                   []: retourner faux
                   t::L':
                            si apparaîtdans(x, find(t))
                                         retourner vrai
                            sinon
                                         retourner apparaîtdansliste(x, L')

Modèle:Boîte déroulante/fin

Algorithme quadratique

L'algorithme présenté dans cette sous-section est dû à Corbin et Bidoit (1983)<ref>Modèle:Article</ref>. Pour avoir une complexité quadratique, il y a deux améliorations de l'algorithme précédent.

Tester qu'une variable apparaît dans un sous-terme
Fichier:Unification dag exemple quadratique.svg
Le graphe des deux termes avec les pointeurs en bleu.

L'implémentation pour tester si une variable x apparaît dans un sous-terme t est a priori en temps exponentiel. L'idée est d'éviter de parcourir plusieurs fois les mêmes nœuds. On marque les nœuds visités comme dans un parcours en profondeur de graphe. Une fois un test d'appartenance effectué, il faut a priori démarquer les nœuds. Au lieu de cela, on les marque avec le "temps actuel". On ajoute alors un champ aux nœuds du graphe que l'on appelle poinçon qui contient le "temps actuel". Nous disposons d'une variable globale "temps actuel" qui est incrémenté à chaque test d'appartenance.


Modèle:Boîte déroulante/début

entrée : une variable x et un terme t
sortie : vrai si la variable x apparaît dans le terme t, non sinon
fonction apparaîtdans(x, t)
               temps actuel := temps actuel + 1
               retourner apparaîtdans'(x, t)

entrée : une variable x et un terme t
sortie : vrai si la variable x apparaît dans le terme t, non sinon (ne change pas le temps)
fonction apparaîtdans'(x, t)
          etude de cas sur t
                    y: retourner x = y
                    f(s):
                                  si f(s) est poinçonné au temps actuel
                                              retourner faux
                                  sinon
                                              poinçonner f(s) au temps actuel
                                              retourner apparaîtdansliste(x, s)

entrée : une variable x et une liste de termes L
sortie : vrai si la variable x apparaît dans l'un des termes de t, non sinon
fonction apparaîtdansliste(x, L)
         etude de cas sur t
                   []: retourner faux
                   t::L':
                            si apparaîtdans'(x, find(t))
                                         retourner vrai
                            sinon
                                         retourner apparaîtdansliste(x, L')


Modèle:Boîte déroulante/fin

Éviter des appels inutiles à unifier

Pour éviter des appels inutiles à la procédure qui cherche à unifier deux termes, on utilise des pointeurs pour tous les nœuds et pas seulement les variables. On peut montrer que le nombre d'appels à la procédure qui unifie est O(|A|) où |A| est le nombre d'arcs dans le graphe. Le traitement interne utilise un parcours de pointeurs "find" en O(|S|) où |S| est le nombre de sommets et un test d'appartenance d'une variable dans un terme qui est en O(|S|+|A|) = O(|A|) car le graphe est connexe. Donc l'algorithme est bien quadratique.



Modèle:Boîte déroulante/début

entrée : un terme t
sortie : le terme en bout de chaîne de t
fonction find(t)
            si t pointe vers un terme u
                   retourner find(u)
            sinon
                   retourner t

et

entrée : deux termes t1, t2
sortie : vrai si les termes sont unifiables, non sinon
fonction unifier(t1, t2)
      t1 = find(t1);
      t2 = find(t2);
      si t1 = t2
              retourner vrai;
      sinon etude de cas sur (t1, t2)
                (x, y):
                        faire pointer x vers y
                        retourner vrai;
                (x, t) ou (t, x):
                        si x apparaît dans t
                               retourner faux
                        sinon
                               faire pointer x vers t
                               retourner vrai;
               (f(L), g(M)):
                          si f = g
                                       Modèle:Souligner
                                       retourner unifierlistes(L, M)
                          sinon
                                       retourner faux

Modèle:Boîte déroulante/fin

Algorithme quasi linéaire

L'algorithme<ref name=":0" /> est inspiré de l'algorithme quadratique de la section précédente. Le test de savoir si x apparaît dans t n'est plus effectué au cours de l'algorithme mais uniquement à la fin : à la fin, on vérifie que le graphe est acyclique. Enfin, les pointeurs de la substitution et "find" sont implémentés à l'aide d'une structure de données Union-find. Plus précisément, on conserve les pointeurs dans la structure mais on dispose en plus une structure annexe Union-find. Dans la structure de données Union-find, les classes d'équivalence ne contiennent soit que des variables soit que des termes complexes. Pour passer d'une variable à un terme complexe, on utilise les pointeurs éventuels qui sont dans le graphe.


Modèle:Boîte déroulante/début

entrée : deux termes t1, t2
sortie : vrai si les termes sont unifiables ou que le graphe final est acyclique, non sinon
fonction unifier(t1, t2)
      t1 = find(t1);
      t2 = find(t2);
      si t1 = t2
              retourner vrai;
      sinon etude de cas sur (t1, t2)
                (x, y):
                        Union(x, y)
                        retourner vrai;
                (x, t) ou (t, x):
                        si x apparaît dans t
                               retourner faux
                        sinon
                               faire pointer x vers t
                               retourner vrai;
               (f(L), g(M)):
                          si f = g
                                       Union(f(L), g(M))
                                       retourner unifierlistes(L, M)
                          sinon
                                       retourner faux

Modèle:Boîte déroulante/fin

Construction de graphes à partir d'arbres

Pour construire un graphe à partir d'un arbre, on parcourt l'arbre et on utilise une table de symboles (implémenté avec une table de hachage ou un arbre binaire de recherche) pour les variables car il faut garantir l'unicité du nœud x pour une variable x.

Unification modulo une théorie

L'unification modulo une théorie, aussi appelée (unification équationnelle, E-unification, unification dans une théorie) est l'extension de l'unification syntaxique dans les cas où les opérateurs sont assujettis à des axiomes, formant une théorie E. Généralement cette théorie est décrite par un ensemble d'égalités universelles. Par exemple, une théorie E peut contenir l'identité <math>u * v = v * u</math> où les variables <math>u</math> et <math>v</math> sont implicitement quantifiées universellement et qui dit que l'opérateur <math>*</math> est commutatif. Dès lors, bien que les termes <math>x * a</math> et <math>y*b</math> ne soient pas syntaxiquement unifiables, ils sont E-unifiables :

<math>x * a</math> {xb, ya}
= <math>b * a</math> en appliquant la substitution
= <math>a * b</math> car <math>*</math> est commutatif.
= <math>y * b</math> {xb, ya} en appliquant la substitution

Exemple de théories E

Conventions de nommages des propriétés
u,v,w u*(v*w) = (u*v)*w Modèle:Mvar Associativité de *
u,v u*v = v*u Modèle:Mvar Commutativité de *
u,v,w u*(v+w) = u*v+u*w Modèle:Mvar Distributivité gauche de * sur +
u,v,w: (v+w)*u = v*u+w*u Modèle:Mvar Distributivité droite de * sur +
u: u*u = u I Idempotence de *
u: n*u = u Modèle:Mvar n est élément neutre gauche de *
u: u*n = u     Modèle:Mvar     n est élément neutre droit de *

L'E-unification est décidable pour une théorie E s'il existe un algorithme pour cette théorie qui termine sur chaque entrée et résout le problème d'E-unification. Il est semi-décidable s'il existe un algorithme qui se termine pour les entrées qui ont une solution et qui peut boucler pour des équations sans solution.

L'E-unification est décidable pour les théories suivantes :

L'E-unification est semi-decidable pour les théories suivantes :

  • Modèle:Mvar,Modèle:MvarModèle:MvarModèle:Mvar<ref>P. Szabo, Unifikationstheorie erster Ordnung (First Order Unification Theory), Thesis, Univ. Karlsruhe, West Germany, 1982</ref>
  • Modèle:Mvar,Modèle:Mvar,Modèle:Mvar<ref name="LRequivC" />,<ref>Jörg H. Siekmann, Universal Unification, Proc. 7th Int. Conf. on Automated Deduction, Springer LNCS vol.170, pp. 1–42, 1984</ref>
  • Anneaux commutatifs<ref name="Baader and Snyder 2001, p. 486" />

Unification et logique d'ordre supérieur

Si on se place en logique d'ordre supérieur, c'est-à-dire si on s'autorise à utiliser des variables comme symboles de fonction ou comme prédicats, on perd la décidabilité et l'unicité de l'unificateur quand il existe. Au pire, deux termes peuvent même avoir une infinité d'unificateurs tous différents, dans le sens suivant: soit t et deux termes qu'on veut unifier, il peut exister un ensemble infini U d'unificateurs de t et tel que si σ et ρ sont dans U, alors σ n'est pas plus général que ρ et ρ n'est pas plus général que σ.

Liens externes

Notes et références

Modèle:Références

Article lié

Modèle:Autres projets Modèle:Portail