Propagation de contraintes
La propagation de contraintes dans le domaine de la programmation par contraintes est le fait de réduire le domaine d'une variable afin de maintenir l'ensemble des valeurs possibles cohérent avec les contraintes du problème. La propagation de contraintes permet ainsi de résoudre un problème si la propagation permet d'établir la cohérence du problème. Les techniques de propagation de contraintes sont utilisées pour réduire la taille de l'espace de recherche lors de la résolution d'un problème de satisfaction de contraintes par un algorithme de recherche arborescente.
Cohérence d'arcs (arc consistency)
La propagation de contraintes consiste à modifier (i.e. réduire) le domaine des variables impliquées dans une contrainte, dans le but de rétablir la cohérence. Plusieurs types de cohérences, plus ou moins fortes peuvent être considérées.
La cohérence d'arcs est définie ainsi :
- Une contrainte binaire <math>C(x, y)</math> est cohérente par arc (abrégé en AC pour arc consistent) si pour toute valeur du domaine de <math>x</math>, il existe au moins une valeur du domaine de <math>y</math> telle que la contrainte soit satisfaite, et vice-versa. La description symbolique de la cohérence par arc d'une contrainte est : <math display="block">AC(C_{x, y}) = \forall x_i \in D_x, \exists y_j \in D_y, C_{x, y}(x_i, y_j)</math> où <math>D_x</math> et <math>D_y</math>désignent respectivement les domaines de <math>x</math> et de <math>y</math>.
- La cohérence d'arcs d'un problème est satisfaite si chaque contrainte binaire est cohérente par arc.
Une généralisation de la cohérence d'arcs pour les contraintes sur plus de deux variables est décrite en termes de cohérence d'hyperarcs ou cohérence d'arcs généralisée.
Exemple
Soit le CSP <math>\mathcal{P}</math> défini par les variables <math>x, y, z \in \{1, 2\}</math> avec les contraintes suivantes :
- <math>x \neq y</math> <math>(c_1)</math>
- <math>y \neq z</math> <math>(c_2)</math>
- <math>x \neq z</math> <math>(c_3)</math>
Pour chacune des valeurs du domaine de <math>x</math>, il existe une valeur du domaine de <math>y</math> qui satisfait la contrainte <math>c_1</math>. En effet, pour <math>x=1</math> (resp. <math>2</math>), l'instanciation <math>y=2</math> (resp. <math>1</math>) satisfait la contrainte <math>c_1</math>. La contrainte <math>c_1</math> est donc cohérente par arc. De la même façon <math>c_2</math> et <math>c_3</math> sont cohérentes par arc.
On s'aperçoit ainsi qu'il ne suffit pas qu'un problème soit AC pour admettre une solution. Ce point est en fait fondamental : on peut montrer que les algorithmes de rétablissement de la cohérence par arcs (dans le cas des contraintes binaires) ont une complexité temporelle polynomiale, alors qu'en règle générale, les algorithmes de rétablissement de la cohérence complète ont une complexité temporelle exponentielle.
AC3
- Soit la contrainte <math>C_{i, j}</math>
- <math>x</math> parcourant toutes les valeurs possibles de la première variable <math>V_i</math>
- <math>y</math> parcourant toutes les valeurs possibles de la seconde variable <math>V_j</math>
- Si, pour un <math>x</math> donné, <math>(x, y)</math> viole <math>C_{i, j}</math> pour toutes les valeurs <math>y</math> de la variable <math>V_j</math>, alors enlever <math>x</math> du domaine de la variable <math>V_i</math>.
- Si une valeur <math>x</math> a été enlevée de <math>V_i</math>, répéter ces vérifications pour toutes les contraintes impliquant la variable <math>V_i</math>
Cet algorithme nécessite donc de gérer une pile comprenant les variables dont le domaine est modifié.
On peut montrer que si <math>m</math> est la taille maxi des domaines des variables et <math>n</math> le nombre de contraintes, alors :
- Une contrainte <math>C_{i, j}</math> est examinée au plus <math>m</math> fois (car une contrainte est examinée à cause de la suppression d'une valeur dans le domaine de sa première variable, et qu'on ne peut pas supprimer plus de <math>m</math> valeurs du domaine).
- Il y a donc au plus <math>m\times n</math> examens de contraintes
- Chaque examen de contrainte nécessite <math>m^2</math> vérifications.
- L'algorithme a donc une complexité en <math>O(nm^3)</math>.
AC2001
Cet algorithme est une optimisation de AC3. Dans AC3, le fait de faire parcourir tout le domaine de <math>V_i</math> par x est inefficace lors de l'examen d'une contrainte qui a déjà été examinée. Si dans une étape précédente, la vérification a déjà été faite pour une valeur x et qu'elle n'a pas trouvé de violation, il est intéressant de conserver cette information. Lors d'une vérification ultérieure, il faut commencer la vérification par la valeur suivante de <math>V_i</math>.
On peut montrer que cet algorithme a une complexité temporelle en <math>O( n m^2 )</math> dans le pire des cas et une complexité spatiale en <math>O( n m )</math>. Ça en fait l'algorithme le plus performant à l'heure actuelle<ref>An Optimal Coarse-grained Arc Consistency Algorithm, Bessiere et als, 2005 (description de AC-2001/3.1)</ref>.
Utilisation de la sémantique de la contrainte
Les algorithmes AC3 ou AC2001 sont adaptés aux contraintes qui ne sont définies que par la donnée des valeurs violant la contrainte. Cependant dans la majorité des problèmes concrets à résoudre, les contraintes sont définies par une expression symbolique : on définit une contrainte de différence sur [1..3] × [1..2] par <math>V_1 \neq V_2</math> plutôt que par la donnée des couples interdits : (1,1) et (2,2) et des couples autorisés : (1,2) (1,3) (2,1) (3,1).
En pratique, les systèmes de résolution des problèmes de PPC offrent par défaut un algorithme de type AC3 ou AC2001 pour les contraintes définies par des ensembles de valeurs permises et interdites (contraintes tabulaires), et une bibliothèque de contraintes particulières fournies avec leur algorithme efficace de propagation. De tels systèmes offrent également le moyen de combiner des contraintes entre elles et de les propager efficacement (par exemple : Et(C1,C2) se propage en propageant à la fois C1 et C2 ; Ou(C1,C2) se propage en ne propageant C2 que lorsqu'il devient certain que C1 ne sera pas satisfaite et réciproquement).
Cohérence de nœud
Elle consiste à ne considérer qu'une seule variable. On retire alors toutes les valeurs pour lesquelles au moins une contrainte est impossible à satisfaire. Ce filtrage est très rapide, mais peu efficace (étant donné qu'on ne considère aucune autre variable impliquée dans la contrainte).
Cohérence d'hyperarcs
Aussi appelée hyperarc consistency (HAC), c'est une généralisation de la cohérence d'arcs pour les contraintes non binaires. Elle a aussi été appelée cohérence d'arcs généralisée (GAC). Le principe est le même que pour les contraintes binaires : une contrainte est HAC si et seulement si chaque valeur de chaque variable appartient à une solution de la contrainte. On établit la cohérence d'hyperarcs en supprimant toutes les valeurs qui ne satisfont pas cette propriété.
Par exemple, la contrainte Alldiff implique que les variables sur lesquelles elle est définie prennent des valeurs deux à deux différentes. On sait établir efficacement la cohérence par hyperarc de cette contrainte.
k-cohérence
Elle consiste à considérer <math>k</math> variables, et à tester tous les <math>k</math>-uplets de valeurs possibles afin de tester s'ils ne violent pas les contraintes. Plus <math>k</math> est grand, plus le filtrage sera efficace. Cependant, du fait du grand nombre de combinaisons à tester, cela reste souvent trop lourd. La 3-cohérence donne de bons résultats, cependant du fait de la complexité de son implémentation, elle n'est que très rarement présente dans des solveurs de contraintes.
La 2-cohérence est en fait une autre expression de la cohérence d'arcs. Si un problème contient <math>n</math> variables, alors la <math>n</math>-cohérence consisterait à tester l'ensemble des possibilités.
Cohérence de bornes
Lorsque les domaines des variables sont trop grands (plusieurs milliers d'éléments), le fait de stocker l'appartenance ou non de chaque valeur au domaine de la variable peut se révéler trop lourd à traiter. On utilise dans ce cas la consistance de bornes, qui consiste à simplement raisonner sur les valeurs minimum et maximum que les variables peuvent prendre. Pour certaines contraintes, comme par exemple celles d'inégalités (<math>X < Y</math>), la cohérence de bornes est très proche, voire équivalente, à la cohérence d'arcs.
Notes et références
<references />