Équilibre corrélé — Wikipédia

En théorie des jeux, la notion d’équilibre corrélé est un concept de solution proposée pour la première fois en 1974 par le mathématicien Robert Aumann. Il généralise le concept d'équilibre de Nash. L'équilibre corrélé suppose l'existence d'un dispositif externe de corrélation, par exemple un "maître du jeu" auquel tous les joueurs font confiance. Celui-ci affecte leurs stratégies aux différents joueurs suivant une certaine loi de probabilité. Cette loi est un équilibre corrélé lorsque, quelles que soient les stratégies attribuées aux joueurs, aucun joueur n'aura intérêt à changer sa stratégie (connaissant ainsi que la loi de probabilité suivie par le dispositif).

Définition formelle[modifier | modifier le code]

Considérons un jeu à joueurs où chaque joueur choisit sa stratégie dans un ensemble . La valeur reçue par le joueur est notée , où désigne la stratégie du joueur tandis que désigne les stratégies de tous les autres joueurs. Par exemple, sous forme vectorielle, pour , et . La notation permet de se référer facilement à la stratégie voisine où tous les joueurs conservent la même stratégie à l'exception du joueur qui remplace sa strategie par .

Soit une loi de probabilité sur les vecteurs de stratégies  : désigne la probabilité du vecteur , que l'on écrira de manière équivalente lorsqu'on s'intéressera au joueur . On dit que la loi de probabilité est un équilibre corrélé lorsque, pour tout joueur et toute stratégie , on a la relation :

En français, ceci se lit : « sachant que le joueur s'est vu attribuer la stratégie , il ne peut obtenir en moyenne de valeur perçue plus grande en optant pour une autre stratégie . »

La moyenne en question correspond à l'espérance de sur les stratégies des autres joueurs, distribuées selon la loi conditionnée par l'événement « le joueur a reçu la stratégie  ». En d'autres termes, le raisonnement présente deux étapes : les joueurs reçoivent d'abord leurs stratégies, puis envisagent d'améliorer leurs valeurs moyennes en supposant que les autres ne changent pas de tactique. S'il n'y a d'amélioration possible pour aucun joueur, on a un équilibre corrélé.

Exemple[modifier | modifier le code]

Jeu de la poule mouillée, en forme normale.
Oser (O) Renoncer (R)
Oser (O) 0, 0 7, 2
Renoncer (R) 2, 7 6, 6

Considérons le jeu de la poule mouillée représenté ci-contre : deux joueurs s'affrontent, chacun ayant le choix entre deux stratégies, oser (O) ou renoncer (R). Si l'un ose, l'autre a tout intérêt à renoncer, et symétriquement, si l'un renonce, l'autre a tout intérêt à oser. Ce jeu représente donc une situation où chacun souhaite oser, mais seulement si son adversaire est susceptible d'abandonner.

Il y a trois équilibres de Nash : deux équilibres purs, et , ainsi qu'un équilibre mixte où chaque joueur ose avec probabilité .

Supposons maintenant l'existence d'un arbitre choisissant uniformément un couple de stratégies parmi , et . Une fois le couple choisi, l'arbitre informe chaque joueur de sa stratégie (mais pas de la stratégie de son adversaire). Deux situations se présentent alors :

  • Imaginons qu'un joueur reçoive  : il sait alors que son adversaire a reçu et n'a pas intérêt à revenir sur sa stratégie.
  • Imaginons qu'un joueur reçoive  : dans ce cas, son adversaire jouera avec probabilité et sinon; la valeur moyenne perçue par le joueur s'il conserve la stratégie est alors , tandis que s'il décide de jouer plutôt cette moyenne ne sera que de .

En définitive, aucun joueur n'a intérêt à revenir sur la stratégie que lui suggère l'arbitre : il y a équilibre corrélé. On remarquera que la valeur moyenne perçue dans cet équilibre est alors , soit plus que celle obtenue avec l'équilibre de Nash mixte.

Lien avec les équilibres de Nash[modifier | modifier le code]

Lorsque est la loi produit induite par stratégies mixtes , i.e. , un équilibre corrélé est exactement un équilibre de Nash. En effet, la relation d'équilibre devient alors (après division par )

C'est-à-dire que le mouvement est une réponse optimale aux stratégies (mixtes) des adversaires (les équilibres de Nash mixtes sont exactement les combinaisons convexes de réponses optimales[1]).

Ainsi, un équilibre de Nash est un cas particulier d'équilibre corrélé où la loi est une loi produit (i.e. décorrélée).

Extension[modifier | modifier le code]

La notion a été étendue pour les jeux en forme normale extensive par Bernard von Stengel et François Forges en 2008[2].

Bibliographie[modifier | modifier le code]

Références[modifier | modifier le code]

  1. (Nisan et al. 2007) (chapitre 2)
  2. Bernhard von Stengel et Françoise Forges, Extensive-Form Correlated Equilibrium : Definition and Computational Complexity, (lire en ligne)