Équilibre corrélé — Wikipédia

En théorie des jeux, la notion d’équilibre corrélé est un concept de solution proposée pour la première fois en 1974 par le mathématicien Robert Aumann. Il généralise le concept d'équilibre de Nash. L'équilibre corrélé suppose l'existence d'un dispositif externe de corrélation, par exemple un "maître du jeu" auquel tous les joueurs font confiance. Celui-ci affecte leurs stratégies aux différents joueurs suivant une certaine loi de probabilité. Cette loi est un équilibre corrélé lorsque, quelles que soient les stratégies $\{s_{i}\}$ attribuées aux joueurs, aucun joueur $i$ n'aura intérêt à changer sa stratégie (connaissant $s_{i}$ ainsi que la loi de probabilité suivie par le dispositif).

Définition formelle[modifier | modifier le code]

Considérons un jeu à $n$ joueurs où chaque joueur $i$ choisit sa stratégie dans un ensemble $S_{i}$ . La valeur reçue par le joueur $i$ est notée $\displaystyle v_{i}(s_{i},s_{-i})$ , où $s_{i}\in S_{i}$ désigne la stratégie du joueur $i$ tandis que $s_{-i}\in \prod _{j\neq i}S_{j}$ désigne les stratégies de tous les autres joueurs. Par exemple, sous forme vectorielle, pour $s=(1,2,3)$ , $s_{2}=2$ et $s_{-2}=(1,3)$ . La notation $s=(s_{i},s_{-i})$ permet de se référer facilement à la stratégie voisine $s'=(s'_{i},s_{-i})$ où tous les joueurs conservent la même stratégie à l'exception du joueur $i$ qui remplace sa strategie $s_{i}$ par $s'_{i}$ .

Soit une loi de probabilité $p$ sur les vecteurs de stratégies $s\in \prod _{i}S_{i}$ : $p(s)$ désigne la probabilité du vecteur $s$ , que l'on écrira de manière équivalente $\displaystyle p(s_{i},s_{-i})$ lorsqu'on s'intéressera au joueur $i$ . On dit que la loi de probabilité $p$ est un équilibre corrélé lorsque, pour tout joueur $i$ et toute stratégie $s_{i}\in S_{i}$ , on a la relation :

\forall s'_{i}\in S_{i},\quad \sum _{s_{-i}}p(s_{i},s_{-i})v_{i}(s_{i},s_{-i})\;\geq \;\sum _{s_{-i}}p(s_{i},s_{-i})v_{i}(s'_{i},s_{-i})

En français, ceci se lit : « sachant que le joueur $i$ s'est vu attribuer la stratégie $s_{i}$ , il ne peut obtenir en moyenne de valeur perçue plus grande en optant pour une autre stratégie $\displaystyle s'_{i}$ . »

La moyenne en question correspond à l'espérance de $v_{i}$ sur les stratégies des autres joueurs, distribuées selon la loi $p$ conditionnée par l'événement « le joueur $i$ a reçu la stratégie $s_{i}$ ». En d'autres termes, le raisonnement présente deux étapes : les joueurs reçoivent d'abord leurs stratégies, puis envisagent d'améliorer leurs valeurs moyennes en supposant que les autres ne changent pas de tactique. S'il n'y a d'amélioration possible pour aucun joueur, on a un équilibre corrélé.

Exemple[modifier | modifier le code]

*Jeu de la poule mouillée, en forme normale.*
	Oser (O)	Renoncer (R)
Oser (O)	0, 0	7, 2
Renoncer (R)	2, 7	6, 6

Considérons le jeu de la poule mouillée représenté ci-contre : deux joueurs s'affrontent, chacun ayant le choix entre deux stratégies, oser (O) ou renoncer (R). Si l'un ose, l'autre a tout intérêt à renoncer, et symétriquement, si l'un renonce, l'autre a tout intérêt à oser. Ce jeu représente donc une situation où chacun souhaite oser, mais seulement si son adversaire est susceptible d'abandonner.

Il y a trois équilibres de Nash : deux équilibres purs, $(O,R)$ et $(R,O)$ , ainsi qu'un équilibre mixte où chaque joueur ose avec probabilité $1/3$ .

Supposons maintenant l'existence d'un arbitre choisissant uniformément un couple de stratégies parmi $(R,R)$ , $(O,R)$ et $(R,O)$ . Une fois le couple choisi, l'arbitre informe chaque joueur de sa stratégie (mais pas de la stratégie de son adversaire). Deux situations se présentent alors :

Imaginons qu'un joueur reçoive $O$ : il sait alors que son adversaire a reçu $R$ et n'a pas intérêt à revenir sur sa stratégie.
Imaginons qu'un joueur reçoive $R$ : dans ce cas, son adversaire jouera $O$ avec probabilité $1/2$ et $R$ sinon; la valeur moyenne perçue par le joueur s'il conserve la stratégie $R$ est alors $1/2\times 2+1/2\times 6=4$ , tandis que s'il décide de jouer $O$ plutôt cette moyenne ne sera que de $1/2\times 0+1/2\times 7=3,5$ .

En définitive, aucun joueur n'a intérêt à revenir sur la stratégie que lui suggère l'arbitre : il y a équilibre corrélé. On remarquera que la valeur moyenne perçue dans cet équilibre est alors $1/3\times 7+1/3\times 2+1/3\times 6=5$ , soit plus que celle obtenue avec l'équilibre de Nash mixte.

Lien avec les équilibres de Nash[modifier | modifier le code]

Lorsque $p$ est la loi produit induite par $n$ stratégies mixtes $\{p_{i}\}$ , i.e. $p(s_{1},...,s_{n})=p_{1}(s_{1})p_{2}(s_{2})\cdots p_{n}(s_{n})$ , un équilibre corrélé est exactement un équilibre de Nash. En effet, la relation d'équilibre devient alors (après division par $p_{i}(s_{i})$ )

\forall s'_{i}\in S_{i},\quad \sum _{s_{-i}}p_{-i}(s_{-i})v_{i}(s_{i},s_{-i})\;\geq \;\sum _{s_{-i}}p_{-i}(s_{-i})v_{i}(s'_{i},s_{-i}).

C'est-à-dire que le mouvement $s_{i}$ est une réponse optimale aux stratégies (mixtes) des adversaires (les équilibres de Nash mixtes sont exactement les combinaisons convexes de réponses optimales^[1]).

Ainsi, un équilibre de Nash est un cas particulier d'équilibre corrélé où la loi est une loi produit (i.e. décorrélée).

Extension[modifier | modifier le code]

La notion a été étendue pour les jeux en forme normale extensive par Bernard von Stengel et François Forges en 2008^[2].

Bibliographie[modifier | modifier le code]

Robert Aumann (1974), Subjectivity and correlation in randomized strategies, Journal of Mathematical Economics, 1:67-96.
Robert Aumann (1987), Correlated Equilibrium as an Expression of Bayesian Rationality, Econometrica, 55(1):1-18.
Fudenberg, Drew et Jean Tirole (1991), Game Theory, MIT Press, 1991, (ISBN 0-262-06141-4)
Martin J. Osborne et Ariel Rubinstein (1994), A Course in Game Theory, MIT Press, (ISBN 0-262-65040-1).
(en) Noam Nisan, Tim Roughgarden, Eva Tardos et Vijay Vazirani (trad. de l'indonésien), Algorithmic Game Theory, Cambridge, Cambridge University Press, 2007, 754 p. (ISBN 978-0-521-87282-9, LCCN 2007014231, lire en ligne)
Montet C. and D. Serra (2003), Game theory and economics, Palgrave Macmilan, chap. 3 (ISBN 0-333-61847-5)

Références[modifier | modifier le code]

↑ (Nisan et al. 2007) (chapitre 2)
↑ Bernhard von Stengel et Françoise Forges, Extensive-Form Correlated Equilibrium : Definition and Computational Complexity, 2008 (lire en ligne)

[algorithmic-game-1] (Nisan et al. 2007) (chapitre 2)

[2] Bernhard von Stengel et Françoise Forges, Extensive-Form Correlated Equilibrium : Definition and Computational Complexity, 2008 (lire en ligne)

[1]

[2]

v · m Théorie des jeux
Définitions	Détermination Escalade d'engagement Extensive-form game (en) First-player and second-player win (en) Game complexity (en) Graphical game (en) Hierarchy of beliefs (en) Information set (en) Jeu bayésien Jeu coopératif Jeu résolu Jeu sous forme normale Préférence Jeu séquentiel Simultaneous game (en) Simultaneous action selection (en) Succinct game (en)
Équilibre économique (concepts)	Équilibre de Nash Équilibre parfait en sous-jeux Mertens-stable equilibrium (en) Bayesian Nash equilibrium (en) Perfect Bayesian equilibrium (en) Trembling hand (en) Proper equilibrium (en) Epsilon-equilibrium (en) Équilibre corrélé Équilibre séquentiel Quasi-perfect equilibrium (en) Stratégie évolutivement stable Risk dominance (en) Cœur Valeur de Shapley Optimum de Pareto Quantal response equilibrium (en) Self-confirming equilibrium (en) Strong Nash equilibrium (en) Markov perfect equilibrium (en)
Stratégies	Dominance stratégique Stratégie pure Stratégie mixte Strategy-stealing argument (en) Coopération-réciprocité-pardon Grim trigger (en) Collusion Raisonnement rétrograde Induction vers l'avant Stratégie de Markov (en)
Classes de jeux	Symmetric game (en) Perfect information (en) Repeated game (en) Signaling game (en) Screening game (en) Conversation libre Jeu à champ moyen Jeu à somme nulle Théorie des mécanismes d'incitation problèmes de négociation Stochastic game (en) n-player game (en) Large Poisson game (en) Nontransitive game (en) Global game (en) Strictly determined game (en) Jeu de potentiel
Jeux	Dilemme du prisonnier Dilemme facultatif du prisonnier Dilemme du voyageur Jeu de coordination Stratégie du bras de fer Jeu du mille-pattes Dilemme du volontaire Enchère d'un dollar Jeu de la guerre des sexes Chasse au cerf Jeu de l'appariement des sous Jeu de l'ultimatum Pierre-papier-ciseaux Jeu du pirate Jeu du dictateur Jeu des biens publics Jeu Blotto Guerre d'usure Problème du bar d'El Farol Partage équitable Fair cake-cutting (en) Cournot game Deadlock (en) Dilemme du dîner Concours de beauté de Keynes Poker Kuhn (en) Jeu de marchandage de Nash Prisoners and hats puzzle (en) Jeu de la princesse et du monstre Problème de Monty Hall Problème du rendez-vous
Theorèmes	Algorithme minimax Équilibre de Nash Purification theorem (en) Folk theorem (en) Revelation principle (en) Théorème d'impossibilité d'Arrow
Personnalités	Albert W. Tucker Amos Tversky Ariel Rubinstein Daniel Kahneman David K. Levine (en) David M. Kreps Donald B. Gillies (en) Drew Fudenberg Eric Maskin Harold W. Kuhn Herbert Simon Hervé Moulin Jean Tirole Jean-François Mertens (en) John Harsanyi John Maynard Smith Antoine-Augustin Cournot John Nash John von Neumann Kenneth Arrow Kenneth Binmore Leonid Hurwicz Lloyd Shapley Melvin Dresher (en) Merrill M. Flood (en) Oskar Morgenstern Paul Milgrom Peyton Young (en) Reinhard Selten Robert Axelrod Robert Aumann Robert B. Wilson Roger Myerson Samuel Bowles (en) Thomas Schelling William Vickrey
Voir aussi	All-pay auction (en) Élagage alpha-bêta Paradoxe de Bertrand Rationalité limitée Théorie des jeux combinatoires Confrontation analysis (en) Coopétition Liste des théoriciens du jeu Liste des jeux en théorie des jeux Perdant-perdant Topological game (en) Tragédie des biens communs Tyrannie des petites décisions