Le dilemme du voyageur

Sous-Commandant Marco · 1 juillet 2007

Pour la Science du mois de juillet a un article de Kaushik Basu consacré au dilemme du voyageur, dont il est l'inventeur:

http://www.pourlascience.com/index.php?ids…3&idn3=5984

Kaushik Basu est un économiste d'origine indienne qui a étudié sous la férule d'Amartya Sen et dirige aujourd'hui le Centre d'Economie Analytique de l'Université Cornell. Cet article contient plusieurs assertions qui me paraissent fort contestables (et plutôt désagréables pour un libéral), telles que:

Les premières théories économiques étaient fermement ancrées au présupposé libéral selon lequel on devrait laisser les individus se débrouiller tout seuls, parce que leurs choix égoïstes se traduiraient par un fonctionnement efficace de l'économie. L'essor de la théorie des jeux a déjà fait beaucoup pour libérer l'économie de ce présupposé.

Le dilemme du voyageur est une généralisation du dilemme du prisonnier:

http://en.wikipedia.org/wiki/Traveler%27s_dilemma

En résumé: une compagnie aérienne propose de dédommager deux voyageurs pour la perte de leurs bagages, qui étaient strictement identiques. Le montant maximal du remboursement est fixé à 100. Si les deux voyageurs estiment indépendamment l'un de l'autre la valeur de leurs bagages au même montant, la compagnie rembourse cette somme sans sourciller. Si les deux montants demandés sont différents, la compagnie rembourse le montant le plus bas, assorti d'une récompense pour le voyageur honnête (celui qui a demandé le remboursement le plus bas) et d'une pénalité du même montant que la récompense pour le voyageur qui tente de gruger la compagnie en annonçant un montant plus élevé.

Les expériences montrent que la plupart des sujets annoncent des montants très élevés, entre 95 et 100. Rien de bien surprenant. Ce que je comprends pas, c'est que Basu affirme que ces résultats ne sont pas conformes au "choix rationnel", qui correspond à l'équilibre de Nash, soit une demande de 2 pour les deux voyageurs lorsque la récompense est de 2. Il en fait tout un tas de déductions sur les choix non-rationnels des acteurs économiques.

Est-ce seulement moi ou bien le fait de demander le montant maximal ou proche du maximum, afin de maximiser son gain, me paraît bien plus rationnel que l'équilibre de Nash, qui ne rapporte quasiment rien? Pourquoi Basu qualifie-t-il l'équilibre de Nash de "choix rationnel"?

Pour être tout à fait honnête, j'ai l'impression que c'est Basu qui a des présupposés (anti-libéraux, cela va sans dire) qu'il veut absolûment démontrer, quitte à tordre un peu son argumentation…

Sekonda · 1 juillet 2007

En résumé: une compagnie aérienne propose de dédommager deux voyageurs pour la perte de leurs bagages, qui étaient strictement identiques. Le montant maximal du remboursement est fixé à 100. Si les deux voyageurs estiment indépendamment l'un de l'autre la valeur de leurs bagages au même montant, la compagnie rembourse cette somme sans sourciller. Si les deux montants demandés sont différents, la compagnie rembourse le montant le plus bas, assorti d'une récompense pour le voyageur honnête (celui qui a demandé le remboursement le plus bas) et d'une pénalité du même montant que la récompense pour le voyageur qui tente de gruger la compagnie en annonçant un montant plus élevé.
Les expériences montrent que la plupart des sujets annoncent des montants très élevés, entre 95 et 100. Rien de bien surprenant. Ce que je comprends pas, c'est que Basu affirme que ces résultats ne sont pas conformes au "choix rationnel", qui correspond à l'équilibre de Nash, soit une demande de 2 pour les deux voyageurs lorsque la récompense est de 2. Il en fait tout un tas de déductions sur les choix non-rationnels des acteurs économiques.

Si je comprend bien l'article de WP, 2$ est la somme du bonus/malus et le minimun que l'on puisse déclarer. Dans ce cas, c'est effectivement la déclaration optimale pour maximiser son gain par rapport à la déclaration (remboursement de 2 ou 4$, soit 0 ou 100% par rapport à l'estimation).

Est-ce seulement moi ou bien le fait de demander le montant maximal ou proche du maximum, afin de maximiser son gain, me paraît bien plus rationnel que l'équilibre de Nash, qui ne rapporte quasiment rien? Pourquoi Basu qualifie-t-il l'équilibre de Nash de "choix rationnel"?

Si les 2 clients sont rationnels et supposent que l'autre l'est aussi, ils ont bien intérêt à annoncer 100 s'ils estiment que l'autre va faire le même calcul si le total versé (remboursement + prime) est limité à 100 quelque soit la valeur de la prime. Si le total n'est pas limité, il y a sans doute mieux.

Donne-t-il des exemples de situation réelle correspondant à ce jeux ?

Le Clown · 1 juillet 2007

Voici l'article en anglais :

http://www.sciam.com/article.cfm?chanID=sa…r=1&catID=2

Si je comprend bien, on peut montrer que le choix rationnel pour les deux joueurs est d'annoncer 2. Cela se démontre en utilisant un raisonnement par rétroduction : si A et B (chacun anticipant que l'autre va annoncer 100) annoncent tous les deux 100, ils gagnent 100. Mais si A est malin (i.e. rationnel), à partir du moment où il est sur que B va annoncer 100, il a intérêt à annoncer 99 (il gagne 99+2 tandis que B ne gagne que 99-2). Cependant, si B est rationnel, il sait cela et donc il sait qu'il a intérêt à annoncer 98. Mais si A est rationnel il sait cela donc il a intérêt à annoncer 97 and so on…

Donc effectivement, si les joueurs sont rationnels, le meilleur choix est d'annoncer 2 et non 100 ou 99. Mais cela à condition que l'on fasse l'hypothèse de common knowledge (tous les joueurs ont les mêmes connaissances du jeux et de la façon de penser de l'autre). Je connaissais cette configuration sous le nom du jeux du mille pattes. Ce que ce jeux nous enseigne c'est que "trop de rationalité tue la rationalité" : la rationalité stratégique mène à des résultats contre-intuitifs non vérifiés en pratiques. On est alors obligé d'introduire des hypothèses supplémentaires comme par exemple la notion de confiance. Et, effectivement, ce cas spécifique (comme c'est souvent le cas avec la théorie des jeux) remet en cause l'idée d'une "main invisible"… dans le cas d'une rationalité stratégique de la part des joueurs. Le problème c'est que personne n'agit selon une stricte rationalité stratégique, la preuve étant que tu est toi même étonné que l'annonce de 2 soit le choix "rationnel". En fait, ce genre de cas a plutôt tendance à remettre en question l'intérêt de… la théorie des jeux !!

POE · 1 juillet 2007

Mon avis est que le seul choix rationnel est celui de dire exactement le prix du bagage, puisque les deux bagages sont rigoureusement identiques, c'est la seule manière d'être certain d'être dédommagé au prix exact.

Si le prix exact n'est pas estimable de façon précise et exacte de la même manière par les deux voyageurs, il faut considérer que la compagnie n'est pas rationnelle en proposant ce mode de dédomagement, la proposition n'est pas rationnelle, voire même perverse. On ne peut donc attendre une réponse rationnelle de ce genre de proposition.

Stranger · 1 juillet 2007

Le jeu ne tient pas compte de la valeur accordée au risque. Si je préfère dire 100 et risquer d'avoir 0 plutôt que de dire 2 et avoir 2, je ne suis pas irrationnel. Quel est la différence entre avoir 2 ou 0 lorsqu'on a perdu un objet de haute valeur? C'est une insulte d'avoir 2.

Le Clown · 1 juillet 2007

Mon avis est que le seul choix rationnel est celui de dire exactement le prix du bagage, puisque les deux bagages sont rigoureusement identiques, c'est la seule manière d'être certain d'être dédommagé au prix exact.
Si le prix exact n'est pas estimable de façon précise et exacte de la même manière par les deux voyageurs, il faut considérer que la compagnie n'est pas rationnelle en proposant ce mode de dédomagement, la proposition n'est pas rationnelle, voire même perverse. On ne peut donc attendre une réponse rationnelle de ce genre de proposition.

Non. Si tu dis le prix exact du bagage (disons 50) alors l'autre joueur a intérêt à annoncer 49 et il est gagnant (51) tandis que toi tu n'est remboursés que pour 47.

Le jeu ne tient pas compte de la valeur accordée au risque. Si je préfère dire 100 et risquer d'avoir 0 plutôt que de dire 2 et avoir 2, je ne suis pas irrationnel. Quel est la différence entre avoir 2 ou 0 lorsqu'on a perdu un objet de haute valeur? C'est une insulte d'avoir 2.

Le problème c'est que si tu est rationnel et que tu sais que l'autre joueur est rationnel et que tu connais la matrice de gains (hypothèse de common knowledge) tu sais que tu ne gagnera pas 100. Ou alors, tu introduis une dose "d'irrationalité" (la confiance dans le fait que l'autre n'agira pas rationellement par exemple). Donc, in fine, tu choisis entre 0 et 2 de manière certaine et c'est bien ce dernier choix qui est rationnel.

POE · 1 juillet 2007

Non. Si tu dis le prix exact du bagage (disons 50) alors l'autre joueur a intérêt à annoncer 49 et il est gagnant (51) tandis que toi tu n'est remboursés que pour 47.

Le problème c'est que pour prévoir les résultats, il faut considérer que le but des voyageurs est de maximiser leur gain. Or ce but là n'est pas forcément rationnel dans cet exemple.

Dans le cadre d'un jeu, on peut considérer que le but des joueurs est le même : celui de gagner le maximum, sans aucune considération morale.

Dans le cadre des voyageurs, le principe est différent, il s'agit d'être dédommagé d'une perte. Or dans ce cas là, l'attitude du joueur, qui cherche à maximiser son gain sans considération morale, n'est pas une attitude rationnelle, car elle n'est pas adaptée à la situation.

Le Clown · 1 juillet 2007

Le problème c'est que pour prévoir les résultats, il faut considérer que le but des voyageurs est de maximiser leur gain. Or ce but là n'est pas forcément rationnel dans cet exemple.
Dans le cadre d'un jeu, on peut considérer que le but des joueurs est le même : celui de gagner le maximum, sans aucune considération morale.

Dans le cadre des voyageurs, le principe est différent, il s'agit d'être dédommagé d'une perte. Or dans ce cas là, l'attitude du joueur, qui cherche à maximiser son gain sans considération morale, n'est pas une attitude rationnelle, car elle n'est pas adaptée à la situation.

Oui mais là tu introduis des hypothèses supplémentaires (être dédommagé et non maximiser son gain) qui changent les règles du jeu. Le jeu décrit dans l'article ne spécifie aucune considération morale ou autre. De toute manière, l'intérêt n'est pas là (on peut prendre un autre exemple que cette histoire fumeuse de dédomagement de perte de bagages). L'intérêt est d'ordre heuristique : il s'agit de montrer que la rationalité au sens de la théorie économique mène à des résultats totalement absurdes que l'on ne retrouve pas dans la pratique et que, par conséquent, d'autres variables doivent être prises en compte pour analyser les actions humaines. De ce genre de jeux, on peut tirer deux conclusions (qui ne sont pas exclusives l'une de l'autre d'ailleurs) : une conclusion positive - les comportements humains ne relèvent pas uniquement de la pure rationalité stratégique, et une conclusion normative - il faut des règles pour encadrer les comportements humains. Voilà pourquoi d'ailleurs la théorie des jeux est autant utilisée aujourd'hui en économie des institutions.

Edit : on peut d'ailleurs adapté le jeu en introduisant une mesure de la satisfaction de l'individu lié à son "juste dédommagement" sans que cela change le résultat. Il suffit de considérer que les gains de la matrice ne sont pas en monnaie mais en unité d'utilité qui est un mix en gain monétaire et "gain moral pour juste dédommagement".

Exemple : soit l'utilité U des joueurs = D+2E

avec D = le dédommagement perçu par le joueur et E l'écart entre le dédommagement perçu et le montant objectif de la perte de bagages PB. Ici, on considère que PB = 3 (les bagages perdus valent objectivement 3 euros). De cette manière, un individu moins remboursé subit une désutilité morale (et on fait l'hypothèse qu'il a une satisfaction supplémentaire à être plus remboursé qu'il ne devrait l'être).

Pour simplifier, on considère que les joueurs n'ont que deux stratégies possibles S1=annoncer que les bagages valaient 3 euros et S2=annoncer que les bagages valaient 2 euros. Les autres règles sont les mêmes que dans le jeu original (-2 pour celui qui annonce le prix le plus élévé, +2 pour l'autre). On arrive à la matrice suivante :

—————————B

—————--3——————--2

—3———-(3,3)—————(-6,6)

A

—-2———(6,-6)—————(0,0) --> L'équilibre de Nash est ici, la situation est donc sous-optimale.

Enfin, j'ajoute que même si l'on considère que tout remboursement s'écartant de la valeur objective des bagages est sanctionné négativement en terme d'utilité (un joueur remboursé 4 subit une désutilité morale de -2 et a donc une utilité totale de 2 et non de 6), on arrive à une matrice dans laquelle on a 2 équilibres de Nash mais où c'est encore l'équilibre (0,0) qui est le choix rationnel car dominant en risque.

POE · 1 juillet 2007

Oui mais là tu introduis des hypothèses supplémentaires (être dédommagé et non maximiser son gain) qui changent les règles du jeu. Le jeu décrit dans l'article ne spécifie aucune considération morale ou autre. De toute manière, l'intérêt n'est pas là (on peut prendre un autre exemple que cette histoire fumeuse de dédomagement de perte de bagages). L'intérêt est d'ordre heuristique : il s'agit de montrer que la rationalité au sens de la théorie économique mène à des résultats totalement absurdes que l'on ne retrouve pas dans la pratique et que, par conséquent, d'autres variables doivent être prises en compte pour analyser les actions humaines. De ce genre de jeux, on peut tirer deux conclusions (qui ne sont pas exclusives l'une de l'autre d'ailleurs) : une conclusion positive - les comportements humains ne relèvent pas uniquement de la pure rationalité stratégique, et une conclusion normative - il faut des règles pour encadrer les comportements humains. Voilà pourquoi d'ailleurs la théorie des jeux est autant utilisée aujourd'hui en économie des institutions.

Non, je n'introduis pas d'hypothèses, mais je remet en question les hypothèses admises mais non formulées. On considère que le joueur cherche à maximiser son gain, pourtant la compagnie cherche à récompenser l'honnêteté : il y a une contradiction entre les fins poursuivies.

On ne peut parler de rationalité que si on connait la fin poursuivie d'une action.

Il faut donc poser clairement le but du jeu, ou le but de l'action que l'on veut étudier avant de parler de rationalité.

Le Clown · 1 juillet 2007

Non, je n'introduis pas d'hypothèses, mais je remet en question les hypothèses admises mais non formulées. On considère que le joueur cherche à maximiser son gain, pourtant la compagnie cherche à récompenser l'honnêteté : il y a une contradiction entre les fins poursuivies.
On ne peut parler de rationalité que si on connait la fin poursuivie d'une action.

Il faut donc poser clairement le but du jeu, ou le but de l'action que l'on veut étudier avant de parler de rationalité.

Par définition (dans la théorie économique et en théorie des jeux), la fin d'une action est de maximiser l'utilité de l'agent, que celle-ci soit exprimée en gain monétaire ou autre. Par ailleurs, en mettant en place un tel système de dédommagement, on peut estimer que la compagnie aérienne (qui agit rationnellement) ne cherche pas à récompenser l'honnêteté. C'est plutôt un moyen pour décourager le mensonge et, in fine, pour rembourser le moins possible.

Sinon, voir mon edit du dessus.

L'affreux · 1 juillet 2007

Pour la Science du mois de juillet a un article de Kaushik Basu consacré au dilemme du voyageur, dont il est l'inventeur:
http://www.pourlascience.com/index.php?ids…3&idn3=5984

Kaushik Basu est un économiste d'origine indienne qui a étudié sous la férule d'Amartya Sen et dirige aujourd'hui le Centre d'Economie Analytique de l'Université Cornell. Cet article contient plusieurs assertions qui me paraissent fort contestables (et plutôt désagréables pour un libéral), telles que:

Les premières théories économiques étaient fermement ancrées au présupposé libéral selon lequel on devrait laisser les individus se débrouiller tout seuls, parce que leurs choix égoïstes se traduiraient par un fonctionnement efficace de l'économie. L'essor de la théorie des jeux a déjà fait beaucoup pour libérer l'économie de ce présupposé.

D'après ce que je comprends, Kaushik Basu s'estime anti-libéral car il pense que l'économie serait moins productive si les individus étaient libres. D'autres s'estiment libéraux pour leur conviction que l'économie serait plus productive si elle était libre. Les uns comme les autres considèrent le productivisme comme une fin en soi. Les conclusions de ce débat porteront donc sur la production, pas sur la liberté.

Stranger · 1 juillet 2007

Par définition (dans la théorie économique et en théorie des jeux), la fin d'une action est de maximiser l'utilité de l'agent, que celle-ci soit exprimée en gain monétaire ou autre. Par ailleurs, en mettant en place un tel système de dédommagement, on peut estimer que la compagnie aérienne (qui agit rationnellement) ne cherche pas à récompenser l'honnêteté. C'est plutôt un moyen pour décourager le mensonge et, in fine, pour rembourser le moins possible.
Sinon, voir mon edit du dessus.

Le problème se trouve dans le fait qu'on suppose que l'utilité d'avoir 2 est de 2 utils, donc l'utilité est totalement linéaire. Or il est bien possible qu'avoir 2 en récompense ne donne pas d'utils, et dans ce cas il est irrationnel de choisir 2.

Le Clown · 1 juillet 2007

Le problème se trouve dans le fait qu'on suppose que l'utilité d'avoir 2 est de 2 utils, donc l'utilité est totalement linéaire. Or il est bien possible qu'avoir 2 en récompense ne donne pas d'utils, et dans ce cas il est irrationnel de choisir 2.

Oui bien entendu. On peut poser d'autres hypothèses (par exemple qu'un dédommagement trop inférieur au dommage réel ne donne aucune utilité ou une utilité négative), voir mon post plus haut. Mais de manière générale, le problème n'est pas là : la théorie des jeux fonctionne à partir de configurations types. On peut modifier l'exemple à l'infini et aboutir à des configurations différentes. Mais ce qui importe, c'est que dans de nombreux cas (ceux où les hypothèses sont les plus simples), on aboutit à des configurations du type dilemme du prisonnier. Comme je le dit plus haut, cela peut nous faire parvenir à plusieurs conclusions, dont l'une est que la théorie des jeux ne sert à rien en sciences sociales.

Le Clown · 1 juillet 2007

D'après ce que je comprends, Kaushik Basu s'estime anti-libéral car il pense que l'économie serait moins productive si les individus étaient libres. D'autres s'estiment libéraux pour leur conviction que l'économie serait plus productive si elle était libre. Les uns comme les autres considèrent le productivisme comme une fin en soi. Les conclusions de ce débat porteront donc sur la production, pas sur la liberté.

il ne me semble pas que l'auteur s'estime "anti-libéral". En fait, il dit deux choses : 1) la théorie des jeux remet en cause le postulat du "libéralisme classique" selon lequel l'agrégation de comportements purement égoïstes mèneraient à la meilleure situation sur le plan collectif (la main invisible de Smith quoi, de fait on est dans un cadre utilitariste) et 2) que le fait que les expérimentations ne permettent pas de retrouver les résultats de la théorie des jeux prouvent que les individus ne se comportent pas suivant une pure rationalité stratégique. Selon moi, on peut tout à fait admettre ces deux idées et être libéral malgrè tout (l'auteur n'est néanmoins probablement pas libéral). Et il vaut mieux que ce soit le cas, autrement le libéralisme serait erroné !

Domi · 1 juillet 2007

Voici l'article en anglais :
http://www.sciam.com/article.cfm?chanID=sa…r=1&catID=2

Si je comprend bien, on peut montrer que le choix rationnel pour les deux joueurs est d'annoncer 2. Cela se démontre en utilisant un raisonnement par rétroduction : si A et B (chacun anticipant que l'autre va annoncer 100) annoncent tous les deux 100, ils gagnent 100. Mais si A est malin (i.e. rationnel), à partir du moment où il est sur que B va annoncer 100, il a intérêt à annoncer 99 (il gagne 99+2 tandis que B ne gagne que 99-2). Cependant, si B est rationnel, il sait cela et donc il sait qu'il a intérêt à annoncer 98. Mais si A est rationnel il sait cela donc il a intérêt à annoncer 97 and so on…

Donc effectivement, si les joueurs sont rationnels, le meilleur choix est d'annoncer 2 et non 100 ou 99. Mais cela à condition que l'on fasse l'hypothèse de common knowledge (tous les joueurs ont les mêmes connaissances du jeux et de la façon de penser de l'autre). Je connaissais cette configuration sous le nom du jeux du mille pattes. Ce que ce jeux nous enseigne c'est que "trop de rationalité tue la rationalité" : la rationalité stratégique mène à des résultats contre-intuitifs non vérifiés en pratiques. On est alors obligé d'introduire des hypothèses supplémentaires comme par exemple la notion de confiance. Et, effectivement, ce cas spécifique (comme c'est souvent le cas avec la théorie des jeux) remet en cause l'idée d'une "main invisible"… dans le cas d'une rationalité stratégique de la part des joueurs. Le problème c'est que personne n'agit selon une stricte rationalité stratégique, la preuve étant que tu est toi même étonné que l'annonce de 2 soit le choix "rationnel". En fait, ce genre de cas a plutôt tendance à remettre en question l'intérêt de… la théorie des jeux !!

Enfin, cela ne montre pas que les individus n'agissent pas en fonction de ce qu'ils perçoivent comme rationnel. Ils se trompent sur la solution rationnelle, c'est tout.

La réalité sur la rationnalité des choix n'a rien à voir avec ce qui se passe ici. Elles sont à la fois beaucoup plus complexes et beaucoup plus identifiables sur le plan logique. Il n'y a pas souvent dans la réalité lieu à de telles erreurs de logiques sur ce qui est rationnel.

D'ailleurs, ces exemples montrent en fait que les gens ont tendance à sortir spontanément du dilemme du prisonnier en fonction de la perception d'un intérêt commun, ce qui est loin de justifier des solutions contraignantes mais leur retire au contraire une justification. Je ne suis pas persuadé que ce serait le cas, si le nombre de personne était plus grand, soit dit en passant.

Le Clown · 1 juillet 2007

Enfin, cela ne montre pas que les individus n'agissent pas en fonction de ce qu'ils perçoivent comme rationnel. Ils se trompent sur la solution rationnelle, c'est tout.

Tout dépend de ce que l'on entend par rationnel. Dans ce genre d'interaction, choisir une solution autre qu'annoncer 2 ne peut se justifier qu'à la condition que l'on pense que l'autre va également annoncer un chiffre différent. Ce faisant, le joueur est bien rationnel mais son choix est fondé sur une croyance spécifique : que l'autre pense comme lui et qu'il ne cherchera pas à profiter de la situation. Peut-on dire que cette croyance est rationnelle ?

La réalité sur la rationnalité des choix n'a rien à voir avec ce qui se passe ici. Elles sont à la fois beaucoup plus complexes et beaucoup plus identifiables sur le plan logique. Il n'y a pas souvent dans la réalité lieu à de telles erreurs de logiques sur ce qui est rationnel.
D'ailleurs, ces exemples montrent en fait que les gens ont tendance à sortir spontanément du dilemme du prisonnier en fonction de la perception d'un intérêt commun, ce qui est loin de justifier des solutions contraignantes mais leur retire au contraire une justification. Je ne suis pas persuadé que ce serait le cas, si le nombre de personne était plus grand, soit dit en passant.

Oui. Tout cela renvoi à de très nombreux travaux sur la genèse et le développement des institutions économiques qui s'appuient de manière extensive sur la théorie des jeux. De toutes façons, le problème (ou la force, question de point de vue) de la théorie des jeux c'est qu'elle ne permet pas de tirer des conclusions absolues sur les problèmes de coordination. Mais elle peut être un outil très puissant pour expliquer l'émergence d'une règle et surtout sa persistance dans le temps.

Nick de Cusa · 1 juillet 2007

Ne s'agit-il pas là d'un jeu où il est rationnel de choisir la méfiance maximale quand on joue un seul tour face à quelqu'un qu'on ne connaît pas, mais ou le bon choix change radicalement quand on joue un grand nombre de tour et qu'on garde en mémoire ce que d'autre joueurs ont fait lors de ces multiples occurences précédentes?

La première configuration est rare dans la vie quotidienne (ça nous rappelle les restaus dans les zône de fort passage tourisitique, qui servent des protions trop petites à des prix top élevés), alors que la deuxième configuration est beaucoup plus représentative de la majeure partie de l'économie (et de nos vies): avec l'expérience des bons partenaires et des tricheurs, nous éliminons les deuxièmes et adoptons avec les premiers un comportement de plus en plus rationnel.

L'affreux · 1 juillet 2007

Selon moi, on peut tout à fait admettre ces deux idées et être libéral malgrè tout

Selon moi aussi, mais la citation de Kaushik Basu par le sous-commandant indique que pour Kaushik Basu on ne le peut pas.

Rincevent · 1 juillet 2007

Ne s'agit-il pas là d'un jeu où il est rationnel de choisir la méfiance maximale quand on joue un seul tour face à quelqu'un qu'on ne connaît pas, mais ou le bon choix change radicalement quand on joue un grand nombre de tour et qu'on garde en mémoire ce que d'autre joueurs ont fait lors de ces multiples occurences précédentes?
La première configuration est rare dans la vie quotidienne (ça nous rappelle les restaus dans les zône de fort passage tourisitique, qui servent des protions trop petites à des prix top élevés), alors que la deuxième configuration est beaucoup plus représentative de la majeure partie de l'économie (et de nos vies): avec l'expérience des bons partenaires et des tricheurs, nous éliminons les deuxièmes et adoptons avec les premiers un comportement de plus en plus rationnel.

Toutafé. En fait, on nous ressort le dilemme du prisonnier 40 ans après, à peine relifté. Avec exactement la même faille dans le raisonnement.

Domi · 1 juillet 2007

Tout dépend de ce que l'on entend par rationnel. Dans ce genre d'interaction, choisir une solution autre qu'annoncer 2 ne peut se justifier qu'à la condition que l'on pense que l'autre va également annoncer un chiffre différent. Ce faisant, le joueur est bien rationnel mais son choix est fondé sur une croyance spécifique : que l'autre pense comme lui et qu'il ne cherchera pas à profiter de la situation. Peut-on dire que cette croyance est rationnelle ?

Cette croyance peut-être pas, mais il perçoit les moyens qu'il utilise comme les plus appropriés pour aboutir à ses fins. Les fins ne sont peut-être pas rationnelles, ni la relation entre la fin et les moyens (elles peuvent être le fruit d'une erreur). Cependant cela n'empêche pas que c'est en fonction de cette fin qu'il a utilisé ces moyens.

En fait que montre cette expérience:

- que les gens n'agissent pas pour maximiser leur gain,

- ou qu'ils ne perçoivent pas quelle serait la méthode la plus appropriée pour maximer leurs gains.

J'ajoute un autre point: dans ces problèmes de théorie des jeux, il y a deux personnes et des dilemmes. Souvent les deux personnes ne peuvent réagir de la même manière et la question est d'anticiper le comportement de l'autre.

Mais dans la réalité du marché les choses sont différentes. Certes les choix de chacun sur le marché dépendent du choix des autres participants mais ils apparaissent comme en partie stables, connus à l'avance. Avant de me lancer dans telle ou telle activité, je sais à peu pré quel nombre de personnes se sont lancées dans telle ou telle activité. C'est plus prévisible que dans un dilemme de théorie des jeux…

Autre point intéressant. On parle de théorie des jeux mais il y a en réalité deux choses bien différentes. Il y a la théorie formelle (équilibre de Nash) et l'expérience sur ce que les gens font en réalité.

Si la logique formelle tendait à invalider le libéralisme face à la théorie du prisonnier, je vois mal en quoi montrer le fait que les gens n'agissent pas selon cette logique formelle invaliderait le libéralisme ( sauf pour les cas où le dilemme du prisonnier n'est pas en cause, mais encore faut-il savoir pourquoi les gens ne suivent pas ce qui semlent relever d'une démarche rationnelle).

Le Clown · 1 juillet 2007

Ne s'agit-il pas là d'un jeu où il est rationnel de choisir la méfiance maximale quand on joue un seul tour face à quelqu'un qu'on ne connaît pas, mais ou le bon choix change radicalement quand on joue un grand nombre de tour et qu'on garde en mémoire ce que d'autre joueurs ont fait lors de ces multiples occurences précédentes?
La première configuration est rare dans la vie quotidienne (ça nous rappelle les restaus dans les zône de fort passage tourisitique, qui servent des protions trop petites à des prix top élevés), alors que la deuxième configuration est beaucoup plus représentative de la majeure partie de l'économie (et de nos vies): avec l'expérience des bons partenaires et des tricheurs, nous éliminons les deuxièmes et adoptons avec les premiers un comportement de plus en plus rationnel.

Toutafé. En fait, on nous ressort le dilemme du prisonnier 40 ans après, à peine relifté. Avec exactement la même faille dans le raisonnement.

Oui oui, c'est le tit for tat d'Axelrod : dans un dilemme du prisonnier répété indéfiniment (ou plus exactement dont on ne connait pas la fin), la meilleure stratégie pour les joueurs est de toujours coopérer. Le problème c'est bien sur qu'il faut être dans une configuration où les mêmes joueurs se rencontrent plusieurs et ne savent pas à partir de quand ils ne se rencontreront plus. Après, de très nombreux autres problèmes peuvent se présenter (asymétrie d'informations par exemple)… Le tit for tat ne résoud pas le "problème" du dilemme du prisonnier, il l'analyse sous un certain angle et permet de comprendre pourquoi ce n'est pas le chaos dans la réalité. Mais il ne suffit pas à démontrer l'existence d'une "coordination spontanée optimale".

Voir ce lien assez intéressant (qui montre à quel point les choses sont compliquées):

http://www.limsi.fr/~jps/enseignement/exam…/Examen.html#DP

Cette croyance peut-être pas, mais il perçoit les moyens qu'il utilise comme les plus appropriés pour aboutir à ses fins. Les fins ne sont peut-être pas rationnelles, ni la relation entre la fin et les moyens (elles peuvent être le fruit d'une erreur). Cependant cela n'empêche pas que c'est en fonction de cette fin qu'il a utilisé ces moyens.
En fait que montre cette expérience:

- que les gens n'agissent pas pour maximiser leur gain,

- ou qu'ils ne perçoivent pas quelle serait la méthode la plus appropriée pour maximer leurs gains.

J'ajoute un autre point: dans ces problèmes de théorie des jeux, il y a deux personnes et des dilemmes. Souvent les deux personnes ne peuvent réagir de la même manière et la question est d'anticiper le comportement de l'autre.

Mais dans la réalité du marché les choses sont différentes. Certes les choix de chacun sur le marché dépendent du choix des autres participants mais ils apparaissent comme en partie stables, connus à l'avance. Avant de me lancer dans telle ou telle activité, je sais à peu pré quel nombre de personnes se sont lancées dans telle ou telle activité. C'est plus prévisible que dans un dilemme de théorie des jeux…

Autre point intéressant. On parle de théorie des jeux mais il y a en réalité deux choses bien différentes. Il y a la théorie formelle (équilibre de Nash) et l'expérience sur ce que les gens font en réalité.

Si la logique formelle tendait à invalider le libéralisme face à la théorie du prisonnier, je vois mal en quoi montrer le fait que les gens n'agissent pas selon cette logique formelle invaliderait le libéralisme ( sauf pour les cas où le dilemme du prisonnier n'est pas en cause, mais encore faut-il savoir pourquoi les gens ne suivent pas ce qui semlent relever d'une démarche rationnelle).

On est bien d'accord. Ceux qui se servent de la théorie des jeux pour invalider le libéralisme font la même erreur épistémologique que ceux qui se servent du modèle de concurrence parfaite pour démontrer sa supériorité. Ils prennent pour une description de la réalité ce qui n'est qu'un outil pour l'interpréter (outil à la pertinence plus ou moins grande), qui plus est un outil très réducteur. Pour moi, le grand mérite de la théorie des jeux c'est précisément de montrer que l'on ne peut pas comprendre les interactions humaines sans les notions de convention, de confiance, d'incertitude, d'anticipation, d'institution etc., tout un état de truc que cette approche ne peut précisément pas expliquer (si ce n'est de manière ad hoc).

POE · 1 juillet 2007

C'est certain que la compagnie aérienne qui procéderait de la sorte lorsqu'elle perd les bagages de ses clients, bénéficierait d'une très mauvaise publicité, et risquerait fort de ne pas jouer son petit jeu longtemps…entre autre raisons parce que justement l'individu n'est pas prisonnier dans une économie libérale.

9,9k · 1 juillet 2007

J'ai trouvé l'article un peu puant. D'une part, même en supposant que l'auteur ait raison, il est basé sur une faute de raisonnement logique : ce qu'il démontrerait au plus serait qu'une démonstration de la validité de l'efficacité de l'économie libérale est fausse. Et l'auteur en déduit que le "théorème" (relatif à l'efficacité du système économique libéral) est faux… Technique connu depuis Schopenhaueur : démonter les arguments et faire croire qu'on a démonter le but.

D'autre part il est puant par ce qu'il dit que dans les faits les gens ne suivent pas la "raison" qui voudrait qu'on atteigne l'équilibre de Nash qui serait 2-2. Bref une belle théorie détruite par de vilains faits. Typiquement l'impudence accadémique comme je ne la supporte pas. Plutôt que de se demander ce qui cloche dans la théorie des jeux et comment on pourrait l'adapter ou la changer pour qu'elle colle mieux à la réalité il sous-entend que les gens sont débiles et y voit une preuve que libéralisme est une erreur. Assez incroyable quand même quand on y songe un instant.

Coldstar · 1 juillet 2007

Le jeu ne tient pas compte de la valeur accordée au risque. Si je préfère dire 100 et risquer d'avoir 0 plutôt que de dire 2 et avoir 2, je ne suis pas irrationnel. Quel est la différence entre avoir 2 ou 0 lorsqu'on a perdu un objet de haute valeur? C'est une insulte d'avoir 2.

Tu as gagné.

En fait, le postulat absolument ridicule du raisonnement rétroductif dans cet exemple c'est de faire le raisonnement suivant:

* A la première étape du raisonnement, on se rend comte que déclarer 99 si l'autre déclare 100 fait gagner 1 si l'autre joue pareil

…

* A la xème étape, se rendre compte que déclarer 2 au lieu de trois fait gagner 1

Point par point, le raisonnement est logique, mais pas dans sa globalité dès qu'on introduit une hypothèse réaliste: l'incertitude dans le raisonnement que fait l'autre joueur.

Car à la fin de son raisonnement, le joueur qui a effectué ce calcul sensé peut avoir le comportement (rationnel :icon_up: ) de comparer le raisonnement rétroductif à d'autres raisonnement et/où de vérifier son calcul et se rendre compte que déclarer 2 c'est gagner presque rien, il développe alors l'espoir, ou la croyance, très rationnelle, que l'autre joueur s'en rendra compte aussi, et qu'il adoptera une stratégie coopérative.

Parce qu'en dernière analyse, jouer pour gagner 4 et se rendre compte en découvrant la strtégie adverse qu'on pouvait gagner 100 en "risquant" le pronostic de la coopération adverse, il y a de quoi se bouffer les couilles en pot-en-feu!

Si j'estime à plus de 4% (trois fois rien) la probabilité que l'autre songe à coopérer, alors j'ai tout intérêt, et lui aussi peut faire ce raisonnement, à viser le plus haut possible et à abandonner la stratégie du minimax.

Conclusion: dans cette exemple, la stratégie de coopération en situation d'incertitude s'impose. SAUF:

Si on introduit une de ces deux hypothèses:

- une différence de 1 dans le gain final certain déclenche un processus psychologique de rejet (sentiment de désagrément) dûe à une aversion au risque exacerbée [c'est le cas dans le vrai DDP où la perte équivaut à plus de prison: là, c'est une situation propice à l'aversion]. C'est-à-dire une préférence quasi-irrationnelle pour le minimax. Et ce processus de rejet doit être tel que la force du sentiment de rejet de la perte EXCEDE en intensité le désagrément du sentiment de la proposition: "découvrir qu'on a joué 2 et l'autre 100".

-une volonté absolue de voir l'autre gagner le moins possible (stratégie du Minimax adverse).

… deux hypothèses au réalisme douteux! Le libéralisme ne mourra pas de la main de cet exemple :doigt:

Sous-Commandant Marco · 1 juillet 2007

En fait, ce qui me gêne dans l'article, et qui démontre à mon sens que l'auteur se plante, c'est la faiblesse de la récompense (2) par rapport au gain maximal possible (101). Lorsque la récompense est plus grande, le comportement des joueurs se rapproche du "choix rationnel", tel qu'édicté par la théorie des jeux. En effet, dans ce cas, les joueurs ont intérêt à être égoïstes. Or cette récompense plus forte n'est envisagée qu'en quelques lignes dans l'article.

Lorsque la récompense est faible, il me paraît évident que le choix rationnel consiste à chercher à obtenir le plus possible, tout en supposant que l'autre joueur fera de même, donc à demander un montant très proche du maximum. En effet, même si le gain est amputé de la pénalité, il a de fortes chances de rester tout de même très élevé, si l'autre joueur agit de même. Alors que le choix 2 garantit le gain certes, mais un gain très faible.

De fait, plus de 50% des joueurs demandent carrément le maximum et plus de 30% un montant à peine inférieur. Alors que quelques pourcents à peine demandent la valeur de l'équilibre de Nash. Et encore, on peut légitimement se demander si ces derniers ne veulent tout simplement pas ne pas gêner la compagnie aérienne en lui demandant une somme d'argent pour compenser une perte fictive.

Le Clown · 1 juillet 2007

De toutes façons, il faut être clair, la théorie des jeux n'a aucune valeur prédictive. Cette théorie ne peut pas servir à prévoir si, en situation réel, des individus parviendront à se coordonner et quel équilibre émergera. D'ailleurs, dès l'instant que l'on se place en jeu répété (ce qui n'est pas le cas dans l'article), il y a le "folk theorem" (le théorème de tout le monde) : à partir du moment où les joueurs accordent suffisament d'importance aux gains susceptibles d'être réalisés dans le futur, les agents peuvent réaliser n'importe quel niveau d'utilité physiquement possible. En d'autres termes, il y a des équilibres multiples et il n'y a aucun moyen de savoir lequel se réalisera effectivement.

Donc, il est clair que l'auteur abuse au niveau des conclusions qu'il tire dans son article, en tout cas concernant le libéralisme. De toutes façons, la théorie des jeux n'a pas pour vocation à justifier un système politique ou une organisation sociale. Celui qui prétend le contraire est un escroc. Maintenant, je reste néanmoins persuadé que cette approche peut éclairer sur les interactions sociales, encore une fois pas par ce que cette théorie explique, mais par ce qu'elle n'explique pas. Aussi paradoxal que cela puisse paraître…

Coldstar · 1 juillet 2007

En fait, ce qui me gêne dans l'article, et qui démontre à mon sens que l'auteur se plante, c'est la faiblesse de la récompense (2) par rapport au gain maximal possible (101). Lorsque la récompense est plus grande, le comportement des joueurs se rapproche du "choix rationnel", tel qu'édicté par la théorie des jeux. En effet, dans ce cas, les joueurs ont intérêt à être égoïstes. Or cette récompense plus forte n'est envisagée qu'en quelques lignes dans l'article.
Lorsque la récompense est faible, il me paraît évident que le choix rationnel consiste à chercher à obtenir le plus possible, tout en supposant que l'autre joueur fera de même, donc à demander un montant très proche du maximum. En effet, même si le gain est amputé de la pénalité, il a de fortes chances de rester tout de même très élevé, si l'autre joueur agit de même. Alors que le choix 2 garantit le gain certes, mais un gain très faible.

Pourquoi as-tu pris la peine de reformuler si longuement ce que j'ai écrit au-dessus? :icon_up:

Sous-Commandant Marco · 1 juillet 2007

Pourquoi as-tu pris la peine de reformuler si longuement ce que j'ai écrit au-dessus?

N'y vois aucune mauvaise intention de ma part, je voulais juste ajouter deux précisions sur la valeur de la récompense et sur les résultats des expériences, car elles contredisent les attentes de l'auteur de l'article.

2 juillet 2007

C'est totalement stupide. Depuis quand faire confiance en son prochain est-il forcément irrationnel ?

Moi j'annoncerais 100 !

Si j'annonce une forte somme j'ai des chances que mon partenaire le fasse également et j'ai une forte chance de gagner beaucoup, surtout si il fait le même calcul que moi. Dans le cas contraire je vais gagner peu, mais de toute façons l'équilibre de Nash ne rapporte rien donc je ne risque pas grand chose. Si mon partenaire annonce un prix juste en dessous et bien je perd deux (la belle affaire !). L’espérance de gain est bien meilleur lorsque l’on annonce la somme la plus élevée possible.

La seule chose que montre cet exemple débile c'est que les gens normaux sont plus rationnels que les mathématiciens socialistes bornés. La preuve c'est qu'au final deux "mathématiciens" récupéreraient beaucoup moins à ce jeux que deux individus "irrationnels".

Coldstar et SCM m'ont doublé.

Le Clown · 2 juillet 2007

L’espérance de gain est bien meilleur lorsque l’on annonce la somme la plus élevée possible.

Il n'y a aucune espérance de gain car l'hypothèse de common knowledge fait que tu es sur et certain que ton partenaire va annoncer 2. Le fait que l'exemple soit débile n'a aucune importance (l'exemple n'est qu'un prétexte), il s'agit juste d'illustrer le résultat d'une certaine configuration d'interaction entre deux individus stratégiquement rationnel.

Encore une fois, il s'agit juste de l'une des variantes du dilemme du prisonnier, avec toute la pertinence (ou la non pertinence) qui l'accompagne. Et encore une fois, la théorie des jeux n'est ni socialiste ni libérale.

Je vais me faire l'avocat du diable, non pas que je pense que l'auteur ne soit pas anti-libéral, mais l'auteur dit précisément : "Les premières théories économiques étaient fermement ancrées au présupposé libéral (en anglais je crois qu'il dit même "classical liberalism") selon lequel on devrait laisser les individus se débrouiller tout seuls, parce que leurs choix égoïstes se traduiraient par un fonctionnement efficace de l'économie. L'essor de la théorie des jeux a déjà fait beaucoup pour libérer l'économie de ce présupposé". Ce qu'il dit, et ce qui est vrai, c'est que la théorie des jeux montre que des individus purement égoïstes n'arriveraient pas à ce coordonner. En clair, ça réfute l'idée de la main invisible elle-même fondée sur la fable des abeilles de Mandeville.

Ce que montre les expérimentations, c'est que les individus ne se comportent pas de manière purement égoïste mais que d'autres éléments sont pris en compte. Voilà, point barre, c'est tout. Ce n'est ni pro- ni anti-libéral. Après, l'auteur n'est peut être pas totalement honnête, mais c'est là un vice très commun, voir par exemple un article dans un post récent où l'auteur évoque le théorème de Arrow pour "démontrer" qu'il vaut mieux avoir une dictature qu'une démocratie… Une escroquerie intellectuelle au moins aussi grande qui n'a pourtant pas soulevée beaucoup d'objection ici…

http://www.liberaux.org/index.php?showtopic=31730

Le dilemme du voyageur

Messages recommandés

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Invité Arn0

Lien vers le commentaire

Lien vers le commentaire

Archivé