Recherche

Essai Économie

L’économie, une science expérimentale ?


par Sylvie Thoron , le 21 octobre 2016


Au sein des sciences économiques, l’étude du comportement se nourrit d’un dialogue fécond entre théorie et expérience. Mettant en cause le modèle de rationalité de l’Homo œconomicus, celui-ci jette une nouvelle lumière sur la prise de décision dans les situations d’interaction stratégique.

Le courant dominant des sciences économiques est connu des autres sciences sociales pour son modèle de l’agent rationnel et égoïste. Le fameux Homo œconomicus prend ses décisions en anticipant sans faille celles des autres, en évaluant au mieux les situations risquées, et sans état d’âme, maximise son utilité qui dépend de son seul bien-être. Pourtant, ce modèle de l’agent économique a été largement mis en cause par les économistes eux-mêmes, lorsque ceux-ci ont tenté de le confronter aux comportements des individus réels.

Comment s’y sont-ils pris ? Ils auraient pu aller voir dans les entreprises comment les managers prennent leurs décisions, ou dans les maisons, comment les ménages font leurs courses. C’est ce que font, dans une certaine mesure, les gestionnaires. Au lieu de cela, ils ont fait venir les individus dans des laboratoires expérimentaux installés au sein des universités, pour analyser leurs comportements. Un laboratoire expérimental, c’est une pièce informatique meublée de boxes isolés par des paravents. Dans chaque box, un ordinateur, seul interface du « sujet » avec les autres. Chacun prend connaissance d’une situation, décrite sur son écran et expliquée par des instructions, et doit faire des choix. Pour tester le modèle théorique de l’agent économique, il faut que les conditions de l’expérience se rapprochent le plus possible de la théorie. Tout cet agencement est destiné à créer des conditions que l’expérimentaliste peut contrôler. Celui-ci doit pouvoir travailler la situation comme un biologiste dissèque une grenouille ou élève des populations de drosophiles dans des conditions différentes : l’économiste veut, comme le dit la littérature expérimentale, « isoler les effets ». L’expression peut être trompeuse. Il ne s’agit pas des effets observés de certaines causes mais des mécanismes supposés par les économistes pour expliquer certains comportements, donc plutôt des causes elles-mêmes.

La littérature expérimentale est plus qu’abondante. Ici, nous nous concentrerons sur les travaux qui s’intéressent aux situations dites d’interactions stratégiques, dans lesquelles l’individu sait que ses décisions ont une influence sur les décisions des autres, et réciproquement. Nous commencerons par expliquer la méthode qui permet aux expérimentalistes de mettre en évidence certains des « effets » escomptés dans une telle situation. Nous verrons que ce travail d’observation et d’interprétation prend le modèle théorique de l’Homo œconomicus stratégique pour référence. Les expérimentalistes tentent d’interpréter les différences entre les comportements observés et les comportements prévus par la théorie, ce qui les amène à repenser le modèle de la rationalité. Pour comprendre leurs travaux, nous verrons qu’il est utile de distinguer, dans le modèle de la rationalité, la façon dont l’agent économique raisonne, c’est-à-dire la façon dont il collecte et traite l’information d’une part, et ses motivations d’autre part.

Les expériences de laboratoire en économie

Formellement, c’est la théorie des jeux qui est utilisée pour étudier le comportement de l’Homo œconomicus dans les situations d’interactions stratégiques. Il s’agit alors de décrire, comme dans un jeu de société, qui sont les « joueurs », quelles sont les règles à respecter et comment les gains dépendent des décisions des uns et des autres. Chaque joueur connaît toutes ces informations et les traite au mieux pour choisir la stratégie qui maximise son utilité. Afin de comparer les comportements d’individus réels interagissant avec leurs semblables à ce que prédit la théorie des jeux, la littérature expérimentale construit des protocoles qui décrivent la façon dont le jeu théorique va effectivement être joué par les sujets dans le laboratoire.

Prenons l’exemple du jeu de l’ultimatum, grand classique utilisé pour la première fois comme base d’un protocole expérimental par Werner Güth et ses coauteurs en 1982, et repris maintes fois depuis dans la littérature (voir Camerer 2003). Il s’agit d’une situation d’interaction simple entre deux individus. Chaque sujet dans son box prend connaissance des instructions qui décrivent le protocole. Il apprend qu’il forme une paire avec un des participants, sans savoir qui ; et qu’une petite somme d’argent, de l’ordre d’une dizaine d’euros, est à leur disposition. De deux choses, l’une. Soit le sujet a pour rôle de proposer un partage de la somme avec son binôme, et il est alors celui qui pose l’ultimatum. Soit il est celui qui reçoit la proposition et peut alors seulement l’accepter ou la refuser. Il a alors un droit de veto. S’il accepte, les deux sujets de la paire reçoivent un montant conforme au partage proposé par le premier. S’il refuse, aucun des deux ne touche rien. Toutes ces informations, que l’on appelle les règles du jeu, sont connues des deux membres de la paire. On dit qu’elles sont « connaissance commune », ce dont l’expérimentateur s’assure en lisant les instructions à haute voix au début de l’expérience. Une autre caractéristique importante de l’approche expérimentale en économie est donc aussi que les sujets sont payés à la fin de la séance en monnaie sonnante et trébuchante, en fonction des résultats.

L’intérêt du jeu d’ultimatum n’est pas tant de représenter une situation réelle que de servir d’outil pour disséquer et comprendre le comportement des sujets. La théorie des jeux prédit que le deuxième sujet, s’il se comporte en Homo œconomicus, n’exercera jamais son droit de veto si on lui propose n’importe quelle somme strictement supérieure à zéro, car son paiement (payment) sera alors toujours plus élevé que s’il refuse le partage. En conséquence, la théorie prédit que le premier sujet proposera à son partenaire le montant minimum supérieur à zéro, un centime par exemple, car c’est ainsi qu’il maximise son gain. Qu’a-t-on pu observer dans les expériences ? Ce jeu a été utilisé tant de fois comme base de protocoles expérimentaux, et l’on a si souvent observé le même type de comportement, que l’on parle de « faits stylisés » : généralement, le premier sujet propose de laisser à son partenaire près de 40% du montant et, généralement, le sujet qui répond accepte, mais refuse lorsque le montant proposé est inférieur à 20%. Bien entendu ces résultats sont issus de traitements statistiques de données d’une grande hétérogénéité, mais ils sont clairement significatifs. Si l’on compare le comportement observé à ce que prédit la théorie des jeux, la conclusion semble sans appel. Le comportement du sujet réel n’est pas conforme à ce que prédit le modèle théorique. Homo œconomicus est trop égoïste. Fin de l’histoire ?

Pas tout à fait, car on peut avancer au moins deux catégories d’ « effets » au sens économique, qui permettent d’expliquer, d’une part, que le sujet qui pose l’ultimatum se montre relativement généreux, et d’autre part que son partenaire refuse des montants strictement positifs. Dans une première catégorie d’effets le sujet est intrinsèquement généreux, se préoccupe de son partenaire, ou encore, prend en compte des normes sociales, des valeurs, etc. Toutes ces raisons peuvent sembler bien sûr très différentes les unes des autres pour un sociologue ou un psychologue, mais pas pour un économiste fidèle au modèle standard, car aucune d’elles n’est prise en compte dans la représentation d’Homo œconomicus.

Le modèle économique peut par contre capter la deuxième catégorie d’effets. Ceux-ci permettent d’expliquer, au moins, le comportement du sujet qui pose l’ultimatum : ce sont les effets stratégiques. En l’occurrence, le premier sujet a peut-être été relativement généreux parce qu’il anticipait le refus de son partenaire s’il ne l’était pas. Pour mettre clairement en évidence les effets non stratégiques de la première catégorie, il faut donc imaginer un autre « traitement » du protocole, en tout autre point comparable au précédent, sauf que le sujet qui reçoit la proposition, cette fois-ci, ne peut pas y répondre. Il s’agit alors du jeu du dictateur. Le premier sujet ne pose plus d’ultimatum, il dicte le partage. C’est sa décision qui détermine ce que recevront les deux membres de la paire. En comparant le traitement ultimatum et le traitement dictateur, les expérimentalistes ont alors pu observer que le premier sujet était plus généreux quand il posait un ultimatum que lorsqu’il était dictateur, et ils en ont déduit que les aspects stratégiques jouaient néanmoins un rôle. Les sujets réels sont certes moins égoïstes qu’Homo œconomicus, mais ils partagent avec lui, dans une certaine mesure, le goût de la stratégie.

Ainsi, en construisant un protocole qui décrit les conditions de l’expérience et en variant les traitements, l’expérimentaliste compare les comportements et isole différents « effets ». La méthode reste cependant essentiellement hypothético-déductive. La construction du protocole, comme l’interprétation des observations, se font en référence à un modèle de l’Homo œconomicus stratégique issu de la théorie des jeux.

L’Homo œconomicus stratégique comme référence

Pour comprendre en détail comment s’opère la comparaison avec le modèle théorique, prenons ici un autre exemple de jeu, tout aussi simple et célèbre que le jeu de l’ultimatum discuté plus haut : le dilemme du prisonnier représenté dans la matrice ci-dessous [1].

Ce jeu ne comporte que deux joueurs et deux stratégies : coopérer (C) ou ne pas coopérer (NC). La coopération génère des bénéfices collectifs mais elle est individuellement coûteuse. Les paiements sont symétriques. La coopération des deux joueurs produit le paiement total le plus élevé et des paiements individuels égaux. Le choix de ne pas coopérer de la part des deux joueurs génère une situation inefficace dans laquelle chaque joueur reçoit une somme inférieure à celle qu’il obtiendrait si les deux joueurs coopéraient. Restent deux situations symétriques dans lesquelles un joueur coopère et l’autre pas. Celui qui ne coopère pas tire parti des efforts de l’autre sans lui-même en assumer les coûts et reçoit ainsi un paiement supérieur à ce qu’il obtiendrait en situation de pleine coopération. Le sort de celui qui coopère est en revanche pire que lorsqu’aucun des deux ne coopère.

La situation dans laquelle les deux joueurs ne coopèrent pas constitue ce que les théoriciens des jeux appellent un équilibre de Nash, c’est-à-dire une situation dans laquelle aucun des deux joueurs n’a intérêt à changer de stratégie, étant donné la stratégie d’équilibre de l’autre [2]. L’équilibre de Nash du jeu constitue ce que l’on appelle « la prédiction théorique ». L’autre issue qui présente un intérêt particulier est la situation dans laquelle les deux joueurs coopèrent, car il s’agit de l’optimum social. Elle maximise la somme des gains, et elle est de plus dite efficace (au sens de Pareto) [3] car aucune des trois autres issues n’est préférable pour les deux joueurs ensemble. Équilibre de Nash et optimum social constituent les deux situations de référence.

Il faut bien comprendre ce que ce résultat a d’étonnant. La théorie prédit que les joueurs décideront de ne pas coopérer alors qu’ils auraient un intérêt commun à le faire. Ces deux Homo œconomicus rationnels et stratégiques, qui ont pour unique objectif de maximiser leurs paiements, finissent avec un gain de 2€ à l’équilibre quand ils auraient pu se mettre d’accord pour avoir chacun quatre fois plus ! Ce résultat est particulièrement perturbant pour les économistes car la rationalité est censée être, par définition, la meilleure arme d’Homo oeconomicus pour maximiser son gain. Les économistes alors ont tenté de comprendre ce qui empêchait les joueurs de coopérer dans ces conditions.

Ils ont tout d’abord observé que les situations qui présentent les enjeux stratégiques du dilemme du prisonnier ne sont pas si courantes en économie car, la plupart du temps, les agents économiques ne sont pas dans des relations aussi éphémères où les décisions sont prises une bonne fois pour toutes. En particulier, la question de la coopération se pose lorsque les deux agents entretiennent une relation suivie dans le temps, qui les oblige à renouveler leur engagement mais qui leur permet aussi de revenir sur leurs décisions. Les théoriciens des jeux ont alors proposé un nouveau jeu, en répétant simplement plusieurs fois le dilemme du prisonnier de la matrice précédente. Ils ont ensuite montré que lorsque le jeu était répété indéfiniment, il était parfaitement rationnel de coopérer. En effet, la relation de long terme permet de soutenir la coopération par une « menace », qui peut être simplement le retour définitif à la situation de non-coopération (stratégie dite « de déclic »).

Malheureusement, si les joueurs savent que la relation aura une fin, plus rien n’est possible. En effet, selon la rationalité supposée dans un jeu répété de ce type, Homo œconomicus anticipe tout le déroulement du jeu, qu’il « résout » par induction à rebours en commençant par la fin. Or, à la dernière étape il n’est plus possible de brandir une quelconque menace puisque la relation ne sera pas poursuivie. Homo œconomicus raisonne alors comme dans le jeu simple, en un coup, et ne coopère pas. À l’avant-dernière étape, il anticipe ce qui se passera à la dernière et comprend que la menace n’est pas plus crédible à ce stade qu’au précédent. En continuant à raisonner à rebours de cette façon jusqu’à la première étape où s’engage la relation, Homo œconomicus en déduit que le mieux qu’il ait à faire est de ne jamais coopérer. Dès lors que la relation entre les deux agents est perçue comme étant finie, il n’y a plus de menace crédible et donc plus de coopération. Bien sûr, si le nombre de répétitions est important le raisonnement à rebours parait particulièrement artificiel. Il reste que la parfaite rationalité d’Homo œconomicus conduit à nouveau à une issue inefficace.

Homo œconomicus est-il trop intelligent ? La rationalité limitée

Il est possible de généraliser le dilemme du prisonnier à plus de deux joueurs. On obtient ainsi le jeu de contribution au bien public. Ce jeu est censé saisir les enjeux stratégiques qui se cachent derrière des problèmes réels complexes, tels que la contribution des différents pays à la diminution des gaz à effet de serre dans le cadre de la lutte contre le changement climatique, ou la mise en place de tout système de contribution volontaire en vue de fournir un bien public.

Le jeu de contribution au bien public a constitué la base de nombreux protocoles expérimentaux. Il s’agit cette fois-ci, dans le laboratoire, de mettre en relation un groupe de plus de deux sujets, toujours physiquement isolés dans leurs boxes, mais communicant par l’intermédiaire de leurs écrans selon des règles précisément décrites par l’expérimentateur. Chaque membre du groupe reçoit une somme au début de l’expérience et doit alors décider d’utiliser, ou pas, tout ou partie de cette somme pour contribuer à un pot commun. Ce qui n’est pas mis dans le pot commun est conservé comme paiement privé. Les instructions expliquent alors que le pot commun permet de générer un surplus, ou bien public, qui sera ensuite réparti également entre les membres. Formellement, le total des contributions du groupe est multiplié par un coefficient, variant selon les protocoles et traitements, mais qui est toujours inférieur au nombre de membres dans le groupe. En conséquence, les sujets sont incités à contribuer au pot commun pour produire un surplus, mais puisque ce surplus est partagé de façon égalitaire quelles que soient les contributions des uns et des autres, chaque sujet gagne davantage si ce sont seulement les autres qui contribuent. Le surplus le plus important est produit lorsque chaque sujet verse dans le pot commun l’intégralité de la somme qui lui a été allouée, ce qui correspond à l’optimum social. Prenons un exemple simple avec un coefficient de deux et quatre sujets qui ont chacun une dotation de 5€. Si chacun verse au pot commun la totalité de sa contribution, le bien public à partager sera de 40€ et chacun recevra 10€ en en ayant versé 5. Mais si trois sujets seulement versent 5€ et qu’un sujet ne verse rien, ce dernier qui aura conservé sa dotation recevra 12,50€ et les autres, seulement 7,50€.

La théorie prédit qu’Homo œconomicus ne contribuera pas et à l’équilibre de Nash la somme des contributions est nulle. En effet, chaque joueur n’a même pas à réfléchir à ce que vont faire les autres. Quoi qu’ils fassent, sa meilleure réponse est de ne rien verser au pot commun. Or cette situation est très inefficace car si chaque joueur conserve sa dotation, le groupe perd l’occasion de tirer parti du bien public. On est face au même problème que dans le dilemme du prisonnier, l’équilibre n’est pas efficace.

Avant d’en venir aux observations, nous devons préciser certains éléments du protocole. En général, dans les expériences, le jeu est répété plusieurs fois. Autrement dit, à chaque étape, chaque sujet a la même somme à sa disposition et doit décider de la part qu’il entend allouer au pot commun. Cette répétition a pour objet de permettre aux sujets de se familiariser avec les règles et de bien les comprendre. Or, théoriquement, comme dans le cas du dilemme du prisonnier, cette répétition n’a pas de conséquence sur le comportement observé d’Homo œconomicus qui, de la première à la dernière étape, ne contribue pas. Que font par contre les sujets des expériences ? Là encore, les nombreuses observations constituent de véritables faits stylisés en opposition avec les prédictions théoriques. Les contributions sont au départ, en général, de l’ordre de 40 à 60% de la dotation, puis diminuent pour se rapprocher du résultat théorique.

Selon une première interprétation, les sujets ont une rationalité limitée par rapport à Homo œconomicus. Ils ne sont pas capables de faire cette induction à rebours décrite plus haut et raisonnent donc dans le jeu répété comme si l’horizon était infini. Cette interprétation pourrait expliquer que leur comportement se rapproche du comportement théorique lorsque la fin de l’expérience approche, et donc que l’horizon apparaît manifestement fini. Ainsi les sujets seraient victimes d’une myopie qui ne leur permettrait pas de raisonner de façon rationnelle avant d’être suffisamment proches de la fin de l’expérience, mais cette limitation de leur rationalité leurs permettrait d’être plus proches de l’optimum social qu’Homo œconomicus.

Certains économistes ont voulu éliminer les effets stratégiques du jeu répété tout en laissant aux sujets la possibilité de pratiquer plusieurs fois les règles du protocole pour bien les maîtriser. Comment alors ne pas dénaturer l’esprit du jeu en le répétant plusieurs fois ? Ils ont proposé de comparer deux traitements. Dans le premier, dit traitement avec partenaires, le groupe de sujets reste le même pendant toute la durée de l’expérience ; dans le second, dit traitement avec étrangers, le groupe est reconstitué à chaque étape. L’idée sous-jacente est que les stratégies du jeu répété ne peuvent être mises en place qu’au sein d’un groupe de partenaires. La menace ne peut en effet être dissuasive si la relation n’est pas suivie dans le temps. On devrait donc s’attendre à ce que les sujets du traitement avec étrangers contribuent moins.

Or les résultats ont de quoi laisser perplexe Homo œconomicus. Dans les deux traitements, le schéma précédent persiste. Les contributions sont relativement généreuses au début puis diminuent pour atteindre des niveaux faibles en fin de partie. Il apparait clairement que la diminution est moins importante dans le traitement avec étrangers que dans le traitement avec partenaires, mais en définitive les sujets du traitement avec étrangers contribuent bien davantage que les sujets du traitement avec partenaires (Ledyard 1995). Plus rien ne semble tenir. Les interprétations en termes de coopération stratégique d’Homo œconomicus, même en supposant une rationalité limitée, ne marchent pas, puisque les sujets coopèrent même mieux lorsqu’ils n’ont pas de relation suivie.

Redéfinir la rationalité

Intrigués par ces résultats, les expérimentalistes se sont mis à regarder de plus près les données individuelles. S’écartant de la détection du comportement moyen et représentatif, ils ont pu découvrir une grande hétérogénéité de comportements. La littérature a alors développé un deuxième type d’interprétation, selon lequel les sujets n’ont pas une rationalité limitée par rapport à Homo œconomicus, mais des rationalités différentes. Autrement dit, il n’existerait pas une seule rationalité, celle qui est censée permettre à un individu un traitement optimal de l’information disponible pour maximiser son utilité, mais plusieurs. Plutôt que d’interpréter cette hétérogénéité comme la manifestation de comportements « déviants » par rapport à une norme rationnelle indépassable, les expérimentalistes ont commencé à étudier ces comportements hétérogènes comme doués d’une logique propre, et à établir des typologies.

Dans les expériences basées sur le jeu de contribution à un bien public qui nous intéressent ici, trois grandes catégories de sujets semblaient se dégager. Les opportunistes, qui se comportent comme Homo œconomicus, sont minoritaires. À l’inverse, des sujets versent la quasi-totalité de leur dotation dans le pot commun, indépendamment de ce que font les autres ; ceux-là aussi sont minoritaires. On trouve enfin les contributeurs conditionnels, qui commencent par contribuer beaucoup mais qui conditionnent ensuite leur générosité à celle qu’ont manifestée les autres au cours des étapes précédentes. Cette typologie permet de donner une tout autre interprétation des faits stylisés décrits ci-dessus. Selon cette interprétation, les contributions du début de la séquence résultent de la moyenne des contributions élevées des contributeurs inconditionnels et conditionnels et des contributions nulles ou faibles des opportunistes. Puis, au fur et à mesure que les contributeurs conditionnels observent un total des contributions en deçà de leurs espérances, ils commencent à diminuer leurs propres contributions, ce qui provoque un effet d’entraînement délétère. Parce qu’ils ne recourent pas à des menaces mais regardent vers le passé, les contributeurs conditionnels ne seront pas plus optimistes dans un groupe de partenaires que dans un groupe d’étrangers. La baisse de leurs contributions n’est pas une punition infligée à des partenaires qui ne sont pas suffisamment coopératifs mais manifeste leur adaptation aux circonstances. Ainsi dans le traitement avec étrangers, certains contributeurs conditionnels retrouvent parfois un peu d’optimisme sachant que la constitution du groupe change, et contribuent davantage qu’à l’étape précédente, ce qui ralentit la diminution du pot commun.

Cette interprétation en termes de rationalités différentes n’est pas sans rappeler une expérience d’un tout autre type, menée au début des années 1980 par le politiste américain Robert Axelrod (1984). Celui-ci avait lancé un tournoi entre des chercheurs de différentes disciplines, politistes, économistes, théoriciens des jeux, mathématiciens, statisticiens et autres, leurs demandant de proposer une stratégie pour jouer le dilemme du prisonnier répété. Si la théorie considère que l’équilibre en stratégies dominantes est particulièrement robuste parce que le joueur n’a pas besoin de savoir ce que sera la stratégie de son concurrent pour faire son choix, c’est parce qu’elle pose une hypothèse forte : tout le monde raisonne de la même façon. Axelrod lança son tournoi parce qu’il doutait de cette robustesse. Chaque participant soumit sa stratégie sous forme d’un mini programme. Axelrod associa chaque stratégie à une autre stratégie candidate, tirée au sort dans l’ensemble des propositions, pour jouer le dilemme du prisonnier cent fois. Pour chaque stratégie, il répéta l’opération des dizaines de fois, associant à chaque fois la stratégie à une concurrente tirée au sort. Il, calcula ainsi un score sur la base de la moyenne des gains de la stratégie. La stratégie gagnante fut une stratégie très simple, proposée par le politiste Anatol Rapoport et dénommée « Tit for Tat » [un prêté pour un rendu]. Tit for Tat commence toujours par coopérer puis fait, à chaque étape, ce que le concurrent a fait à l’étape précédente. Homo Œconomicus gagne (de peu) contre Tit for Tat seule, mais Tit for Tat fait bien mieux lorsque la stratégie est confrontée à tout un ensemble de stratégies différentes.

L’expérience d’Axelrod a pu servir d’argument au développement d’une nouvelle approche des situations d’interaction en économie, concurrente de la théorie des jeux standard, à savoir la théorie des jeux évolutionnaires. Selon cette approche, les agents ne sont plus nécessairement aussi rationnels qu’Homo œconomicus. Ce sont au contraire des automates aux stratégies très simples, mais différentes. Les jeux évolutionnaires reposent sur des méthodes construites par analogie avec la sélection naturelle darwinienne. Cette approche a d’ailleurs d’abord été développée dans les années 1970 en biologie, notamment par John Maynard Smith (Maynard Smith 1982), avant d’être importée en économie.

L’objectif de cette approche est de savoir comment, dans une population hétérogène d’agents, les proportions des différentes stratégies vont évoluer. Selon une première méthode, on considère une population hétérogène d’individus. Chacun se caractérise par une stratégie fixe. Les individus de cette population se rencontrent maintes fois de façon aléatoire. Ils se « reproduisent » alors proportionnellement à l’utilité qu’ils retirent de leurs interactions. Ce processus, qui fait évidemment écho à l’idée de sélection naturelle, est appelé la « dynamique du réplicateur ». Cette dynamique peut, à long terme, converger vers des proportions fixes des différentes stratégies.

Une autre méthode consiste à imaginer qu’existe une stratégie prévalente que tout le monde a adoptée. La population de départ est alors homogène et la question se pose de savoir si cette situation est stable. Des individus mutants, caractérisés par une autre stratégie, sont introduits de façon aléatoire dans la population à chaque période. On dit alors qu’une stratégie est évolutionnairement stable si la population homogène de départ ne peut pas être envahie par une stratégie mutante. Autrement dit, les individus jouant la stratégie mutante qui sont introduits dans la population ne parviennent pas à avoir une utilité supérieure à ceux qui continuent à jouer l’ancienne stratégie. On comprend que, dans cette approche, la rationalité est transférée du niveau de l’individu au niveau de la société. Loin de l’individualisme méthodologique cher aux sciences économiques, et en dépit de limites techniques importantes, cette littérature théorique continue de se développer parallèlement aux études consacrées à la rationalité de l’individu. Ces dernières ont connu par ailleurs d’autres bouleversements, comme nous allons le voir.

Homo œconomicus est-il trop égoïste ?

Parallèlement au développement de ces réflexions sur la rationalité au sens du raisonnement et de l’anticipation, d’autres économistes se sont intéressés à la motivation des sujets. Ils ont proposé de modifier le modèle standard d’Homo œconomicus en modifiant seulement les motivations qui lui sont attribuées, sans toucher aux hypothèses du modèle standard de la théorie des jeux concernant la façon de raisonner. Ainsi, la théorie des préférences sociales prend acte du fait que les individus se comportent comme s’ils valorisaient positivement ou négativement les paiements des autres. Il y a alors plusieurs façons de modifier le modèle standard pour intégrer cette interprétation.

Le modèle le plus simple et le plus connu est le modèle dit d’aversion aux inégalités proposé par Ernst Fehr et Klaus Schmidt en 1999. Les auteurs ont proposé de modifier la fonction d’utilité d’Homo œconomicus, qui ne dépend que de son propre paiement matériel, en y intégrant simplement une composante qui est la différence entre le paiement de l’individu et celui de l’autre ou une moyenne de ceux des autres. La fonction d’utilité est alors une somme pondérée du paiement matériel du joueur et de cette composante « sociale » que représente l’aversion aux inégalités. Ainsi l’utilité de l’individu n’augmente pas nécessairement avec son paiement si cette dernière devient beaucoup plus importante que celle de son ou ses partenaires.

L’hétérogénéité dans ce modèle réside dans la différence de sensibilité aux inégalités entre individus. L’agent est cependant toujours plus sensible aux inégalités qui sont en sa défaveur qu’à celles qui sont en sa faveur ; il valorise l’égalité des paiements mais il est aussi plus ou moins légèrement biaisé en sa propre faveur. Fehr et Schmidt ont montré que leur modèle permettait de reproduire fidèlement les faits stylisés issus des protocoles ultimatum. Le modèle a ensuite été utilisé pour expliquer les comportements observés dans d’autres jeux avec une réussite certaine. On peut dire aujourd’hui qu’il a connu un succès phénoménal dans la littérature économique. Parmi les articles publiés dans le Quarterly Journal of Economicsdepuis sa création, celui de Fehr et Schmidt est le quatrième article le plus cité. Le dialogue fructueux entre expérience et théorie n’allait pourtant pas s’arrêter là.

Trois ans seulement après la publication de l’article de Ferh et Schmidt, un groupe d’expérimentalistes, Cherry et al. (2002), ont publié de nouveaux résultats qui remettent en question les fameux faits stylisés que l’on pensait avoir expliqués. Au protocole traditionnel basé sur le jeu du dictateur, les auteurs proposent d’ajouter une première étape au cours de laquelle le dictateur doit accomplir une tâche pour gagner le montant qu’il pourra partager dans la deuxième étape. Il apparait que le dictateur devient alors très égoïste et son comportement est à nouveau conforme à ce que prédit la théorie toujours dominante. Pour autant cet article ne donne pas raison à cette théorie mais montre que l’explication en termes d’aversion aux inégalités est sans doute un peu trop simple. L’expérience permet en effet de comprendre que les protocoles à la base de cette vaste littérature expérimentale sur les jeux d’ultimatum et du dictateur partent tous d’une hypothèse fausse, selon laquelle les sujets n’accorderaient pas d’importance à l’origine du montant qu’ils ont à partager. Autrement dit, dans les protocoles comme dans la fonction d’utilité, l’argent n’aurait pas d’odeur. Cette hypothèse, concluent les auteurs, aurait cependant dû être mise en question en même temps que celle du comportement égoïste des agents.

Une nouvelle littérature expérimentale se développe alors, basée sur un protocole-type composé de deux étapes : une première étape dans laquelle, à la différence du cadre de Cherry et al., tous les sujets participent pour gagner une somme qui peut être ensuite partagée dans la deuxième étape. On comprend que l’aversion aux inégalités a pu constituer une interprétation pertinente parce que l’absence de phase de production équivaut à donner des droits égaux aux deux sujets. Le partage égalitaire est alors le principe de justice le mieux adapté à ce contexte. Une autre interprétation plus générale est ainsi proposée, selon laquelle les sujets se réfèrent à des principes de justice (Cappelen et al. 2007, Rodriguez et Moreno 2012). Mais comment les principes de justice influent-ils sur les comportements ? La littérature apporte différentes réponses, parfois contradictoires, à cette question. Ainsi, selon Cappelen et al (2007), l’individu est caractérisé par un idéal de justice qui le guide dans ses choix. Pour Rodriguez et Moreno (2012) par contre, l’individu n’a pas vraiment d’idéal, en bon Homo œconomicus moral il choisit entre différents principes de justice, selon les circonstances, celui qui maximise son utilité. Peut-on alors continuer à soutenir que les principes de justice ne modifient que les motivations ?

Les fausses idées sur les sciences économiques

On aurait tort de croire que les sciences économiques reposent sur un modèle unique et incontesté de la rationalité. Le modèle d’Homo œconomicus a sans doute encore de beaux jours devant lui, notamment parce qu’il sert de base à la macroéconomie, partie des sciences économiques la plus mobilisée pour conseiller le décideur public. Pour autant, l’étude du comportement est un domaine de recherche dynamique qui explore des pistes très variées et se nourrit d’un dialogue fructueux entre théorie et expériences… sans abandonner l’approche hypothético-déductive chère aux sciences économiques. Le célèbre théoricien des jeux Ariel Rubinstein a écrit en 2001 que « l’économie expérimentale est entrée dans l’orthodoxie de l’économie. » Cette littérature a en effet gagné ses lettres de noblesse dans les sciences économiques en se constituant comme une sous-discipline homogène. Elle a ses codes, comme le paiement des sujets, ou l’absence de communication pour un meilleur contrôle. Et elle a sa méthode, fondée sur les comparaisons entre observations et prévisions théoriques. Cependant, déjà, de nouvelles recherches s’engagent hors des sentiers battus, rompant parfois avec le bel édifice disciplinaire nouvellement établi. Celles-ci proposent d’enrichir les expériences en les organisant sur le terrain, hors du laboratoire, prenant le risque de ne pas satisfaire l’exigence de contrôle. Elles tentent des méthodes plus inductives et ne considèrent plus le modèle de l’Homo œconomicus comme référence. Elles vont chercher ailleurs, dans d’autres disciplines, comme la psychologie ou les neurosciences, leurs éléments de comparaison. Force est de constater que ce développement et ce renouvellement continu de l’économie expérimentale et comportementale ont aujourd’hui profondément modifié la théorie économique et la finance.

par Sylvie Thoron, le 21 octobre 2016

Aller plus loin

Pour aller plus loin

 Axelrod, Robert, (1984), The Evolution of Cooperation, New York, Basic Books.
 Camerer, C., (2003), Behavioral Game Theory, Princeton, Princeton University Press.
 Cappelen, Alexander W., Astri Drange Hole, Erik Ø. Sørensen and Bertil Tungodden, (2007), “The Pluralism of Fairness Ideals : An Experimental Approach”, The American Economic Review, Vol. 97, No. 3, pp. 818-827.
 Cherry, Todd L., Peter Frykblom and Jason F. Shogren, (2002), “Hardnose the Dictator”, The American Economic Review, Vol. 92, No. 4, pp. 1218-1221
 Fehr, Ernst, and Klaus M. Schmidt, (1999), “A Theory of Fairness, Competition, and Cooperation”, Quarterly Journal of Economics, 114(3) : 817-68.
 Güth, W., Schittberger R. et Schwarze B., (1982), “An experimental analysis of ultimatum bargaining”, Journal of Economic Behavior and Organization, vol. 3, p. 367-388.
 Konow, James, (2003), “Which Is the Fairest One of All ? A Positive Analysis of Justice Theories”, Journal of Economic Literature, Vol. 41, No. 4, pp. 1188-1239.
 Ledyard J. (1995), “Public Goods : A survey of Experimental Research”, in Kagel, J. and Roth, A. (eds.), The Handbook of Experimental Economics, Princeton, Princeton University Press.
 Maynard Smith, J. (1982), Evolution and the Theory of Games, Cambridge, Cambridge University Press.
 Nowak, M.A., (2006), Evolutionary Dynamics, Harvard, The Belknap press of Harvard University Press.
 Rodriguez-Lara, Ismael and Luis Moreno-Garrido, (2012), “Self-interest and fairness : self-serving choices of justice principles”, Experimental Economy, 15, p. 158–175.
 Rubinstein, Ariel, (2001), “A theorist’s view of experiments”, European Economic Review, vol. 45, p. 615-628.

Pour citer cet article :

Sylvie Thoron, « L’économie, une science expérimentale ? », La Vie des idées , 21 octobre 2016. ISSN : 2105-3030. URL : https://laviedesidees.fr/L-economie-une-science-experimentale

Nota bene :

Si vous souhaitez critiquer ou développer cet article, vous êtes invité à proposer un texte au comité de rédaction (redaction chez laviedesidees.fr). Nous vous répondrons dans les meilleurs délais.

Notes

[1Chaque cellule représente une issue du jeu. Elle est définie par l’intersection d’une ligne, la stratégie du joueur 1, et une colonne, la stratégie du joueur 2. Les chiffres à l’intérieur de la cellule représentent les paiements des deux joueurs lorsque ces stratégies sont choisies. Le premier chiffre correspond au paiement du joueur 1, et le deuxième à celui du joueur 2.

[2Dans le dilemme du prisonnier, cette prédiction est particulièrement robuste car il s’agit en plus d’un équilibre dit «  en stratégies dominantes  » : quoi que fasse l’autre joueur, la meilleure chose que chacun puisse faire pour maximiser son paiement, c’est de ne pas coopérer.

[3L’efficacité au sens de Pareto est un critère fondamental en économie. Une situation économique est efficace au sens de Pareto s’il n’est pas possible d’améliorer le sort d’un individu sans diminuer celui d’au moins un autre.

Partenaires


© laviedesidees.fr - Toute reproduction interdite sans autorisation explicite de la rédaction - Mentions légales - webdesign : Abel Poucet