La demande politique d’une plus grande clarté dans l’administration des fonds publics et l’exigence d’efficacité à l’égard des fonctionnaires a nécessité la mise en place d’un suivi des performances de ces administrations. Néanmoins, aux inconvénients des primes à la performance déjà connus dans les secteurs privés, s’ajoutent des difficultés spécifiques à leur utilisation dans les secteurs publics.
Le débat entre les économistes sur la privatisation de certains services publics a pris un nouveau tournant depuis la fin des années 1990 : une forme nouvelle de privatisation consiste à gérer le secteur public en suivant les indicateurs de la bonne gestion privée. Au premier plan de ces discussions figure la mise en place d’indicateurs de performance ou de qualité des services et des fonctionnaires.
Les fonctionnaires reçoivent généralement un salaire fixe, indépendant de la productivité individuelle de l’agent et non relié à une quelconque mesure d’efficacité ou de performance individuelle. Le secteur privé dispose, lui, de deux moyens radicalement opposés aux modes de gestion publique : le licenciement et la participation aux bénéfices, pour inciter les agents à fournir l’effort nécessaire. Les détracteurs du salaire unique font valoir que ce système de rémunération a deux inconvénients majeurs : tout d’abord, il est désincitatif puisque le fonctionnaire est payé de la même manière qu’il fournisse ou non un effort ; il est ensuite non attractif puisque les bons employés préfèrent quitter le service public et travailler dans des secteurs où leur productivité est rémunérée à sa juste valeur.
1. Le rôle des indicateurs
L’utilisation d’indicateurs pour mesurer la performance des employés dans le secteur privé n’a rien de nouveau ni d’étonnant. Le mécanisme est simple et ses avantages nombreux. Les intérêts d’un employeur et de son employé ne sont pas les mêmes et sont même divergents. Comment donc l’employeur peut-il amener l’employé à faire ce que le premier souhaite ? Par des mécanismes d’incitation : des primes, des promotions… Ces mécanismes d’incitations présupposent de lier les primes à la mesure précise d’une variable observable et vérifiable : l’indicateur.
En effet, si l’employeur observe parfaitement le travail de son agent, il peut alors le licencier (ou le pénaliser) en cas de non-respect du contrat de travail stipulant les engagements du salarié et les rémunérations liées à ces engagements. La question est plus délicate si l’effort de l’employé, bien qu’observable par l’employeur, n’est pas vérifiable par un tiers ou par un tribunal. Dans ce cas, bien que sachant que l’agent ne fournit pas son travail, l’employeur, ne pouvant le prouver, ne peut pas faire exécuter le contrat. Dernier cas, lorsque l’effort de l’agent n’est pas observable par l’employeur (et a fortiori non-vérifiable par le tribunal), les deux contractants (employeur et employé) construisent des indicateurs de l’effort, indicateurs qui doivent être à la fois vérifiables par un tribunal et suffisamment pertinents pour bien « indiquer » l’effort fourni. Ainsi, lorsque l’effort est observable et vérifiable, l’indicateur est tout simplement la mesure directe de l’effort. En revanche, si l’effort n’est pas vérifiable, il s’agit d’imaginer des indicateurs, vérifiables, suffisamment proches du véritable objectif. Dans le cas de la production privée, la difficulté est toute relative.
Puisque le principal (ou l’employeur) n’observe pas l’effort, il cherche des indicateurs de l’effort, qui soient observables et qui soient corrélés à l’effort. Les indicateurs objectifs ont l’intérêt d’être vérifiables par un tribunal. Pour résumer, l’agent (ou l’employé) a une rente informationnelle : il connaît son effort mais cette information n’est pas disponible pour le principal (ou l’employeur) qui cherche donc le moyen de l’obtenir de l’agent. Le salaire à la performance incite l’agent à fournir l’effort souhaité par le principal. Cette incitation prend la forme d’une prime qui est la part des profits reversés à l’agent.
La prime n’est pas de 100%, pourquoi ? Autrement dit, le salarié ne reçoit pas toute la richesse générée par son effort et une partie revient au principal qui n’a pourtant pas participé au processus de production. On attribue cela en économie à un partage du risque entre employeur et employé. On suppose que l’agent est « averse au risque », autrement dit qu’il souhaite des revenus relativement constants. Or d’autres phénomènes affectent le résultat, en plus de son effort : le monde extérieur importe aussi et rend le résultat aléatoire. Le principal prend à sa charge cet aléa et lisse en conséquence le salaire de l’agent.
Le problème peut être plus important si le principal observe mal la production ainsi que l’effort. Une solution à ce double problème de la mesure est ce que l’on appelle les tournois : on prend alors en compte le classement relatif de l’indicateur par rapport à la performance d’autres employés dans la même situation. Bien entendu le problème majeur est alors la faiblesse de la coopération entre employeurs dans des tâches où le travail d’équipe est important. Mais mesurer les performances relatives permet de repérer les aléas communs qui altèrent l’indicateur. Lazear (1989) montre ainsi que l’agent manipule stratégiquement cet indicateur en allouant une part de son effort à son activité productive et une autre part au sabotage de l’activité productive des autres.
La pertinence de l’indicateur peut se révéler plus délicate lorsque, par exemple, l’indicateur reflète non seulement l’effort de l’agent mais collectivement celui de l’équipe de travail (productivité dite « jointe »). Dans ce cas, la difficulté est souvent levée, soit en affinant l’indicateur afin d’isoler la participation de chacun à l’effort final, soit en utilisant l’indicateur de l’effort collectif pour mettre en place des incitations collectives qui encouragent les agents à fournir chacun un effort et à s’aider les uns les autres. Cependant récompenser le groupe ne présente pas que des avantages et expose au phénomène du « passager clandestin » (des agents qui profitent du travail d’autrui). On montre alors que la pression des pairs fonctionne dans les petits groupes. Une étude de Hansen en 1997 sur un centre d’appel montre qu’une rémunération collective (fondée sur le nombre total d’appels satisfaits) avait un effet en U : les très mauvais trouvaient insupportable la pression du groupe et les très bons se trouvaient exploités. Par conséquent, les rémunérations collectives fonctionnent en général pour des groupes homogènes.
La difficulté majeure de l’indicateur peut provenir, non pas tant de la productivité jointe, mais de l’écart potentiel entre l’indicateur et l’objectif réel. L’indicateur est alors source de nombreux effets pervers. Il revient souvent à payer les agents pour ce qu’on ne souhaite pas vraiment lorsque ce qu’on souhaite est difficile à libeller dans un contrat de travail. Ces mécanismes incitatifs peuvent donner naissance à des effets pervers en raison de ce qu’on appelle « l’incomplétude » du contrat incitatif : on ne peut pas spécifier dans le contrat tout ce qu’on souhaite de l’agent dans tous les cas de figures. Le contrat incitatif incite à un type d’effort en particulier, celui qu’on a pu écrire dans le contrat incomplet. On désigne ce problème par le terme de « multitâche ».
Dans le monde du football, un joueur, Ken O’brien, était connu dans les années 1980 pour donner trop souvent la balle à l’équipe adverse. On lui fit un contrat qui l’engageait à payer une pénalité chaque fois qu’il donnait la balle à un adversaire. Le résultat fut efficace : il a moins donné la balle à l’équipe adverse. Mais il a aussi moins donné la balle à tout le monde : il s’est mis à jouer en gardant la balle le plus longtemps possible.
Dans une entreprise de télécommunications, les informaticiens étaient payés à la ligne de programme écrit. Le résultat n’est pas surprenant : les programmes sont devenus inutilement longs.
Ces difficultés liées aux indicateurs expliquent l’attrait des mesures de performance subjective, qui sont plus globales et ne tombent pas sous le coup des effets pervers des indicateurs objectifs dans un cadre multitâche. Si les contrats sont incomplets, une solution serait de mesurer par un indicateur subjectif : l’avis du supérieur, qui par définition est complet. Mais là aussi l’évaluation subjective a des effets pervers : biais pour une évaluation complaisante (le chef direct est incité à garder de bons rapports avec ses subordonnés), biais vers la moyenne (tout le monde est autour d’une même évaluation), biais vers les « yes-men » (on veut plaire au chef direct en lui disant oui à tout). Enfin ces indicateurs ne sont pas vérifiables, donc soumis à manipulation : le principal a toujours intérêt ex post, c’est-à-dire une fois le travail terminé, à sous-payer l’agent qui ne pourra se justifier.
Empiriquement de nombreux contrats ne sont pas linéaires. Il existe des quotas. Autrement dit, ils sont fondés sur des effets de seuil ou sur des dates auxquelles est faite l’évaluation pour l’ensemble de l’année.
Par exemple, si en fin d’année, à une date donnée, on demande à l’agent d’avoir fait 100 dossiers, on observe que le seuil est atteint mais que la plupart des dossiers sont alors faits « à la dernière minute » pour des raisons d’escompte du temps. On a toujours intérêt à remettre à demain. Asch (1990) étudie les recrutements fait dans la navy américaine. Les recruteurs sont payés au nombre de recrues, évalué à deux dates dans l’année. Les recruteurs recrutent de plus en plus au fur et à mesure qu’on approche de la date puis les recrutements s’effondrent après l’évaluation.
Une autre conséquence des quotas est de ne pas dépasser la norme. Les agents qui ont déjà atteint la norme ne font plus rien et inversement ceux qui sont trop loin de la norme ne font plus rien non plus. La norme n’incite que ceux qui en sont près. Une étude sur les formations réalisée par Courty et Marschke (1997) examine des instituts de formation pour des chômeurs. Dans ces instituts privés payés suivant un quota de personnes qui ont réussi le diplôme, on observe ces deux phénomènes. De même, ceux qui sont payés suivant le nombre de personnes qu’elles arrivent à placer sur le marché du travail, se mettent à ne donner le diplôme qu’aux très bons. Leventis (1997) examine les chirurgiens américains : ils se voient fixer un taux de mortalité maximum ; s’ils l’excèdent, ils encourent des pénalités. On observe alors qu’ils ne prennent plus les cas difficiles quand ils approchent de ce seuil.
2. Des indicateurs de performance au sein du service public ?
La demande politique d’une plus grande clarté dans l’administration des fonds publics et l’exigence d’efficacité à l’égard des fonctionnaires a nécessité la mise en place d’un suivi des performances de ces administrations. Néanmoins, aux inconvénients des indicateurs déjà connus dans les secteurs privés, s’ajoutent des difficultés spécifiques à leur utilisation dans les secteurs publics.
La première difficulté propre aux services publics, et plus particulièrement présente dans les secteurs les moins marchands, est de définir les objectifs et de construire un indicateur. En effet, la définition des objectifs est en elle-même problématique. L’exemple de la justice [1] est particulièrement parlant. Avant même de chercher à préciser les indicateurs de la qualité de la justice, encore faut-il s’entendre sur la définition de la qualité. Dans le domaine judiciaire, la définition des objectifs de la justice s’est avérée très difficile et délicate. Par exemple, les TCPS, trial court performance standards, sont une expérience de mise en place d’indicateur dans le domaine judiciaire aux Etats-Unis, initiée en 1987 et étendue sur une décennie. Une commission de 14 personnes, composée de juges, de responsables administratifs et d’universitaires, a mis plus de trois ans pour établir la liste de ces indicateurs. Elle est arrivée à la conclusion qu’il n’existait pas de consensus sur les objectifs assignés au système judiciaire, ni sur les facteurs qui déterminent la production des juridictions, pas plus que sur ce que signifie la « performance » des juridictions et encore bien moins sur la façon dont il conviendrait de mesurer cette performance. Finalement, cette commission a publié en 1990 une première version des TCPS avec cinq objectifs généraux : l’accès à la justice, la rapidité, l’égalité, l’impartialité et l’intégrité, l’indépendance et la confiance du public, et plus de 22 standards et 75 indicateurs pour mesurer ces cinq objectifs.
La littérature économique récente concernant l’avantage de la production publique de certains biens insiste sur l’aspect « incomplet » des contrats (on ne peut pas spécifier par avance dans le contrat quelles sont les obligations de l’agent) entre l’Etat et le prestataire de service public et en conclut l’intérêt de confier ces services à des fonctionnaires plutôt qu’à des agents privés si des tâches ne sont pas directement observables ni même descriptibles dans un contrat [2]. Si, par exemple, l’agent producteur du bien a le choix entre des innovations diminuant le coût de production et des innovations améliorant la qualité du bien, on [3] montre que, sous certaines conditions, la production publique est plus à même d’améliorer la qualité du bien alors qu’un système de production privée favorisera la réduction de coût. L’exemple des prisons aux Etats-Unis et l’étude de la qualité respective des prisons publiques et privées a servi d’illustration pour ce mécanisme.
La difficulté vient de ce qu’en économie des contrats, on appelle le travail « multitâches ». L’objectif n’est pas un mais multiple. Privilégier un indicateur plutôt qu’un autre, même simplement attirer l’attention sur un indicateur en particulier, revient à allouer l’effort des juges sur un objectif particulier aux dépens des autres.
Cet effet pervers est apparu dans l’élaboration d’indicateurs de performance dans les écoles. Mettre en place des tests d’évaluation des élèves risque d’orienter le travail des enseignants vers les tâches « rentables » car mesurables, et non vers des tâches plus qualitatives et plus complexes à mesurer. Une étude américaine [4] examine cette question : en jugeant les enseignants et les établissements suivant ces tests, est-ce qu’on les encourage à enseigner de manière à réussir le test, au détriment de pédagogies tout aussi importantes mais que le test ne mesure pas ? Les auteurs mesurent le temps passé devant la télévision, le taux d’absentéisme des élèves et le temps de travail à la maison comme indicateur d’une qualité autre que celle mesurée par les tests scolaires. Il n’y a aucune relation significative entre l’amélioration des résultats du test et le temps passé devant la télévision ou le temps passé à faire ses devoirs à la maison.
Les objectifs multiples peuvent être contradictoires. Les expériences menées aux Etats-Unis dans le cadre de la réforme de la justice, le CJRA, ont permis de mettre en évidence que les objectifs de réduction des délais et de réduction des coûts n’étaient pas nécessairement compatibles : le management du début de la procédure par le juge réduit les délais de 30%, mais le coût par affaire augmente car les avocats font le même travail dans un délai plus court et assurent de nouvelles tâches. La satisfaction des usagers [5], elle, n’a pas été affectée par ces nouvelles procédures. Un seul succès est à mettre au crédit de la réforme : le nombre d’affaires pendantes depuis trois ans a fortement diminué car la réforme prévoyait la publication nominative des juges traitant de ces affaires. La mise en place de cet indicateur (le nombre d’affaires non traitées depuis plus de 3 ans) a eu un effet direct : réduire ce nombre d’affaires au détriment de la durée moyenne des autres affaires.
La première solution à cette multiplicité d’objectifs parfois contradictoires pourrait consister à forger plusieurs indicateurs qui correspondraient aux différentes tâches, dans une approche exhaustive. Cette solution est rarement opérationnelle. En ce qui concerne les TCPS aux Etats-Unis, de 1991 à 1995, 13 juridictions ont été sélectionnées pour tester les 22 standards et les 75 indicateurs associés (réduits assez vite à 68). Il est apparu clairement que les indicateurs étaient trop nombreux pour être opérationnels. Les juridictions n’avaient, la plupart du temps, pas les moyens de mettre en place une évaluation d’une telle précision et d’une telle ampleur. Très vite, chaque juridiction a essayé de réduire les indicateurs mesurés à quelques priorités.
Une deuxième solution consisterait à mettre en place un indicateur synthétique. La construction d’un indicateur synthétique présente la difficulté de préciser les pondérations de chaque indicateur. Dans l’élaboration de la pondération de l’indicateur synthétique, on peut souhaiter accorder un poids particulièrement important aux indicateurs les plus graves. Par exemple, un indicateur simple de performance peut ne pas internaliser les effets externes de la production. Si l’on considère une entreprise privée industrielle produisant un bien et de la pollution, un indicateur de performance interne à l’entreprise ne prendra pas en compte la production de biens non-désirables que constitue la pollution. Inciter les employés à être de plus en plus performants selon cet indicateur revient aussi à les encourager à polluer, et l’on retrouve l’effet pervers des indicateurs qui consiste à encourager ce qu’on ne désire pas réellement. On souhaiterait pouvoir mettre en place un indicateur synthétique qui non seulement prenne en compte toute la production d’une entreprise mais qui traite d’une manière asymétrique les biens désirables et les biens non-désirables.
Aux Etats-Unis, une réforme du système judiciaire, mise en place en 1990, le CJRA a mis en évidence cet arbitrage entre l’égalité de traitement et l’efficacité. Le programme et son efficacité sont suivis par l’institut de la justice civile. Les programmes d’évaluation se sont concentrés sur la réduction des délais et des coûts mais aussi sur des indices de satisfaction des acteurs. L’étude test a été menée de janvier 1991 à janvier 1994. Un des résultats de l’étude est que le programme a entrainé une croissance de la variation des procédures entre les tribunaux. En effet, il apparaît que les districts suivis ont maintenu leurs anciennes méthodes et en ont adopté de nouvelles, parmi lesquelles : exiger des avocats d’indiquer s’ils demandent une procédure standard ou spécifique (« standard or specific track procedure »), obliger les avocats à terminer la période pré-procès, faire une procédure différenciée suivant le cas, renforcer l’implication du juge y compris dans la fixation des délais. Certains districts ont plutôt encouragé « un modèle volontaire » qui encourage les avocats à coopérer entre eux, d’autres utilisent un modèle plus obligatoire qui force les avocats à cet échange d’information, d’autres utilisent un hybride des deux premiers systèmes. Le principal résultat est que la variance de l’indicateur de durée ou de coût entre les districts a augmenté car certains districts ont été plus actifs que d’autres dans la mise en place des nouvelles méthodes.
Utiliser les indicateurs à des fins de gestion du personnel est générateur d’effets pervers. En effet, les indicateurs de qualité mesurent non seulement l’efficacité ou la qualité du service rendu par les fonctionnaires, mais aussi la participation des usagers à la production du service publique. Le service public a ceci de particulier que l’usager du service n’est pas un simple client mais aussi un producteur du service. De ce fait, la rémunération du fonctionnaire doit tenir compte de la part de l’usager dans la valeur produite. L’amélioration du capital humain, la sécurité, l’état de santé d’une population ne sont pas uniquement le fait des fonctionnaires de l’éducation, de la justice ou de la santé mais aussi de l’effort individuel et collectif des usagers. Les indicateurs de performance globale du système ne permettent pas de mesurer la productivité des fonctionnaires en l’isolant de celle des usagers. Indexer la rémunération des fonctionnaires sur de tels indicateurs revient à surpayer les fonctionnaires et à désinciter les usagers à fournir l’effort nécessaire.
Enfin, le fonctionnaire alloue son effort entre plusieurs usagers. L’inciter à la performance, c’est le désinciter au traitement égalitaire. Seul une rémunération fixe permet au fonctionnaire de traiter également l’ensemble des usagers. Il existe un arbitrage politique à faire entre plus d’efficacité ou plus d’égalité (soit de traitement, soit de résultat) [6].
Lorsqu’il s’agit de produire un bien ou un service qui implique la coopération entre l’agent et l’usager, ou dont la qualité est difficile à estimer, ou encore lorsqu’on veut distribuer de manière plus égale que ce que le système du marché incitatif produit, alors payer les fonctionnaires suivant les indicateurs de performance est sous-optimal. Une réforme des rémunérations des fonctionnaires ne passe donc pas par l’introduction de primes variable avec la performance.
Cela ne signifie pas que les indicateurs soient impossibles à construire ni qu’ils soient inutiles. Ils peuvent servir à repérer les dysfonctionnements structurels et à les réparer, à mettre en évidence les arbitrages entre les différentes tâches ou les inégalités à l’œuvre. Trois pistes pourraient être privilégiées : faire participer les usagers plus directement aux résultats des services publics et imaginer des incitations directes en direction des usagers ; construire des indicateurs de performance non pas tant plus précis que plus proches (au sens de colinéaires) des vrais objectifs politiques et faire participer les usagers à l’évaluation du résultat de l’effort des fonctionnaires ; imaginer des modes de rémunération qui tiennent compte non seulement de l’efficacité mais aussi de l’égalité de traitement.