Get Even More Visitors To Your Blog, Upgrade To A Business Listing >>

Pourquoi je ne suis pas bayésien

Je ne suis pas Bayésien. En tout cas pas au sens où la formule de Bayes serait applicable et devrait être appliquée de manière universelle pour évaluer ses Croyances. Je pense que la formule de Bayes a un domaine d'application très limité.

Mes raisons Sont assez simple. La formule de Bayes est la suivante : p(H/D)=p(D/H)•p(H)/p(D).

Il est éclairant d'analyser p(D) comme la somme des p(D/Hi)•p(Hi), ou les Hi sont toutes les hypothèses possibles, et s'excluent mutuellement. De cette manière on se retrouve avec les éléments suivants dans la formule de Bayes :

  • p(H/D) ce qu'on cherche à calculer, à savoir le degré de confirmation d'une hypothèse H étant donné une donnée D
  • des données pour faire ce calcul, à savoir
    • p(Hi) des probabilités a priori pour toutes les hypothèses possibles
    • p(D/Hi) les prédictions de D par toutes les hypothèses Hi possibles.

Il s'ensuit que le domaine d'application de la formule de Bayes est l'ensemble des contextes où l'on dispose d'un ensemble d'hypothèses pondérées a priori et s'excluant mutuellement, hypothèses qui permettent de prédire la probabilité de certaines observations. Or ces contextes sont très limités. C'est pourquoi je ne suis pas bayésien.

Le cas où ça marche (et c'est utile)

Il est utile de distinguer les théories scientifiques des modèles. Pour s'en tenir à la physique, j'entends par théorie un cadre général, quelque chose comme la physique quantique ou la théorie de la relativité : un vocabulaire (électron, spin, masse), un formalisme mathématique et certaines lois et principes d'application. Je suppose que le vocabulaire est interprété empiriquement ("spin" est associé à certaines configurations expérimentales).

J'entends par modèle quelque chose comme le modèle de l'atome d'hydrogène en physique quantique, ou un modèle relativiste de l'univers en cosmologie : une structure mathématique construite à partir de la théorie (qui utilise son langage, son formalisme et ses lois), et qui représente quelque chose de particulier : un objet ou un type d'objet.

Si l'on adopte cette façon de voir les choses, plusieurs remarques s'ensuivent :

  • une théorie fonctionne un peu comme une collection de modèles possibles. Étant donné un objet donné, on peut envisager plusieurs modèles possibles (peut-être une infinité) permis par la théorie. Par exemple : la théorie de la relativité fournit un ensemble de modèles de l'univers possibles.
  • il semble censé de partir du principe que tous ces modèles se valent. C'est ce qu'on appelle parfois un principe d'indifférence. Ce principe est applicable au moins quand les modèles se ressemblent suffisamment pour qu'on puisse les situer dans un espace des modèles (par exemple ils diffèrent par la valeur d'un ou plusieurs paramètres).
  • un modèle particulier est en général prédictif. Par exemple, un modèle de l'atome d'hydrogène prédit que certaines fréquences lumineuses seront absorbées ou émises.

Autrement dit au sein d'une théorie, on dispose potentiellement de tous les éléments pour appliquer la formule de Bayes : des hypothèses pondérées et des prédictions probabilistes. J'ai pris des exemples issus de la physique mais j'imagine que ça peut être étendu Par Exemple à la biologie, si l'on se place dans un cadre où, par exemple, plusieurs modèles évolutionnistes prédisent différentes fréquences pour certains gènes.

Mais ceci ne fonctionne que pour autant qu'on parte du principe que notre théorie est la bonne. Le bayesianisme n'est pas pour l'instant une formule parfaitement générale du savoir, puisqu'il ne permet pas d'évaluer les théories elles-mêmes. Or c'est bien ce qu'on voudrait pour évaluer nos croyances général : ne pas avoir à accepter un cadre théorique au préalable.

Le cas où ça ne marche plus

Que se passe-t-il si l'on monte d'un niveau pour s'intéresser non plus aux modèles mais aux théories ? Jusqu'ici personne n'a jamais calculé le degré de confirmation de la théorie de la relativité, mais serait-ce faisable en principe ? Ici on rencontre les aspects suivants, bien connus des philosophes des sciences :

  • les observations sont chargées de théories, notamment parce que les théories sont utilisées pour fabriquer des instruments de mesure et interpréter leurs résultats. Par exemple, la masse newtonienne n'est pas la masse relativiste. Dans ce cadre, rien ne garanti que comparer des "p(D/Ti)" pour différentes Ti ait beaucoup de sens si la manière d'interpréter D dépend de Ti. Ceci dit on pourrait penser qu'il existe parfois des traductions possibles, un vocabulaire neutre permettant de comparer les théories entre elles, ou au moins leurs predictions dans les cas précis qui nous intéressent... Peut-être, mais
  • les théories ne font de prédictions que accompagnées d'hypothèses auxiliaires. On doit notamment faire des suppositions à propos de l'objet qu'on souhaite représenter dans la théorie pour pouvoir limiter les modèles possibles, et donc prédire : il s'agit de choisir comment modéliser tel ou tel phénomène dans la théorie. Mais la théorie à elle seule ne peut faire aucune prédiction quantifiée. Les p(D/T) n'existent simplement pas !
  • On pourrait assimiler p(D/T) à la somme des prédictions de D par des modèles quelconques de T en adoptant un principe d'indifférence sur les modèles possibles. Mais en général ce n'est pas ce qu'on veut faire : la théorie de la relativité n'est pas bien confirmée parceque la plupart des modèles possibles pour les phénomènes font de bonnes prédictions, elle est confirmée parce qu'un modèle en particulier, qu'on pense être le bon, fait de bonnes prédictions...
  • On pourrait assimiler p(D/T) à la prédiction du meilleur modèle de T. Mais à coup d'hypothèses ad-hoc on trouvera toujours des modèles qui prédisent ce qu'on veut. Il faut spécifier "meilleur" (le modèle doit être suffisamment simple ?) et on s'éloigne de la formule de Bayes.
  • incidemment, il est reconnu que différents critères pragmatiques entrent en jeu pour sélectionner les théories : la simplicité, la portée unificatrice, la fructuosité... Les théories ne sont jamais comparées uniquement par leur adéquation aux données, comme un bayésianisme radical pourrait laisser penser.
  • et si ça ne suffisait pas : il n'existe pas vraiment d'espace des théories au sein duquel on pourrait appliquer un principe d'indifférence pour leur attribuer un poids. En général, on n'a pas accès à l'ensemble des théories possibles. Personne n'avait envisagé la relativité avant Einstein. Il n'y a donc aucun sens à attribuer des valeurs aux p(Ti).

Les degrés de crédence n'ont aucun sens

Les bayésiens rejettent généralement ce dernier point en évoquant des degrés de crédence, mais je pense qu'ils ont tort. Leur idée est qu'on n'a aucun besoin d'avoir une méthode objective, comme le principe d'indifférence, pour attribuer un poids a priori aux théories : on peut leur attribuer un poids subjectivement. Ce serait peut-être une manière d'accommoder l'existence de critères pragmatiques comme la simplicité dans le choix des théories (on accorderait plus de poids a priori aux théories simples). On pourrait répondre aux autres points en défendant que ce sont des modèles "toutes théories confondues" qui sont comparés : la formule de Bayes aurait bien une portée universelle.

C'est très bizarre parce qu'on pourrait envisager qu'un modèle relativiste s'applique mieux à tel type phénomène, et un modèle newtonnien à tel autre : on perd une forme d'unité explicative qui semble vraiment être la marque de fabrique de la science. J'ignore s'il est possible de la retrouver dans un cadre bayésien.

Mais peu importe. Ils ont tort d'adopter les degrés de crédence pour les raisons suivantes :

  • la connaissance, scientifique notamment, n'est pas une affaire individuelle mais un produit collectif. Ce que croient telle ou tel scientifique n'a pas d'importance en science. Les hypothèses doivent donc être évaluées de manière objective, en utilisant par exemple un principe d'indifférence, pas des degrés de crédence.
  • même si les croyances individuelles avaient de l'importance, les degrés de crédence n'ont aucune pertinence psychologique. Ils ne sont pas invoqués par les neurosciences pour expliquer le fonctionnement du cerveau par exemple.
  • on pourrait répondre que les degrés de crédence, même s'ils n'entrent pas en jeu dans notre fonctionnement psychologique, devraient être utilisés. Le bayésianisme serait normatif plutôt que descriptif. Mais ça suppose qu'on ait accès à de tels degrés de crédence qui seraient une disposition à répondre "oui" à la question "X est-il vrai ?", et je ne pense pas que ce soit le cas. Si tant est que la question ait un sens, j'ignore complètement mon degré de crédence exact de "Bruxelles est la capitale de la Belgique". Ce que je n'ignore pas forcément, c'est quel serait le prix à payer, les conditions nécessaires, pour me faire abandonner cette idée, et je sais que ce serait très coûteux. Mais rien qui s'approche d'un nombre entre zéro et un. Les degrés de crédence n'ont aucune pertinence normative parce qu'ils ne sont pas évaluables.

Les degrés de crédence n'ont donc simplement aucun intérêt particulier, que ce soit pragmatiquement pour diriger nos actions, théoriquement pour décrire notre psychologie ou épistémologiquent pour fixer les connaissances scientifiques. Au mieux, le bayésianisme généralisé est une belle métaphore.

Une alternative

J'ai expliqué pourquoi je ne suis pas un bayésien radical mais je n'ai pas proposé d'alternative. Je vais maintenant le faire.

Tout d'abord je pense qu'il est une chose à retenir du bayesianisme sur le plan philosophique : en principe, presque toutes nos croyances sont révisables. On devrait être prêt à revoir nos croyances si suffisamment d'éléments s'offrent à nous. Je suis même d'accord pour dire que certaines croyances sont plus facile à réviser que d'autres. Ce que je rejette c'est uniquement l'idée que ça devrait être quantifié (et que ne pas quantifier nos croyances serait irrationnel). La manière dont j'envisage les choses est seulement qualitative au lieu d'être quantitative.

Entendons nous bien : on peut utiliser la formule de Bayes dans plein de contextes dès qu'on dispose d'un ensemble quantifiable d'hypothèses, mais c'est l'exception plutôt que la règle, et ça suppose d'accepter un cadre qui lui ne fait pas partie d'un ensemble quantifiable.

L'alternative que je propose est inspirée de la notion de schème conceptuel du philosophe Quine. Un schème conceptuel est simplement un ensemble de croyances auxquelles on adhère, sur lesquelles on est prêt à se baser pour l'action. L'alternative au bayésianisme que je propose consiste simplement, au lieu d'attribuer une probabilité à chacune de ses croyances, à se demander : que faudrait-il pour me faire abandonner cette croyance ? À quel point devrais-je réviser mon schème conceptuel ?

Le premier avantage de cette façon de voir les choses est qu'elle ménage une place à la suspension de croyance : il y a plein de choses sur lesquelles je n'ai aucune opinion précise (et me forcer à en adopter une en me mettant un pistolet sur la tempe ne révélerait rien d'intéressant). Il y a une différence entre estimer qu'une pièce a une chance sur deux de tomber sur pile et ignorer complètement la température de fusion du plomb, ne jamais s'être posé la question, ce dont le bayesianisme ne peut rendre compte. Or pour l'immense majorité des propositions, je n'ai simplement aucune croyance, ni dans un sens ni dans un autre, parce que je ne m'y suis jamais intéressé.

Mais le principal avantage est qu'on arrive à une manière beaucoup plus fine d'évaluer nos croyances. On peut comprendre pourquoi certaines croyances sont quasiment indélogeables, parce que les rejeter demanderait de rejeter du même coup un ensemble gigantesque de croyances associées. Si j'apprends que je suis un cerveau dans une cuve et que mon monde est simulé, tout ce que je croyais savoir tombe à l'eau. Ou encore, je devrais remettre en question énormément de connaissances scientifiques et d'expériences vécues avant d'accepter que la terre est plate (il faudrait m'expliquer de manière convaincante que des millions de gens sont dans l'erreur).

Un bayésien serait tenté d'affirmer que son degré de croyance en "le monde est bien réel" est très proche de 1, mais ça n'a aucun sens. On peut comprendre beaucoup mieux pourquoi cette croyance est si bien ancrée en considérant ce qu'il nous faudrait avaler pour la rejeter. Et on peut comprendre que beaucoup d'autres croyances n'ont pas le même statut : que le vélo de mon voisin soit jaune ou vert ne change pas grand chose (on peut même obtenir un ordre partiel entre les croyances : certaines sont strictement plus fortes que d'autres quand elles les présupposent). Mais pour ce faire, il est inutile de leur attribuer un hypothétique nombre.

Cette façon de voir les choses ne vous empêche pas de bien agir, de tenir compte des risques d'erreur. Elle permet même d'en tenir compte finement. Et dans les rares cas où les risques sont quantifiables, rien ne vous interdit de faire des calculs. Mais jamais vous n'aurez à vous appuyer sur des quantifications subjectives qui n'apportent rien.

Oubliez donc cette idée que vos croyances ont un poids entre 0 est 1 sur lequel vous devriez parier : c'est un jeu inutile. Considérez plutôt les liens qui unissent vos croyances entre elles, et les raisons de les rejeter ou non. Vous aurez tous les avantages du bayésianisme (en particulier l'anti-dogmatisme) sans vous encombrer de chimères.



This post first appeared on Un Grain De Sable, please read the originial post: here

Share the post

Pourquoi je ne suis pas bayésien

×

Subscribe to Un Grain De Sable

Get updates delivered right to your inbox!

Thank you for your subscription

×