L’Explication la plus Simple est la Bonne — Le Rasoir D’Ockham

Julien Séveno-Piltant
5 min readJul 1, 2020

--

Photo by Ignacio F. on Unsplash

On entend parfois que l’explication la plus simple est la bonne. Bien que cet énoncé soit attrayant, puisqu’il invite à ne pas trop se creuser la tête, peut-on le justifier de manière plus rigoureuse ?

Qu’est ce qu’une explication ?

Cette question a l’air idiote, mais afin de bien encadrer le sujet qui nous intéresse, définissons le terme le plus important : explication.

Lorsque l’on cite cet énoncé, on évoque en général une situation dans laquelle on cherche à expliquer un phénomène à l’aide de plusieurs possibilités, plus ou moins compliquées. J’appelle ici une explication une de ces possibilités.

Un peu de probabilités

Afin de bien comprendre le raisonnement qui va suivre, rappelons un résultat des probabilités conditionnelles :

L’équation se lit de la manière suivante : la probabilité de A ET B est égale à la probabilité de A sachant B multipliée par la probabilité de B.

Plus simplement dit, la probabilité que A et B soient vrais en même temps est égale à la probabilité que B soit vrai multipliée par la probabilité que A soit vrai sachant que B est vrai.

Comme chacun sait, une probabilité est un nombre compris entre 0 et 1. 0 correspond à une probabilité nulle, autrement dit un évènement impossible et 1 correspond à un évènement certain.

Le Rasoir d’Ockham

Revenons à présent à notre sujet. Le Rasoir d’Ockham, aussi appelé principe de parcimonie, stipule que parmi plusieurs explications, il faut privilégier la plus simple.

Prenons un exemple :

Vous rentrez chez vous et constatez une petite flaque d’eau sur la table. Curieux, deux explications vous viennent à l’esprit. Soit vous avez renversé de l’eau sur la table, soit votre mère, qui habite à l’autre bout de la France, est venue vous rendre visite à l’improviste et a renversé de l’eau sur la table.

D’après le Rasoir d’Ockham, la première explication est la meilleure, parce qu’elle est plus simple. Mais pourquoi ?

Disséquons les deux possibilités :

  • vous avez renversé de l’eau sur la table : cette explication nécessite une seule hypothèse, que vous n’ayez pas vu que vous aviez renversé de l’eau, et que donc vous n’avez pas nettoyé
  • votre mère qui habite loin est venue vous faire une visite surprise et a renversé de l’eau sur la table : cette deuxième explication nécessite deux hypothèses, que votre mère soit venue, et que votre mère qui est venue n’ait pas vu qu’elle a renversé de l’eau

Si l’on appelle “ne pas voir que de l’eau a été renversée sur la table” l’hypothèse A, et “votre mère est venue vous rendre visite” l’hypothèse B alors on observe que :

  • la première explication nécessite que l’hypothèse A soit vraie
  • la deuxième explication nécessite que l’hypothèse A soit vraie ET que l’hypothèse B soit vraie

Ainsi la probabilité que la première explication soit la bonne est égale à la probabilité que l’hypothèse A soit vraie : P(H1) = P(A).
La probabilité que la deuxième explication soit la bonne est égale à la probabilité que A et B soient vraies en même temps : P(H2) = P(A, B).

Or, comme on l’a vu plus haut, P(A, B) = P(A|B) * P(B) = P(B|A) * P(A).

On obtient donc, en remplaçant P(A) dans la formule de l’hypothèse 2 par P(H1) :

Finalement, on remarque que la probabilité que l’hypothèse 2 soit vraie est égale à la probabilité que l’hypothèse 1 soit vraie multipliée par une autre probabilité (un autre nombre entre 0 et 1 donc). Or, lorsque l’on multiplie entre eux plusieurs nombres entre 0 et 1, le résultat et toujours plus petit que le plus petit des deux facteurs.

C’est par ce raisonnement que l’on peut affirmer que P(H2) ≤ P(H1). Dit avec des mots, la première explication est plus probable que la deuxième, parce qu’elle est plus simple.

Une dernière illustration

Pour terminer d’illustrer mon propos, je vais emprunter une anecdote à Cassie Korzikov (qui soit dit en passant écrit d’excellents articles en anglais à propos de statistiques et de prise de décision).

Voici l’histoire qu’elle met en scène :

Heather est canadienne, amicale, intelligente, et adore les animaux. Elle travaille en tant que consultant en respect de l’environnement. Pendant ses études, elle a étudié la psychologie et les mathématiques. Elle aime les promenades en forêt et habite à proximité de plusieurs sentiers de randonnée.

La question est la suivante :

Qu’est ce qui est le plus probable à propos d’Heather ?

  • Heather possède un doctorat
  • Heather possède un doctorat et un chien

En “copiant” le raisonnement précédent, vous avez du obtenir la bonne réponse : le premier choix est le bon. Même si Heather semble être proche de la Nature et des animaux, la deuxième possibilité nécessite que plus d’hypothèses soient vérifiées pour être juste. Elle est donc moins probable que la première.

Conclusion

Les deux exemples que j’ai donnés précédemment sont assez simples, et ont la particularité que l’une des deux explications englobe l’autre. Or, ça n’est pas toujours le cas et l’équation de probabilité que nous avons écrite ne s’applique pas aussi simplement.

Ce qu’il faut retenir, c’est que plus une explication est complexe, plus elle nécessite que de nombreuses hypothèses soient vérifiées pour être vraie. Or la probabilité que beaucoup d’hypothèses soient vérifiées est plus faible, en général, que la probabilité que peu d’hypothèses soient vérifiées.

Le Rasoir d’Ockham est une méthode qui permet de choisir lorsque l’on a peu d’indices à sa disposition, dans une situation d’incertitude. C’est une sorte d’heuristique, comme on en utilise en informatique combinatoire. Un moyen d’obtenir un résultat acceptable dans la majorité des cas, lorsque l’on n’a pas assez d’information pour accéder à la solution optimale.

Merci d’avoir pris le temps de lire cet article.

--

--