Intuition et raisonnement

L’analyse des exemples proposée par Thierry Foucart montre en quoi les raisonnements spontanés, les hypothèses implicites, l’acceptation non critique de questions apparemment claires – que l’auteur désigne par le terme général d’intuition –, loin d’être les fruits de démarches sommaires qu’il serait facile de déceler et de dénoncer, s’autorisent bien souvent d’un demi-savoir nimbé du prestige des technologies modernes en matière de calcul et d’information. Se croyant dispensé d’instruction élémentaire et de pensée critique parce que ces technologies fourmillent de solutions qu’elles mettent immédiatement à la portée de la moindre requête, on néglige alors de faire l’effort de s’interroger sur l’intelligibilité même des questions et sur la manière dont les connaissances sont obtenues.

Une politique scolaire qui, au prétexte de l’inutilité pratique des savoirs élémentaires, fait sienne une telle négligence en jetant étourdiment les élèves dans la manipulation technologique, expose ces derniers à abdiquer l’exercice de leur propre raison. On retrouverait alors, à la fois renforcée et camouflée par le progrès même des techniques, la scission que Condorcet dénonçait en 1792 : « Tant qu’il y aura des hommes qui n’obéiront pas à leur raison seule, qui recevront leurs opinions d’une opinion étrangère, en vain toutes les chaînes auront été brisées, en vain ces opinions de commande seraient d’utiles vérités ; le genre humain n’en resterait pas moins partagé en deux classes, celle des hommes qui raisonnent et celle des hommes qui croient, celle des maîtres et celle des esclaves. »1 

“Intelligence” artificielle

  • Un professeur de mathématiques : quelle est la 99e décimale du nombre p ?
  • ChatGPT : 7.

C’est juste. ChatGPT a trouvé un site internet donnant une longue liste de décimales de p.

  • Le professeur de mathématiques : quelle est la probabilité que la 99e décimale du nombre p soit égale à 7 ?
  • ChatGPT : « La probabilité que la 99e décimale de π soit égale à 7 est exactement la même que pour n’importe quelle autre décimale, c’est-à-dire 1 sur 10, ou 10 %. Cela est dû au fait que π est un nombre irrationnel, ce qui signifie que ses décimales sont distribuées de manière apparemment aléatoire et non répétitive. Chacune des dix décimales possibles (0 à 9) a donc une chance égale d’apparaître à n’importe quelle position dans la séquence infinie de π. Fascinant, n’est-ce pas ? Y a-t-il autre chose sur les mathématiques ou un autre domaine qui vous intéresse ? ».

Cette réponse est fausse (la requête date d’environ un an ; elle évolue peu à peu). ChatGPT a en réalité calculé la probabilité qu’une décimale de p tirée au hasard dans la suite des décimales soit égale à 7. Cela n’a rien à voir avec la 99e décimale, qui n’est pas tirée au hasard. Ce qui est inconnu n’est pas nécessairement le fruit du hasard : la 99e décimale, connue ou non, est toujours égale au même chiffre, alors que quand on lance un dé mille fois, le 99e jet ne donne pas toujours la même face. Ce que l’on peut dire, c’est que la probabilité qu’une personne interrogée donne la bonne réponse est égale à 1 / 10, en supposant qu’elle tire un chiffre au hasard entre 0 et 9. Cela n’a rien à voir avec la distribution des décimales de p. C’est la formulation de la question qui provoque l’erreur dans la réponse et la confusion entre hasard d’une part et certain mais inconnu d’autre part.

Cette situation est plus fréquente qu’on ne le pense, parce que la tendance est l’acceptation de la question, et que son analyse rationnelle n’est pas toujours évidente : l’ensemble de tous les ensembles est-il infini ? La réponse immédiate est oui, mais elle est fausse : l’ensemble de tous les ensembles n’existe pas (c’est le théorème de Russell). Sur ce point, ChatGPT ne se trompe pas.

Raisonnement “humain”

Voici un premier exemple de raisonnement qui conduit à des notions statistiques un peu complexes et souvent à des erreurs de raisonnement.

On observe des traces de pas sur une plage : elles montrent que la personne qui a marché sur le sable chausse du 39. La question est la suivante : est-ce un homme ou une femme ?

La réponse immédiate est que c’est une femme : on tient compte sans réfléchir du fait que le nombre d’hommes chaussant du 39 est faible. La question posée ne pose apparemment guère de difficulté, et ce raisonnement peut sembler suffire. Une erreur est évidemment possible même si on peut la considérer comme rare. Mais il n’a que l’apparence de la rigueur, et on ne s’en aperçoit pas immédiatement parce qu’il confirme ce qui paraît être une évidence, et qu’on a naturellement tendance à rechercher la facilité.

En effet, imaginons que les traces de pas montrent une pointure 48 : il y a aussi très peu d’hommes chaussant du 48. En tenant strictement le même raisonnement que précédemment, on en déduit que la personne est une femme, ce qui est évidemment une absurdité. Il est donc insuffisant, et détecter l’erreur amène à réfléchir et à la corriger.

Nous sommes arrivés semble-t-il à un raisonnement correct. Mais ce n’est encore qu’une apparence : il repose implicitement sur l’hypothèse que le nombre de femmes qui marchent sur la plage est égal au nombre d’hommes. Imaginons qu’il n’y ait que très peu de femmes passant sur la plage. Les hommes chaussant du 39 sont alors plus nombreux que les femmes : le raisonnement précédent perd toute valeur et il faut tenir compte du nombre d’hommes et de femmes parmi les personnes passant sur la plage pour répondre au mieux à la question posée.

Mais ce n’est pas fini ! Le pourcentage d’hommes chaussant du 39 que l’on devrait considérer n’est pas celui des hommes en général, mais de ceux qui passent sur la plage. Ce n’est peut-être pas le même, par exemple ils peuvent être plus jeunes que la moyenne pendant les vacances scolaires, et donc plus grands. De même, le pourcentage de femmes chaussant du 39.

Il est donc nécessaire de tenir compte des effectifs d’hommes et de femmes passant sur la plage : les probabilités de tirer un homme et une femme au hasard sont les rapports de ces effectifs aux effectifs totaux : ce sont les “probabilités a priori”. On compare ensuite les “vraisemblances” des deux hypothèses homme ou femme. Quand il y a plus de femmes chaussant du 39 que d’hommes, le choix d’une femme est justifié pour une pointure 39, et quand il y a moins de femmes chaussant du 48 que d’hommes, on peut considérer que c’est un homme si la pointure est 48.

La réponse à une question apparemment simple peut être bien compliquée ! Plus les informations dont on dispose sont nombreuses, plus le résultat est vraisemblable. Mais il n’est jamais sûr.

À chaque étape du raisonnement précédent, on déduit le sexe vraisemblable de la personne qui passe sur la plage en comparant les fréquences des hommes et des femmes sous des hypothèses représentant au mieux le contexte et en choisissant la plus grande. C’est une procédure d’estimation statistique classique dite “du maximum de vraisemblance” qui peut être interprétée de la façon suivante : l’évènement qui s’est produit est celui dont la vraisemblance est la plus grande, dont la probabilité de se produire était la plus grande. Le calcul mathématique ne fait qu’appliquer ce raisonnement. Il s’exprime mathématiquement par la formule de Bayes.

Erreur et calcul

Raymond Boudon (2006, p. 128-131) cite une enquête de Toobie et Cosmides sur la prise en compte de ce que l’on appelle les probabilités a priori dans une population d’experts. Il s’agit de médecins à qui on pose la question suivante : « une maladie a un taux de prévalence de 1 / 1 000. Il existe un test permettant de détecter sa présence. Ce test a un taux de faux positifs de 5 %. Un individu est soumis au test. Le résultat est positif. Vous ne disposez d’aucune autre information sur les symptômes de chaque patient. Quelle est la probabilité qu’il soit effectivement atteint ? » La plupart des médecins répondent 95 %, tandis que la réponse correcte (2 %) est donnée par 18 % des médecins seulement.

Les probabilités a priori sont données par les proportions de malades et de non malades dans la population.

Pour calculer la bonne réponse, il suffit de compter dans une population de 10 000 personnes le nombre de personnes positives et malades (10), positives et non malades (9990 5 % = 499,5). Il y a donc 509,5 personnes détectées positives et la probabilité qu’une personne détectée positive soit effectivement infectée est donc 10 / 509,5 = 1,96 %. On peut évidemment tenir le même raisonnement sur les pourcentages, mais c’est moins clair.

Sur ce dernier exemple, la réponse de ChatGPT est exacte : « La probabilité que l’individu soit effectivement atteint de la maladie, compte tenu d’un résultat positif du test, est donc d’environ 1,96 %. » ChatGPT effectue le calcul en appliquant la formule de Bayes qui reproduit mathématiquement le calcul ci-dessus, et son “raisonnement” est parfaitement rigoureux. Mais il ne mesure pas l’effet du taux de prévalence ni celui du taux de faux négatifs supposé nul dans la question initiale, dans la probabilité que la personne soit infectée. Cette question vient naturellement à l’esprit “humain” qui se préoccupe de la diffusion de la maladie.

Modélisation et hasard

Dans les deux exemples précédents, il y a une hypothèse souvent implicite, celle du hasard.

  • Dans le premier, la suite des hypothèses évoquées concerne les caractéristiques de la population qui passe sur la plage. Chaque hypothèse considérée correspond à une répartition particulière par sexe et suivant la pointure. Le raisonnement consiste à supposer que celle qui a laissé des traces de pas est tirée au hasard dans cette population. L’estimateur du maximum de vraisemblance donne comme réponse le sexe le plus fréquent compte tenu des informations disponibles.

  • Dans le second, la procédure précise consiste à tirer un individu au hasard et à le soumettre au test. Ce n’est pas ce qui se passe dans la réalité : l’individu est testé généralement en cas de présomption d’infection, et le taux de prévalence n’est pas alors celui de la population entière. Le pourcentage donné par les médecins (95 % au lieu de 1,96 %) correspond à un taux de prévalence de 50 % environ au lieu de 5 %. Ce taux n’est pas du tout impossible dans l’ensemble des patients qui viennent consulter. L’hypothèse « Vous ne disposez d’aucune autre information sur les symptômes de chaque patient » est théorique et contraire à la pratique des médecins.

Boudon (2006, p. 97- 99) donne un autre exemple d’erreur : « un expérimentateur propose à des sujets de prédire les résultats d’une partie de pile ou face. Il leur précise qu’il utilisera une pièce biaisée ayant huit chances sur dix de retomber sur face, et deux chances sur dix de retomber sur pile. La plupart des répondants choisissent une mauvaise réponse. Ils prédisent “face” huit fois sur dix et “pile” deux fois sur dix, en s’efforçant de répartir leur réponse au hasard, alors que la bonne stratégie est de prédire face à tous les coups. » Ils reproduisent en fait la loi de probabilité, au lieu de chercher à prévoir le résultat de chaque jet. Leur intuition ne donne pas la meilleure réponse à la question, mais donne une meilleure approximation de cette loi. On peut penser que, si la question avait été posée de façon différente, en accordant une prime à chaque bonne réponse, elles auraient différentes, surtout si les réponses étaient données par des joueurs réguliers. On retrouve ici l’influence de la rédaction de la question et de la personnalité de chacun sur la réponse.

Intuition, raisonnement et compréhension

L’oubli des probabilités a priori est due à la confiance que chacun accorde à son intuition. Se limiter à cette dernière engendre souvent des erreurs, parce qu’elle est fondée sur les sentiments, l’expérience individuelle, l’éducation reçue. Ce n’est pas un raisonnement, mais un sentiment.

Prenons un autre exemple, puisé dans les sciences sociales. La perte d’efficacité de l’ascenseur social (Boone et Goujard, 2019) en France est une opinion largement partagée dans le public et parmi les responsables politiques parce qu’elle correspond à une idée généreuse et conforme à la démocratie : la promotion par le mérite est un objectif républicain. Chacun constate dans son entourage la difficulté de la promotion par le mérite, certaines statistiques semblent la confirmer, et la tendance générale consiste depuis longtemps à croire que l’ascenseur social fonctionne de plus en plus mal en France : « le pourcentage des élèves de quatre des plus prestigieuses de nos écoles et issus de milieux populaires est tombé de 29 % à 9 % entre 1950 et 1990. Le rapport du Sénat qui établit ce constat illustre un curieux renversement de tendance. » (Olivier Postel-Vinay, 2008). Pourtant, l’ascenseur social en France fonctionne à peu près comme avant. L’évolution des pourcentages est due à celle de la répartition de la population dans les catégories sociales. La population des milieux populaires a considérablement baissé en pourcentage depuis 1950, et il est normal que la proportion de cadres supérieurs qui sont issus de ces milieux ait aussi diminué : « En 1962, les exploitants agricoles représentaient 16,5 % de la population active et les ouvriers 39,1 %. Vingt ans plus tard, en 1982, les chiffres ont beaucoup changé : 7,5 % d’exploitants agricoles (plus de 50 % de baisse), 30 % d’ouvriers (25 % environ de baisse) » (Foucart, 2022). Le pourcentage de cadres supérieurs dans la population a dépassé l’an dernier celui des ouvriers. Les probabilités a priori ont complètement changé, mais Postel-Vinay s’est limité aux statistiques établies qui confirment son idée a priori. Cette intuition provoque aussi une erreur supplémentaire et une interprétation insuffisante : l’ascenseur social fonctionne nécessairement dans les deux sens, et il ne dépend pas que du mérite individuel, mais aussi de l’évolution du marché du travail.

On peut alors se demander si cette démarche intuitive est indispensable à la réflexion, au raisonnement. Le premier exemple donne la réponse. Cela commence par une observation : les traces de pas indiquant une pointure 39. Le point suivant est le questionnement : homme ou femme ? De même, une personne est testée positive : malade ou pas malade ? L’intuition donne une première réponse, irréfléchie, et est le début d’une démarche beaucoup plus complète qui suppose l’existence d’une curiosité, d’une volonté de comprendre, de savoir. C’est ce que les psychanalystes appellent l’épistémophilie.

La rigueur de chaque étape du raisonnement doit être contrôlée, ce qui nécessite du travail, de la persévérance, parfois même de l’acharnement, et de la modestie puisqu’il faut accepter non seulement de se tromper mais aussi de ne pas trouver de solution, et de le reconnaître. Cette honnêteté intellectuelle semble disparue dans certains milieux, y compris ceux de la recherche scientifique.

L’avenir

La plupart des gens se fondent surtout sur leur intuition, et ne cherchent guère à approfondir ce qu’ils croient avoir compris lorsque l’explication qu’ils avancent pour la justifier correspond à leur idée a priori. De la même façon que la calculatrice et le correcteur orthographique et grammaticale ont réduit l’intérêt pratique de connaître l’arithmétique, l’orthographe et la grammaire, l’intelligence artificielle, en donnant les solutions de problèmes même complexes, limite la nécessité de comprendre comment elles ont été obtenues. Elle rend la réflexion inutile sur le contexte de l’observation, dispense de la compréhension des méthodes utilisées et limite l’interprétation aux résultats établis par la machine. L’école suit ce mouvement général (Foucart, 2004) au lieu d’imposer une démarche individuelle constructive et critique pour contrôler chaque étape dans l’acquisition des connaissances.

L’abandon de ces apprentissages, dont l’utilité pratique se réduit au fur et à mesure que la puissance des nouvelles technologies augmente, fait craindre l’existence dans le futur d’une scission de plus en plus forte de la population en deux parties, l’une rassemblant les gens qui conserveront le goût du travail, de la recherche, de la critique, et l’autre ceux qui se borneront à la facilité des plaisirs immédiats.

Références bibliographiques

  • Boone L., Goujard A., « France, les inégalités et l’ascenseur social », Futuribles, n°433, 2019, p. 5 à 17.
  • Boudon R., 2006, Renouveler la démocratie, Odile Jacob, Paris.
  • Foucart T., 2004, « Enseignement et nouvelles technologies », Idées, n°137, p.68-74.
  • Foucart T., 2022, « Ascenseur ou mobilité sociale ? », Commentaire n°179, automne 2022, p. 601-610.
  • Postel-Vinay O., 2008, « Un art français : faire dérailler l’ascenseur social dès le lycée », Après-demain, n° 7, Août 2008, p. 24 à 26.

Note

1 – [NdE] Condorcet, Rapport et projet de décret sur l’organisation générale de l’Instruction publique, présenté à l’Assemblée législative les 20 et 21 avril 1792 ; sur le site de l’Assemblée nationale https://www.assemblee-nationale.fr/histoire/7ed.asp . Ajoutons que, contrairement aux idées qui lui sont ordinairement attribuées, Condorcet considère qu’un progrès aveugle sans maîtrise et en l’absence de sa propre intelligibilité conduit à la régression et est un facteur d’asservissement.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.