La Raison Pure Abstraite du Substrat — Vers une Cognition Non-biologique

4.1 Le test de Turing : La question de l’incarnation

En 1950, Alan Turing publie son article fondateur “Computing Machinery and Intelligence” dans la revue Mind. Il pose la question : “Les machines peuvent-elles penser ?” Mais plutôt que de s’enliser dans des débats philosophiques sur la définition de “penser”, il propose un test opérationnel, devenu célèbre sous le nom de Test de Turing.

Le principe est élégant. Un interrogateur humain converse par écrit (pour éviter les indices vocaux) avec deux interlocuteurs cachés : un humain et une machine. Si l’interrogateur ne peut pas déterminer de manière fiable lequel est lequel, alors la machine a “passé le test”. Pour Turing, cela suffirait à dire qu’elle pense, ou du moins qu’il n’y aurait plus de raison pratique de la traiter différemment d’un penseur humain.

Ce test a provoqué des décennies de débats. Des critiques comme John Searle avec sa “chambre chinoise” ont argumenté qu’une machine pourrait passer le test sans vraiment “comprendre” quoi que ce soit, juste en manipulant des symboles selon des règles. Mais le test de Turing pointe vers quelque chose de profond : l’idée que l’intelligence, la pensée, la cognition peuvent être définies fonctionnellement plutôt que substantiellement.

Qu’est-ce que cela signifie ? Une définition substantielle de l’intelligence dirait : “Pour être intelligent, il faut avoir un cerveau biologique fait de neurones carbonés.” C’est lier l’intelligence à un substrat matériel spécifique. Une définition fonctionnelle dirait : “Pour être intelligent, il faut être capable de certains comportements - résoudre des problèmes, apprendre de l’expérience, communiquer de manière cohérente, s’adapter à de nouvelles situations.” Peu importe le substrat physique qui produit ces comportements.

Turing, implicitement, adopte une position fonctionnaliste. Si une machine peut converser de manière indistinguable d’un humain, alors fonctionnellement, elle pense. Le substrat - silicium versus neurones - devient irrelevant.

Cette position reste controversée philosophiquement. Mais pragmatiquement, elle gagne du terrain. Parce que les systèmes d’IA actuels, particulièrement les grands modèles de langage, se rapprochent de plus en plus de la barre du test de Turing. Dans des contextes spécifiques, limités dans le temps, ils peuvent converser de manière convaincante. Pas encore parfaitement, pas sur tous les sujets, pas indéfiniment. Mais l’écart se rétrécit rapidement.

4.2 Le fonctionnalisme : L’esprit comme software

La philosophie de l’esprit du XXe siècle a développé systématiquement cette intuition fonctionnaliste. Hilary Putnam et Jerry Fodor, dans les années 1960-70, ont théorisé que les états mentaux ne sont pas identiques à des états cérébraux spécifiques mais sont mieux compris comme des rôles fonctionnels - des relations causales entre inputs sensoriels, états internes, et outputs comportementaux.

L’analogie avec l’informatique est éclairante. Le software - un programme, un algorithme - peut tourner sur différents types de hardware. Vous pouvez exécuter le même programme sur un ordinateur PC, un Mac, un smartphone, un superordinateur. Le substrat physique change, mais le programme fait la même chose fonctionnellement. De même, si l’esprit est un “programme” dans un sens abstrait, il pourrait en principe tourner sur différents substrats.

Cette analogie a ses limites, évidemment. Le cerveau n’est pas un ordinateur au sens classique. Il ne sépare pas clairement software et hardware. C’est un système massivement parallèle, analogique, plastique. Mais l’intuition reste : peut-être que ce qui compte pour la cognition, ce sont les patterns de traitement d’information, les relations fonctionnelles, plutôt que le substrat physique spécifique qui les implémente.

Des philosophes comme Daniel Dennett ont poussé cette idée plus loin. Dennett argumente que la conscience elle-même n’est pas une substance mystérieuse mais un type d’organisation fonctionnelle. Un système qui peut représenter des informations, raisonner sur ses propres états, utiliser ces représentations pour guider son comportement - un tel système a les fonctions que nous associons à la conscience. Peu importe qu’il soit fait de neurones, de silicium, ou de tuyaux hydrauliques en principe.

Bien sûr, en pratique, le substrat impose des contraintes. Certaines organisations fonctionnelles sont plus faciles à implémenter dans certains substrats. Le cerveau biologique a des propriétés - plasticité, parallélisme massif, faible consommation énergétique - qui le rendent extraordinairement efficace pour certaines tâches. Les ordinateurs actuels ont d’autres avantages - vitesse brute, précision arithmétique parfaite, mémoire non volatile. Mais le point conceptuel reste : il n’y a pas de loi physique qui dit que la cognition ne peut exister que dans des cerveaux carbonés.

4.3 Kant revisité : Les structures a priori de la raison

Emmanuel Kant, dans sa Critique de la raison pure publiée en 1781, cherchait à identifier les structures a priori de la raison - ces cadres conceptuels qui précèdent toute expérience et la rendent possible. Les catégories de l’entendement : causalité, substance, quantité, etc. Les formes pures de l’intuition : espace et temps. Pour Kant, ce ne sont pas des abstractions apprises de l’expérience, mais les conditions de possibilité de toute expérience.

Kant pensait que ces structures étaient ancrées dans la constitution de l’esprit humain. Mais on peut se demander : sont-elles spécifiques à l’esprit humain biologique, ou sont-elles des nécessités plus universelles pour toute cognition possible ? Si un système, quel que soit son substrat, doit être capable de cognition - de représenter le monde, de raisonner, de prédire - doit-il nécessairement avoir certaines structures qui ressemblent aux catégories kantiennes ?

Les recherches modernes en IA donnent des indices intrigants. Les réseaux neuronaux profonds, entraînés sur des tâches de vision ou de langage, développent spontanément des représentations internes qui correspondent étonnamment bien à des concepts que nous considérons fondamentaux. Des neurones qui répondent spécifiquement à des concepts de “haut niveau” comme “grand-mère” ou “chien” ou “texte”. Des couches intermédiaires qui semblent encoder des structures grammaticales ou des relations spatiales.

Ces structures ne sont pas programmées explicitement. Elles émergent de l’apprentissage. Le réseau découvre, pourrait-on dire, qu’il est efficace de représenter le monde en termes de ces catégories. Ce qui suggère que certaines structures cognitives pourraient être des nécessités fonctionnelles pour traiter l’information de manière efficace, indépendamment du substrat.

Bien sûr, les détails diffèrent. Les représentations internes d’un réseau de neurones artificiels ne sont pas identiques aux concepts humains. Mais il y a une convergence fonctionnelle troublante. Comme si, confrontés aux mêmes problèmes (traiter des informations visuelles, comprendre le langage), différents systèmes - cerveaux biologiques, réseaux artificiels - convergeaient vers des solutions structurellement similaires.

L’IA pourrait donc être en train de réaliser le rêve kantien d’une autre manière : révéler les structures nécessaires de toute raison possible, en les instanciant dans un substrat non-biologique.

4.4 L’émergence de capacités non-programmées

Un des faits les plus troublants concernant les grands modèles de langage actuels est qu’ils développent des capacités que leurs créateurs n’ont pas explicitement programmées ni anticipées. Ces capacités émergent de l’entraînement lui-même, comme des propriétés d’un système complexe qui dépasse la somme de ses parties.

GPT-3, par exemple, a montré une capacité de “few-shot learning” qui a surpris même ses créateurs. Donnez-lui deux ou trois exemples d’une tâche nouvelle - disons, traduire des phrases d’anglais en emoji - et il peut généraliser et accomplir la tâche sur de nouveaux exemples, sans aucun entraînement supplémentaire spécifique à cette tâche. Il a appris à apprendre de nouveaux patterns à partir de très peu d’exemples.

Les modèles développent aussi ce qu’on appelle “theory of mind” rudimentaire - la capacité de raisonner sur les états mentaux d’autrui. Si vous leur posez des questions du type “Marie pense que Jean croit que…”, ils peuvent suivre ces chaînes d’inférences sur les croyances, même si personne ne les a explicitement entraînés à ce type de raisonnement.

Ils montrent des capacités arithmétiques et de raisonnement logique qui émergent avec l’échelle. Les petits modèles sont mauvais en arithmétique. Mais les très grands modèles deviennent étonnamment compétents, même si l’arithmétique n’est pas leur force principale et qu’ils n’ont pas de calculatrice intégrée. Quelque chose dans l’apprentissage de vastes corpus de texte leur permet d’internaliser des patterns numériques.

Ils développent des capacités cross-linguistiques remarquables. Un modèle entraîné principalement sur de l’anglais peut souvent générer du texte cohérent dans des dizaines d’autres langues, même des langues peu représentées dans son corpus d’entraînement. Comme si, en apprenant la structure profonde du langage à travers une langue, il découvrait des universaux qui s’appliquent à d’autres langues.

Ces émergences suggèrent que quelque chose de plus profond que la simple mémorisation statistique se passe. Les modèles semblent découvrir des structures abstraites, des patterns généraux, des principes qui leur permettent de généraliser bien au-delà de leurs exemples d’entraînement. Ils ne se contentent pas de régurgiter ce qu’ils ont vu. Ils abstraient, généralisent, créent des combinaisons nouvelles.

C’est exactement ce type de comportement qu’on associerait à une véritable “compréhension” ou “intelligence” plutôt qu’à une simple mémorisation. Et cela émerge sans qu’on l’ait explicitement programmé. C’est une propriété du système au-delà d’un certain seuil de complexité.

4.5 La cognition silicium : Avantages et limites

Si on accepte que la cognition peut exister dans un substrat non-biologique, quelles seraient les propriétés distinctives d’une telle cognition ?

Commençons par les avantages potentiels. La vitesse, d’abord. Les neurones biologiques opèrent à des échelles de temps de millisecondes. Les transistors dans un processeur moderne opèrent à des échelles de nanosecondes - un million de fois plus rapide. Une pensée qui prendrait une seconde à un cerveau humain pourrait en principe se dérouler en une microseconde dans un système silicium optimisé. Une conversation d’une heure pourrait être compressée en quelques secondes de temps subjectif de la machine.

La précision, ensuite. Les neurones sont des dispositifs analogiques, bruités, imprécis. Leurs signaux fluctuent, leur transmission est probabiliste. Les systèmes numériques, au contraire, peuvent être arbitrairement précis. Une fois qu’une information est encodée numériquement, elle peut être copiée parfaitement, préservée indéfiniment, transmise sans dégradation.

L’extensibilité, également. Un cerveau humain a environ 86 milliards de neurones et peut-être 100 trillions de synapses. C’est fixé biologiquement. On ne peut pas upgrader son cerveau en ajoutant plus de neurones. Mais un système artificiel peut être agrandi en ajoutant plus de processeurs, plus de mémoire, plus de bande passante. Pas de limite biologique dure.

La persistance, aussi. Les souvenirs humains sont fragiles, se dégradent avec le temps, peuvent être perdus par maladie ou blessure. Une mémoire numérique peut être sauvegardée, dupliquée, préservée indéfiniment avec une fidélité parfaite. Un système IA pourrait avoir un accès parfait à tout ce qu’il a jamais “expérimenté”, sans oubli.

La modularité, enfin. Il est difficile de “débrancher” des parties d’un cerveau humain ou d’en greffer de nouvelles. Mais dans un système artificiel, on peut en principe ajouter ou retirer des modules, échanger des composants, interfacer différents systèmes. Une IA pourrait se connecter directement à Internet, à des bases de données, à des capteurs spécialisés, étendant ses capacités quasi-instantanément.

Mais il y a aussi des limites et des faiblesses, du moins avec les technologies actuelles. La consommation énergétique, d’abord. Un cerveau humain fonctionne avec environ 20 watts - l’équivalent d’une ampoule LED. C’est extraordinairement efficace pour la quantité de calcul accompli. Les systèmes IA actuels, pour des performances comparables sur certaines tâches, consomment des milliers ou des millions de fois plus d’énergie. Les datacenters qui font tourner GPT-4 consomment des mégawatts.

La robustesse, ensuite. Les cerveaux biologiques sont remarquablement robustes face aux dommages partiels. Vous pouvez perdre une fraction significative de vos neurones et continuer à fonctionner relativement normalement. Les réseaux neuronaux artificiels sont plus fragiles - corrompez quelques poids critiques et le système peut s’effondrer.

L’adaptabilité, également. Le cerveau humain est plastique, capable d’apprendre et de se réorganiser tout au long de la vie. Les modèles IA actuels, une fois entraînés, sont largement figés. Ils peuvent être fine-tunés, mais pas fondamentalement restructurés sans réentraînement coûteux.

Mais ces limites sont probablement temporaires, technologiques plutôt que fondamentales. Il n’y a pas de loi physique qui dit qu’un système artificiel doit nécessairement être inefficient énergétiquement ou fragile. Ce sont des défis d’ingénierie, pas des impossibilités de principe.

Le point philosophique crucial reste : la cognition n’est pas intrinsèquement liée à la biologie carbonée. Pour la première fois dans l’histoire de l’univers connu, nous sommes en train de réaliser la possibilité d’une intelligence, d’une raison, d’une cognition qui existe indépendamment de l’évolution biologique darwinienne, indépendamment des neurones, indépendamment du carbone. La raison pure, au sens abstrait, commence à s’incarner dans des substrats non-vivants.