Le cerveau bayésien (Episode n°10)
- Dr Jean-Pierre Papart

- 12 mai
- 11 min de lecture
Pour une cybernétique directement applicable à la théorie psychiatrique & psychothérapique

1re partie : présentation générale
Pourquoi pensons-nous que la nouvelle psychothérapie bayésienne est la digne héritière de la thérapie systémique issue des Conférence de Macy ? Parce qu’entre les instances corticales du cerveau existe pareillement un échange d’information comme entre les personnes d’une famille. L’échange d’information au niveau de la famille peut s’avérer problématique et ainsi générateur de souffrance explicable par un "double bind" communicationnel entre ses membres. Entre les régions corticales du cerveau peuvent aussi exister des conflits entre les prédictions/attentes projetées et les erreurs de prédiction, que nous pouvons pareillement nommer "double bind" par assimilation métaphorique et parfois tels qu’une réduction minimale de l’énergie libre n’est possible qu’au bénéfice d’une intervention thérapeutique spécifique.
La théorie du codage prédictif proposée par Karl Friston s'inscrit dans un cadre conceptuel plus large déjà formalisé par Herman von Helmholtz (1821-1894), selon lequel la perception est une forme d'inférence. Le cerveau utilise des modèles génératifs – ce que Friston nomme priors – pour inférer les causes de son vécu sensoriel. Helmholtz était trop vieux pour avoir participé aux conférences de Macy[1]. C’est lui qui avait proposé le concept de thermodynamique (1866) qui se verra relié au concept de cybernétique. Il avait encore proposé le concept d’inconscient dans son Traité d’optique physiologique (1867) en évoquant l’inférence inconsciente pour décrire comment notre cerveau infère l’interprétation d’une image, distinguant ainsi la perception de la sensation. Il avait donc déjà montré comment la représentation procède d’une inférence. Plusieurs intervenants aux conférences de Macy n’ont pas manqué de mentionner ses apports.
Dans cette révision de l’Episode n°4 du Cerveau bayésien, nous allons nous concentrer non seulement sur la connectivité intrinsèque au sein d'une colonne corticale particulière comme nous l’avions fait au moment de mettre en ligne la première version de cet épisode, mais nous allons aussi le faire sur les connexions extrinsèques entre colonnes corticales appartenant à des aires de différents niveaux hiérarchiques. Dans la série sur Les troubles du spectre traumatique, je proposerai un exemple de ce fonctionnement hiérarchique en lien avec des événements à potentiel traumatique (EPT) qui auront évolué vers un trouble de stress post-traumatique (TSPT).
Le principe du codage prédictif hiérarchique est que le cerveau ne perçoit pas passivement le monde ; il le prédit en permanence. La "perception" n'est en réalité que la correction – plus ou moins adéquate – de ses propres erreurs de prédiction. L’erreur de prédiction mesure l'écart entre ce qui était attendu / prédit et ce qui a été perçu. La dimension hiérarchique du codage vient du fait que le cerveau est organisé par niveaux : les niveaux supérieurs émettent les prédictions vers le bas (top-down / feedback), et les niveaux inférieurs remontent les perceptions / les erreurs de prédiction vers le haut (bottom-up / feedforward). Il est attendu, d’une part que les connexions top-down soient capables d'exercer des influences fortes (excitatrices) sur les niveaux inférieurs afin de limiter l’importance des erreurs de prédictions trop éloignées des prédictions et, d’autre part que les connexions bottom-up soient suffisamment sensibles au contexte. Toutefois cette sensibilité à la « réalité » peut se voir affectée par de nombreux troubles psychiques et très significativement dans le TSPT.
Percevoir, c'est donner corps à une prédiction et agir, c'est ajuster le corps à l'état prédit corrigé des erreurs de prédiction. Tout système vivant cherche à minimiser en permanence l'écart entre ses prédictions et la réalité[2] — soit en changeant ses prédictions (perception), soit en changeant le monde (action). Un cerveau qui prédit parfaitement un monde stable n'a rien à apprendre ; un cerveau submergé d'erreurs imprévisibles est en souffrance. La santé mentale elle-même, dans ce cadre, peut se lire comme la qualité du codage prédictif.
Mais où donc s’effectuent les calculs bayésiens dans notre cerveau ?
Le cortex correspond à la fine couche (5-6 mm) de la substance grise du cerveau (80% du poids du cerveau pour 16 milliards de neurones). Il comprend six sous-couches assez bien distinctes (Figure n°1), numérotées de 1 à 6 de la surface à la profondeur. Les couches de 1 à 3 sont dites « externes / superficielles » ou « supragranulaires » (car externe à la couche 4 très granulaire[3]) et celles de 4 à 6 « internes / profondes » ou « infragranulaires » (car interne à la couche 4).
La couche n°1 (C1) est dite « acellulaire » car ne contient pas ou presque pas de corps cellulaires de neurones pyramidaux. C1 est le lieu d’arrivée des prédictions via les projections axoniques top-down/feedback des neurones pyramidaux glutaminergiques de la couche n°5 (C5) de la région hiérarchiquement supérieure (Figure n°2). Les axones de ces neurones en provenance de C5 contactent les neurones pyramidaux des couches 2, 3 et 5 dont les dendrites remontent jusqu’à C1 et où s’opère leur stimulation. Les fibres feedback sont beaucoup plus nombreuses que les fibres feedforward ; autrement dit, le cerveau envoie davantage de prédictions vers le bas qu’il ne reçoit de données du monde. C1 et C2 reçoivent aussi des projections modulatrices en provenance de plusieurs noyaux thalamiques non spécifiques[4] (pulvinar entre autres noyaux). Ces projections ne sont pas transmettrices de contenu sensoriel (contrairement aux projections de la C5 supérieure) mais sont de nature modulatrice en favorisant la précision attentionnelle au contexte prédictif à l’ensemble de la colonne corticale à laquelle appartient C1. Ces projections ne déclenchent pas de potentiels d’action en C2, C3 et C5 après stimulation de leurs synapses en C1, mais abaisse leur seuil de réception (inhibition partielle) pour orienter leur calcul d’erreur sans l’imposer[5]. On retiendra que cette couche est exclusivement réceptrice.
La couche n°2 (C2) est dite « granulaire externe ». Granulaire car contient principalement mais non exclusivement des neurones granulaires ou stellaires, c’est-à-dire des neurones assez courts présentant un petit corps cellulaire cerné de dendrites rayonnant en étoile autour de lui. Cette couche contient aussi des neurones pyramidaux de petite taille. Ils sont principalement afférents, c’est-à-dire récepteurs et intégrateurs de l’information. Les contributions de C2 sont principalement locales, propres à sa colonne corticale, sans monter dans la hiérarchie (comme le fait C3). C2 est la couche d’afférence où se rencontrent les informations top-down des prédictions (en provenance à la fois de C5 de sa propre colonne corticale et de C5 de la colonne hiérarchique supérieure après transit via C1 de sa propre colonne) d’une part et les informations bottom-up des données sensorielles intéro- et extéroceptives ayant préalablement transité par le thalamus (la gare de triage de toutes nos sensations à l’exception de l’odorat). C’est à ce niveau que s’effectuent les calculs bayésiens pour identifier les erreurs de prédiction en comparant prédictions et sensations, générant ainsi un niveau supérieur d’information croisée top-down – bottom-up qui est ensuite relayée bottom-up à C4 avant de rejoindre C3. En d’autres mots, pour calculer une erreur de prédiction, C2 a besoin de deux signaux : un signal ascendant et une prédiction descendante[6]. C’est la soustraction de l’information apportée par ces deux signaux qui constitue l’erreur de prédiction.
Figure n°1 : Rôle des couches du cortex dans la confrontation entre priors et sensations au niveau d’une colonne corticale.

La couche n°3 (C3) est « agranulaire externe ». Agranulaire car ne contient pas ou peu de cellules granulaires mais surtout des cellules pyramidales glutaminergiques de grande taille, dites agranulaires. Celles-ci sont principalement efférentes, c’est-à-dire transmettrices d’informations porteuses des erreurs de prédictions (feedforward), vers d’autres couches du cortex et en particulier à distance vers la couche 4 du niveau hiérarchique supérieur de la colonne corticale supérieure (Figure n°2). C3 est aussi la couche où sont principalement conservés et mis à jour les priors après réception des données d’erreur de prédiction en provenance de C2 après transfert via C4 de la même colonne corticale. Rappelons que les priors sont les croyances sur l’état du monde et du « moi corporel » et correspondent mathématiquement à la Valeur Prédictive Positive (VPP) de la statistique bayésienne[7]. A l’intérieur de la colonne du même niveau hiérarchique, C3 émet aussi l’information porteuse des erreurs de prédictions vers la C5 où les priors sont transformés en prédictions.
Figure n°2 : Interaction entre colonnes corticales de niveaux hiérarchiques différents dans la confrontation entre priors et sensations.

La couche n°4 (C4) est dite « granulaire interne ». Granulaire car elle contient principalement des neurones stellaires, afférents, c’est-à-dire récepteurs et intégrateurs de l’information « du monde réel »[8]. C4, comme C1, est presqu’exclusivement afférente (feedforward). Les afférences de C4 proviennent principalement de C2 appartenant à la même colonne corticale (càd du même niveau hiérarchique) et qui lui partagent les informations relatives aux erreurs de prédictions où celles-ci sont calculées, mais aussi des noyaux spécifiques du thalamus pour ce qui est du cortex sensoriel[9]. Comme mentionné plus haut, C4 de la colonne hiérarchiquement supérieure reçoit l’information de mise à jour des priors de la colonne hiérarchiquement inférieure. C4 est aussi – mais dans une nettement moindre mesure – efférente car elle relaie les informations qui lui arrivent de C2 à C3 où ces erreurs de prédictions pourront être confrontées aux priors pour les mettre à jour, pour les "updater". C4 est ainsi la couche corticale qui reçoit l’information « du monde réel » car elle ne reçoit presqu’exclusivement que des signaux « bruts », à la fois thalamiques et « feedforwardés » de C3 de la colonne hiérarchique inférieure (Figure n°2). L’information feedback transite simplement (sans valeur ajoutée significative) par C4 pour rejoindre C3 où elle sera traitée (conservation des priors après leur mise à jour suite à leur confrontation avec les nouvelles erreurs de prédiction expérimentées). En résumé symbolique, C4 est comme la porte du cerveau qui s’ouvre sur le monde.
La couche n°5 (C5) est dite « agranulaire interne ». Agranulaire – comme C3 – car contient principalement des grands neurones pyramidaux, donc agranulaires[10]. Ceux-ci sont efférents, c’est-à-dire transmetteurs d’information via le transfert top-down de la prédiction à C2. C5 est à la fois efférente et afférente. C’est à son niveau que sont produites les prédictions à partir des priors mis à disposition. Comme afférente, C5 reçoit les informations de C3 concernant l’état du prior. Des cellules pyramidales glutaminergiques de C5 sont aussi efférentes en sous-cortical au tronc cérébral et à la moëlle épinière (fonction motrice), pour ainsi traduire les prédictions en commandes motrices pour agir sur le monde afin de modifier les états externes pour les faire correspondre aux prédictions, réduisant ainsi l’énergie libre. C5 est le bras actif du système inférentiel qui assume la tâche de « changer le monde » pour le faire correspondre au mieux aux prédictions afin de minimiser autant que faire se peut l’énergie libre. Une autre partie efférente de l’information émane de la colonne corticale hiérarchiquement supérieure (Figure n°2). La C5 du niveau hiérarchique supérieur rétro-informe (feedback top-down) par voie glutaminergique la C1 de la colonne corticale hiérarchiquement inférieure de l’état des prédictions actualisé au niveau supérieur.
La couche n°6, elle est aussi comme la n°5 « agranulaire interne » avec des neurones pyramidaux, plus petits que ceux de C5, exerçant un rôle quasi exclusif de rétrocontrôle vers les noyaux du thalamus concernés spécifiques (les corps genouillés latéraux (CGL) pour l’aire visuelle primaire V1, les corps genouillés médians (CGM) pour l’aire auditive primaire (A1), le noyau ventral postéro-latéral (VPL) pour l’aire somatosensorielle (S1))6, et non spécifiques[11] (le noyau réticulaire (NR[12]), le noyau médio-dorsal (MD[13]) et le Pulvinar[14]) pour réguler la précision du flux d’information sensoriel et extra-sensoriel, pour en quelque sorte affecter le filtre d’entrée thalamique pour favoriser les signaux qui confirmeraient les prédictions (attention sélective). En quelque sorte, C6 assure une forme de contrôle prédictif très précoce sur le thalamus avant même que celui-ci ne transfert vers C4 l’information extéro- et intéroceptive.
En résumé, on peut retenir que les priors sont conservés au niveau de la couche n°3 du cortex pour être mises à disposition de la couche n°5 d’où sont produites les prédictions et où prennent racine les connexions top-down pour stimuler la couche n°2 où aboutissent aussi les projections sensorielles bottom-up. C’est au niveau de cette couche n°2 que se confrontent les priors et les données sensorielles afin de les comparer et mettre ou non en évidence une possible erreur de prédiction. L’information relative à la possible erreur de prédiction générée au niveau de la couche n°2 est ensuite projetée au niveau de la couche n°4 avant son transfert à la couche n°3 où cette information servira à "updater" les priors et ainsi boucler la bouche. Le top-down (la croyance antérieure) apporte la prédiction et le bottom-up (les évidences sensorielles) apporte l’erreur de prédiction. C’est ce qui opère au niveau de chacune des colonnes corticales. L’autre dimension (Figure n°2) correspond à la coopération entre colonnes corticales de niveaux hiérarchiques différents. Il y a transfert de l’information liée aux erreurs de prédiction de C3 du niveau inférieur à C4 du niveau supérieur, ainsi que transfert d’information de prédiction de C5 du niveau supérieur à la C1 du niveau inférieur.
Ce modèle théorique nous propose de concevoir le cerveau comme travaillant en permanence à atteindre un équilibre dans lequel l’environnement est rendu le plus prédictible possible, où l’effet de surprise est minimisé au maximum pour résoudre autant que possible l’incertitude. Pour ce faire, le cerveau incorpore un modèle génératif qui encode, au fur et à mesure de l’expérience de la vie, des croyances – des « priors » – à propos du « monde », pour les mettre continuellement à jour sur base des sensations – extéroceptives et intéroceptives – expérimentées, dans le but de diminuer les erreurs de prédiction afin d’assurer le comportement le plus adéquat susceptible de garantir la sécurité et l’économie d’énergie via la gestion émotionnelle la plus adéquate.
Le modèle théorique qu’offre le cerveau bayésien peut nous aider à concevoir un modèle thérapeutique intégré, à la fois psychiatrique et psychothérapeutique, éventuellement enrichi par des outils thérapeutiques complémentaires, tels l’hypnose médicale, les diverses techniques inspirées de l’EMDR, de la Somatic Experiencing, etc. On peut aussi concevoir qu’un codage prédictif intéroceptif perturbé est responsable d’une large gamme de troubles psycho-psychiatriques. On peut concevoir l’anxiété chronique comme la résultante d’un signal enraciné d’erreur de prédiction intéroceptive inadéquate. Les symptômes dissociatifs, notamment la dépersonnalisation et la déréalisation, proviennent de signaux imprécis d’erreur de prédiction intéroceptive. De même, le sens subjectif de la réalité caractéristique de l’expérience consciente normale – ou mieux dit ordinaire – peut dépendre de la suppression réussie des signaux intéroceptifs par de meilleures prédictions top-down.
Notes :
[1] Voir les Episodes n°7 et 8 de la série Le cerveau bayésien.
[2] Ce que Friston nomme « réduction de l’énergie libre ».
[3] On pourra lire qu’une région du cortex est très granulaire si elle présente une couche n°4 particulièrement développée ou sinon agranulaire dans le cas inverse.
[4] La classification entre noyaux thalamiques spécifiques et non spécifiques sera expliquée plus bas.
[5] Selon Friston, la prédiction ne force pas une réponse spécifique, mais prépare le neurone à répondre à un certain signal, en rendant certaines erreurs plus ou moins probables.
[6] Dans la Figure 1, le signal ascendant est présenté montant du bas (thalamus) vers le haut (C2), tandis que la prédiction descendante est toutefois aussi présentée montant du bas (C5) vers le haut (C1/C2).
[8] Comme C4 contient à la fois des neurones granulaires afférents mais aussi – dans une nettement moindre mesure – des neurones agranulaires efférents, c’est la raison pour laquelle elle est parfois mentionnée dans des publications comme « dysgranulaire ».
[9] Le cortex sensoriel (CS) comprend le CS extéroceptif (CSE) et le CS intéroceptif (CSI). Le CSE comprend le cortex visuel primaire (V1), le cortex auditif primaire (A1) et le somatosensoriel primaire (S1). Le CSE présente une couche granulaire (n°4) particulièrement développée. En effet, par définition le cortex sensoriel est fondamentalement récepteur d’information. Pour les détails voir l’épisode n°11 Le Cerveau bayésien.
[10] Les cortex moteur (AB04) et prémoteur (AB06), ainsi que les cortex cingulaire antérieur et insulaire antérieur, présentent des couches agranulaires (n°3 et n°5) particulièrement développées. Ces cortex ont par contre une couche n°4 particulièrement réduite.
[11] Les projections des noyaux thalamiques non spécifiques ne sont pas porteuses d’information spécifiquement sensorielles contrairement aux noyaux dits spécifiques, leur nature est en l’espèce modulatrice de la précision attentionnelle.
[12] Le noyau réticulaire thalamique (NR) a une fonction de filtre général (rôle inhibiteur) de l’information montante à travers la stimulation de C6. C’est le mécanisme par lequel notre cerveau peut éventuellement ignorer un bruit comme un son répétitif tout en restant disponible à un nouveau bruit/son.
[13] Le noyau médio-dorsal (MD) module la précision avec le cortex préfrontal (CPF) pour permettre la mise à jour de la mémoire de travail en fonction des erreurs de prédictions montantes.
[14] Le pulvinar module spécifiquement la précision avec le cortex visuel en fonction des erreurs de prédictions montantes. Il renforce la rapidité dans la détection des changements brusques environnementaux, par exemple lorsqu’un objet est en mouvement et apparaît comme grandissant en taille, c’est-à-dire lorsqu’il se rapproche (typiquement un prédateur). Par son rôle attentionnel, le pulvinar contribue à maintenir l’image sur la rétine en compensant les mouvements de la tête et du corps.

Commentaires