Le cerveau bayésien (Episode n°11)

Dr Jean-Pierre Papart
5 juin
5 min de lecture

Dernière mise à jour : 9 juin

Pour une cybernétique directement applicable à la théorie psychiatrique & psychothérapeutique

2^ème partie : reconnaissance visuelle

Ce n’est pas l’œil qui voit. Ce n’est pas l’âme. C’est le corps comme totalité ouverte.

Maurice Merleau-Ponty

Astérix se promène dans la forêt entourant le petit village gaulois que nous connaissons bien et pensait être seul pour admirer la nature, les arbres, quelques rochers et par chance un animal. Son attention est tout d’un coup sollicitée par un objet mouvant qu’il distingue à peine en raison de la distance qui le sépare de cet objet. En s’approchant un peu, il distingue comme un bloc de pierre volumineux qui semble bouger tout seul. En s’y rapprochant encore davantage, il distingue vaguement que ce bloc est en réalité porté par un être humain. C’est alors qu’il comprend qu’il va certainement bientôt croiser son ami Obélix en train d’effectuer une livraison. Si Astérix et Obélix s’étaient accordés pour se retrouver dans la forêt, l’information perçue aurait été conforme à la prédiction attendue, à savoir que si un bloc de pierre bouge tout seul, c’est qu’il ne peut s’agir que d’un menhir transporté par Obélix. Dans ce cas, l’erreur de prédiction visuelle serait directement retombée à zéro, vu l’équivalence entre l’information visuelle perçue et la prédiction. Mais dans notre histoire, ce n’était pas le cas, les deux amis ne s’étaient pas accordés pour aller se promener ensemble.

L’information visuelle rétinienne rejoint, via le nerf optique (II) puis la bandelette optique au-delà du chiasma optique (où se rassemble l’information en provenance des deux yeux), les corps genouillés latéraux (CGL) du thalamus où se relaient les erreurs de prédictions visuelles ascendantes, c’est-à-dire l’information visuelle dans la conception du principe de l’énergie libre de Karl Friston. Contrairement au circuit de l’information auditive, l’information visuelle ne passe pas nécessairement par les colliculus du toit du tronc cérébral, mais seulement dans certaines situations. Le circuit alternatif empruntant les colliculus supérieurs (CS) opère en cas d’orientation réflexe du regard et de la tête vers un stimulus visuel se mouvant brusquement, typiquement en cas d’approche d’un prédateur[1]. Du CGL, un noyau thalamique dit "spécifique" (car cible d’une information bien spécifique, visuelle en l’occurrence), l’information rejoint la couche corticale n°4[2] de l’aire visuelle primaire (V1=AB17[3]). C’est au niveau de V1 que débute la sensation de vision à proprement parlé, toutefois limitée à une somme de pixels. De V1, l’information poursuit son chemin vers les aires visuelles secondaire (V2=AB18) et tertiaire (V3=AB19) pour gagner en précision (les couleurs, la forme de l’objet et sa délimitation par rapport à son environnement)[4].

Ensuite, l’information visuelle poursuit sa route dans deux directions cérébrales, une voie ventrale et une voie dorsale, aux fonctions différentes.

La voie ventrale – celle répondant à la question du "qu’est-ce que c’est?", du "quoi?" – rejoint le gyrus fusiforme (GF=AB37) à la jonction temporo-occipitale pour y traiter les formes complexes, comme celle permettant d’identifier un visage (le gyrus fusiforme droit car le gauche a évolué vers la reconnaissance des lettres, des mots et des émoticônes), pour un gain supplémentaire dans la reconnaissance visuelle du "quoi". Si la stimulation conjuguée de V1 à V3 et du GF permet la reconnaissance d’un visage humain, il faut encore le transfert d’information au cortex temporal inférieur et moyen (CTI=AB20 & CTM=AB21) pour identifier plus nettement l’expression générale d’un visage afin de répondre à la question "c’est la tête de qui?". De là, l’information poursuit sa route vers le cortex périrhinal (AB36 & AB35) qui permet la reconnaissance d’un objet ou d’un visage et penser "oui, je reconnais cet objet ou ce visage" (c’est mon conjoint, mon amie, ma collègue, mon chien, en tout cas ça lui ressemble[5]). Cette voie ventrale construit des priors sur l’identité attendue de ce qui est donné à voir. Ses couches n°5 & 6 émettent des prédictions sur "ce que je vais voir" et ses couches n°2 & 3 calculent les erreurs de prédiction sur "ce que je vois réellement sans ne l’avoir prévu", dans le cadre d’une hiérarchie de reconnaissance.

Figure n°1 : Le circuit visuel (bottom) – voie ventrale à gauche / voie dorsale à droite

La voie dorsale – celle qui répond aux questions du "où?" et du "comment réagir ?", va des aires visuelles V1-V3 à la jonction occipito- (AB19) temporo- (partie antérieure d’AB37) pariétale (gyrus angulaire=AB39) qui donne la perception de la direction et de la vitesse du mouvement. Ensuite, l’information rejoint le cortex pariétal postérieur (précunéus=PC=AB07) pour la représentation du moi dans l’espace. L’information visuelle poursuit la voie dorsale vers le cortex parahippocampique (CPH=partie postérieure d’AB37) et le cortex rétrosplénique (CRS=AB20 & AB30) pour les données spatiales et contextuelles et contribuer ainsi à la dimension du "où" de la voie dorsale (mémoire épisodique associée au lieu et imagination des mouvements à venir). En fin de course, la voie dorsale aboutit au cortex prémoteur (CPM=AB06) pour y fournir les coordonnées spatiales nécessaires à l’action. Cette voie dorsale construit des priors sur la position et le mouvement de ce qui est donné à voir. Les couches n°5 & 6 de ses structures émettent des prédictions sur "où sera ce que je vais voir dans l’instant suivant" et ses couches n°2 & 3 calculent les erreurs de prédiction concernant la position et la vitesse, dans le cadre d’une hiérarchie de l’action.

Les données des voies ventrales et dorsales s’intègrent au niveau du cortex entorhinal (CE=AB28) qui fusionne leurs données pour échafauder la représentation projetée la plus adéquate possible, c’est-à-dire celle où les erreurs de prédiction établies aux différents niveaux hiérarchiques des deux voies de vision sont les plus minorées. Dans le cadre théorique de l’inférence active, le CE est le niveau hiérarchique supérieur où la prédiction de l’objet et la prédiction du contexte spatial s’intègrent pour permettre qu’une trop forte erreur de prédiction dans l’une des deux voies puisse être compensée par la précision de l’autre.

Figure n°2 : Le circuit visuel (top)

Une fois arrivées dans l’hippocampe, les données nouvelles vont s’entrecroiser avec les données de mémoire épisodique (ce que le cerveau a mémorisé de son expérience avec l’objet visuel). De l’hippocampe, les informations globales et intégrées vont évoluer dans deux directions. D’une part, vers le cortex préfrontal ventrolatéral (CPFVL=AB44, AB45 & AB47) pour y traiter leur signification sémantique et affective (contrôle cognitif et affectif) ; d’autre part, vers le cortex préfrontal dorsolatéral (CPFDL=AB09 & AB46) pour y programmer les comportements adéquats que la réception de ces informations impliquent (contrôle motivationnel). Le CPFVL va stimuler le noyau basal de l’amygdale pour l’apaiser totalement. Le CPFDL va stimuler les cortex prémoteur (AB06) et moteur (AB04) pour commander l’action. Ces commandes motrices sont aussi – toujours selon le modèle de l’inférence active – des prédictions proprioceptives qui vont s’autoréaliser via des réflexes spinaux.

Figure n°3 : Distribution des aires de Brodmann (à gauche : Vue latérale gauche / à droite : Vue sagittale droite)

Notes :

[1] Il s’agit d’un avantage de survie qui a survécu à l’évolution animale jusqu’à notre espèce. Un lapin aperçoit un lynx à l’horizon. Avant d’être emporté par une peur qui lui ferait perdre toute possibilité de survie, ses amygdales cérébrales seront significativement inhibées par un stimulation en provenance des CS pour lui permettre d’opter pour une fuite efficace avec une probabilité meilleure. Cette compétence est à la base de l’efficacité de l’EMDR.

[2] Il est impératif d’avoir lu l’épisode précédent du Cerveau Bayésien pour comprendre celui-ci.

[3] Voir la distribution des aires de Brodmann à la Figure n°3 à la fin de cet épisode.

[4] Si l’œil est l’appareil de photo ou la caméra qui capte l’information visuelle, les aires visuelles constituent l’écran sur lequel se projette la représentation visuelle.

[5] Ressembler ne signifie pas équivalence d’identité. En 1923, le médecin français Joseph Capgras (1873-1950) identifie le « syndrome d’illusion des sosies » chez une patiente schizophrène. Elle reconnait bien certaines personnes de son entourage mais est convaincue qu’il s’agit de sosies ou d’imposteurs.

Le cerveau bayésien (Episode n°11)

Posts récents

Commentaires