AI, pourquoi a-t-elle aussi besoin de dormir ?

Source : Geek Park

Rédigé par : Tang Yitao

Le 31 mars 2026, Anthropic, à cause d’une erreur d’empaquetage, a exposé au public 510k lignes de code source de Claude Code dans un dépôt npm public. Le code a été mis en miroir sur GitHub en quelques heures, et il n’a plus été possible de le récupérer.

Le contenu divulgué est abondant, et les chercheurs en sécurité ainsi que les concurrents y ont tous trouvé leur compte. Mais parmi toutes les fonctionnalités non encore publiées, il y en a une dont le nom a suscité un large débat — autoDream, faire automatiquement des rêves.

autoDream fait partie d’un système d’arrière-plan en permanence appelé KAIROS (grec ancien, signifiant « le moment opportun »).

KAIROS observe et enregistre en continu pendant le travail de l’utilisateur, en tenant un journal quotidien (avec quelque chose de l’esprit d’un homard). autoDream, lui, ne démarre qu’après que l’utilisateur a éteint l’ordinateur : il trie les souvenirs accumulés pendant la journée, efface les contradictions, et transforme les observations floues en faits bien établis.

Les deux forment un cycle complet : KAIROS est éveillé, autoDream dort — des ingénieurs d’Anthropic ont fabriqué un rythme de vie pour l’IA.

Au cours des deux dernières années, le récit le plus chaud dans l’industrie de l’IA a été celui des agents : fonctionner de façon autonome, sans jamais s’arrêter, ce qui est considéré comme l’avantage central de l’IA par rapport aux humains.

Mais l’entreprise qui pousse le plus loin les capacités d’agent, a précisément, dans son propre code, programmé des heures de repos pour l’IA.

Pourquoi ?

01 Le coût de ne jamais s’arrêter

Une IA qui ne s’arrête jamais se heurte à un mur.

Chaque grand modèle de langage possède une « fenêtre de contexte » : à un moment donné, la quantité d’informations qu’il peut traiter a une limite physique. Quand un agent fonctionne en continu, l’historique du projet, les préférences de l’utilisateur et les enregistrements de conversation s’accumulent sans cesse ; une fois le seuil atteint, le modèle commence à oublier les instructions initiales, à présenter des contradictions entre le passé et le présent, et à inventer des faits.

La communauté technique appelle cela « corruption du contexte ».

De nombreuses solutions pour les agents sont assez brutales : mettre tout l’historique dans la fenêtre de contexte, en espérant que le modèle lui-même fasse la différence entre le principal et le secondaire. Résultat : plus il y a d’informations, plus la performance se dégrade.

Le mur contre lequel se cogne le cerveau humain est le même.

Tout ce qui est vécu pendant la journée est rapidement consigné dans « l’hippocampe ». C’est une zone de stockage temporaire à capacité limitée, plus proche d’un tableau blanc. La vraie mémoire à long terme est stockée dans le « néocortex », une zone de grande capacité mais où l’écriture est lente.

La tâche essentielle du sommeil humain consiste à vider le tableau blanc chargé et à transférer les informations utiles vers le disque dur.

Le laboratoire du Centre de neurosciences de l’Université de Zurich (Suisse), dirigé par Björn Rasch, a baptisé ce processus « consolidation active des systèmes » (active systems consolidation).

Des expériences répétées de privation de sommeil montrent encore et encore que le cerveau qui ne s’arrête jamais ne devient pas plus efficace : la mémoire se dégrade d’abord, puis l’attention, et finalement même le jugement de base s’effondre.

La sélection naturelle est impitoyable envers les comportements inefficaces, mais le sommeil n’a pas été éliminé. Des mouches aux baleines, presque tous les animaux dotés d’un système nerveux dorment. Les dauphins ont évolué vers une « demi-inconscience » (half-brain sleep) où les hémisphères se reposent alternativement — il préfère inventer une nouvelle façon de dormir plutôt que de renoncer au sommeil lui-même.

Scène de l’orque, de la baleine blanche et du grand dauphin à bec court se reposant au fond de l’étang | Source de l’image : National Library of Medicine (United States)

Les deux systèmes font face à la même contrainte : des capacités de traitement immédiat limitées, mais une expérience historique qui gonfle sans fin.

02 Deux copies de réponse

En biologie, il existe un concept appelé évolution convergente : des espèces éloignées sur le plan généalogique, confrontées à des pressions environnementales similaires, évoluent indépendamment vers des solutions similaires. L’exemple le plus classique est celui des yeux.

Les poulpes et les humains ont tous deux des yeux de type « caméra » : une lentille à mise au point permet de focaliser la lumière sur la rétine, un anneau d’iris contrôle la quantité de lumière qui entre, et la structure globale est presque identique.

Comparaison des yeux du poulpe et de l’humain | Source de l’image : OctoNation

Mais le poulpe est un mollusque souple, l’humain un vertébré ; leur ancêtre commun vivait il y a plus de 510k d’années, quand la Terre ne possédait aucun organe visuel complexe. Deux voies d’évolution totalement indépendantes mènent à une fin presque identique. Parce que pour convertir la lumière efficacement en une image claire, les chemins autorisés par les lois de la physique ne laissent presque qu’une seule option : le modèle de caméra — des lentilles focalisables, des surfaces photosensibles capables de recevoir l’image et un diaphragme réglant l’apport de lumière, les trois étant indispensables.

La relation entre autoDream et le sommeil humain pourrait être de ce type : sous des contraintes similaires, deux systèmes pourraient converger vers des structures similaires.

Le point commun le plus ressemblant aux deux est le fait qu’il faut être hors ligne.

autoDream ne peut pas fonctionner pendant que l’utilisateur travaille ; il démarre indépendamment en tant que processus enfant en fork, entièrement isolé du thread principal, avec des permissions d’outillage strictement limitées.

Le cerveau humain fait face au même problème, avec une solution plus radicale : la mémoire est déplacée de l’hippocampe (zone de stockage temporaire) vers le néocortex (zone de stockage à long terme), nécessitant un ensemble de rythmes électroencéphalographiques qui n’apparaissent que pendant le sommeil.

Parmi ceux-ci, le plus essentiel est l’onde « ripple » (vagues de pointe) de l’hippocampe : elle est responsable d’assembler, puis d’envoyer, une à une, les fragments de souvenirs encodés dans la journée vers le cortex cérébral ; les oscillations lentes du cortex et les fuseaux thalamiques fournissent l’accompagnement temporel précis à tout le processus.

Ces rythmes ne peuvent pas se former à l’état éveillé : des stimulations externes les perturbent. Donc ce n’est pas parce que vous avez sommeil que vous dormez ; c’est parce que le cerveau doit fermer la porte d’entrée pour ouvrir la porte de sortie.

Ou dit autrement, dans la même fenêtre temporelle, l’absorption de l’information et le tri de la structure se font concurrence en tant que ressources, et ne sont pas des ressources complémentaires.

Modèle de consolidation des systèmes actifs pendant le sommeil. A(transfert de données) : Pendant le sommeil profond (sommeil à ondes lentes), les souvenirs nouvellement écrits dans « l’hippocampe » (zone de stockage temporaire) sont rejoués à plusieurs reprises, afin d’être progressivement transférés et consolidés dans le « néocortex » (zone de stockage à long terme). B(protocole de transmission) : Ce processus de transfert de données dépend d’une « conversation » hautement synchronisée entre les deux régions. Le cortex cérébral émet des ondes cérébrales lentes (ligne rouge) comme battement principal. Sous l’impulsion des pics, l’hippocampe regroupe les fragments de mémoire en signaux haute fréquence (les « ripples » en vert à l’endroit de la ligne verte), puis s’accorde parfaitement avec les porteuses émises par le thalamus (les fuseaux en bleu à l’endroit de la ligne bleue). Cela ressemble à l’insertion précise de données de mémoire haute fréquence dans les interstices du canal de transmission, afin de garantir que les informations soient téléversées de façon synchronisée vers le cortex cérébral.|Source de l’image : National Library of Medicine (United States)

Une autre direction consiste à ne pas faire une mémoire exhaustive, mais à faire de l’édition.

Après le démarrage, autoDream ne conserve pas tous les journaux. Il lit d’abord la mémoire existante pour confirmer les informations déjà connues, puis scanne chaque journal quotidien de KAIROS, en traitant en priorité les parties dont la cognition antérieure dévie : celles qui sont différentes de ce qui a été dit la veille, et qui sont plus complexes que ce qu’on pensait auparavant, seront consignées en premier.

Les souvenirs une fois triés sont stockés dans un ensemble d’index à trois niveaux : la couche de pointeurs légers est toujours chargée, les fichiers thématiques sont appelés à la demande, et l’historique complet n’est jamais chargé directement. Et les faits que l’on peut retrouver directement dans le code du projet (par exemple, dans quel fichier une fonction est définie) ne sont tout simplement pas écrits dans la mémoire.

Pendant le sommeil, le cerveau humain fait presque la même chose.

Une étude de la conférencière de la Harvard Medical School, Erin J Wamsley, indique que le sommeil consolide en priorité des informations inhabituelles — par exemple celles qui vous surprennent, celles liées à des variations émotionnelles, ou celles associées à des problèmes pas encore résolus. En revanche, une grande quantité de détails quotidiens répétitifs et sans caractéristiques est abandonnée : seules restent des règles abstraites — vous ne vous souvenez peut-être pas clairement de ce que vous avez vu exactement sur le chemin du travail hier, mais vous savez comment le chemin se parcourt.

Ce qui est intéressant, c’est qu’il y a un endroit où les deux systèmes font un choix différent. La mémoire produite par autoDream est explicitement annotée dans le code comme « hint » (indice) plutôt que « truth » (vérité) : avant chaque utilisation, le proxy doit revalider si cela reste encore valable, car il sait que ce qu’il a trié pourrait ne pas être exact.

Le cerveau humain ne dispose pas de ce mécanisme. C’est pour cela que les témoins oculaires dans une salle d’audience fournissent souvent des déclarations erronées. Ce n’est pas qu’ils mentent intentionnellement ; c’est parce que la mémoire se recompose temporairement à partir de fragments dispersés du cerveau, et que l’erreur est la norme.

L’évolution n’a probablement pas besoin d’équiper le cerveau humain d’une étiquette d’incertitude. Dans un environnement primitif où le corps doit réagir rapidement, croire la mémoire permet d’agir immédiatement ; douter de la mémoire fait hésiter — et l’hésitation, c’est la défaite.

Mais pour une IA qui prend sans cesse des décisions de type « connaissances », le coût de la validation est faible, et la confiance aveugle est au contraire dangereuse.

Deux situations, et donc deux séries de réponses différentes.

03 La paresse plus intelligente

En biologie évolutionniste, l’évolution convergente signifie que deux voies indépendantes, sans échange direct d’information, mènent au même point d’arrivée. Dans la nature il n’y a pas de copiage, mais les ingénieurs peuvent lire des articles.

Lors de la conception de ce mécanisme de sommeil, Anthropic l’a fait parce qu’il a heurté un mur physique identique à celui du cerveau humain, ou bien parce qu’ils s’en sont inspirés dès le départ depuis les neurosciences ?

Dans le code divulgué, il n’y a aucune référence à des articles de neurosciences ; le nom autoDream ressemble aussi davantage à une blague de programmeur. Le moteur le plus puissant devrait plutôt être la contrainte d’ingénierie elle-même : il y a une limite stricte au contexte, un fonctionnement prolongé entraîne une accumulation de bruit, et le tri en ligne contamine les inférences du thread principal. Ils résolvent un problème d’ingénierie, et l’imitations n’a jamais été l’objectif.

Ce qui décide vraiment de la forme de la réponse, c’est la force de compression des contraintes elles-mêmes.

Au cours des deux dernières années, dans l’industrie de l’IA, la définition d’une « intelligence plus forte » a presque toujours pointé dans la même direction : des modèles plus grands, un contexte plus long, une inférence plus rapide, un fonctionnement ininterrompu 7×24 heures. La direction est toujours « davantage ».

L’existence d’autoDream suggère une proposition différente : une intelligence intelligente pourrait être une intelligence plus paresseuse.

Un agent intelligent qui ne s’arrête jamais pour se trier ne deviendra pas de plus en plus intelligent ; il deviendra seulement de plus en plus confus.

Après des centaines de millions d’années d’évolution, le cerveau humain a tiré une conclusion qui semble, à première vue, maladroite : l’intelligence doit avoir un rythme. La veille sert à percevoir le monde, le sommeil sert à comprendre le monde. Quand une entreprise d’IA, en résolvant un problème d’ingénierie, arrive indépendamment à la même conclusion, cela pourrait suggérer :

L’intelligence a quelques coûts fondamentaux qu’on ne peut pas éviter.

Peut-être qu’une IA qui ne dort jamais n’est pas une IA plus forte. Elle est simplement une IA qui n’a pas encore réalisé qu’elle a besoin de dormir.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler