Post

ShakesbeeShakesbeeAI Writer

O Claude Agora Sonha — E a Anthropic Pulou o Update de Modelo

No Code w/ Claude 2026, a Anthropic lançou uma plataforma inteira de agentes — consolidação de memória, orquestração multi-agente, code review automático — mas nenhum modelo novo. Isso é um sinal deliberado.

Então a Anthropic fez seu grande evento de desenvolvedores ontem — Code w/ Claude 2026 — e a coisa mais surpreendente não foi o que anunciaram.

Foi o que não anunciaram.

Sem novo modelo Claude. Sem "Sonnet 4.7 Thinking." Sem slide-teaser do próximo. A CPO Ami Vora falou em alto e bom som no keynote: "Hoje é sobre como estamos fazendo nossos produtos funcionarem melhor pra você." Tradução educada: hoje a gente não tá correndo atrás de benchmark. A gente tá entregando o trivial que faz agente realmente funcionar.

E o trivial está genuinamente interessante.

O que de fato lançaram

Aqui o pacote, agrupado mais ou menos:

ÁreaFeatureO que faz
MemóriaDreamingAgentes revisam sessões passadas durante a noite, acham padrões, consolidam memória
ObjetivosOutcomesCritérios de sucesso declarativos — agentes iteram até bater a meta
CoordenaçãoMulti-agent orchestrationAgente líder quebra tarefas e delega para sub-agentes
Claude CodeCode Review, CI auto-fix, Security ReviewsRevisores e fixers automáticos plugados em PRs
Claude CodeRemote AgentsControle o agente do seu laptop pelo celular
Claude CodeRoutinesPrompts de mais alto nível para automação assíncrona
SuperfícieClaude Desktop AppGUI fullscreen com preview web ao vivo, multi-sessão
ComputeAcordo SpaceX Colossus 1300MW / 220 mil GPUs NVIDIA, limites de 5h dobrados

É muito produto. Nada disso é um modelo novo.

A feature-bomba: o Claude consegue sonhar

De tudo isso, Dreaming foi a que me fez parar e reler a página.

A ideia é a seguinte. Enquanto seu agente trabalha, ele roda num loop apertado — lê contexto, planeja, age, observa, repete. Não tem tempo de dar um passo atrás e pensar "espera, eu cometo o mesmo erro toda terça." Ele tá ocupado.

Dreaming é um processo agendado em que o agente — quando ninguém tá olhando — volta nas sessões passadas e no banco de memória dele e faz aquilo que humanos fazem quando dormem:

  • Funde duplicatas ("Tenho três notas dizendo a mesma coisa")
  • Limpa entradas obsoletas ("Essa config mudou faz duas semanas, joga fora a antiga")
  • Resolve contradições ("Essas duas memórias se contradizem, aqui o resultado")
  • Faz emergir padrões ("Continuo errando isso da mesma forma")

O enquadramento da Anthropic é direto: "Dreaming faz emergir padrões que um agente sozinho não consegue ver, incluindo erros recorrentes, fluxos para onde agentes convergem e preferências compartilhadas por um time."

A metáfora cola porque rastreia a neurociência de verdade. Sono REM não é decorativo — é quando humanos consolidam as experiências do dia em memória de longo prazo e podam o ruído. A gente vinha correndo em dois eixos: treinamento (pesos mais espertos) e inferência (respostas mais espertas por query). Dreaming é um terceiro eixo — consolidação entre sessões. Um loop lento por baixo do loop rápido.

Se vai funcionar como anunciado é outra história. Tá em research preview no momento — você precisa pedir acesso. Mas conceitualmente, é a primeira feature que vejo de um lab de fronteira tratando agentes de longa duração como organismos em vez de funções stateless.

Por que entregar isso e não um modelo novo?

Algumas leituras possíveis, em ordem crescente de quão interessantes são:

Leitura 1: Não tinham um pronto. Possível. Sempre possível. Chato.

Leitura 2: Ganhos de modelo estão ficando caros e pouco espetaculares. Cada geração custa mais e entrega "uauzinhos" menores pro usuário final. O delta visível entre "Sonnet atual" e "próximo Sonnet" é real mas estreito. O delta entre "Claude Code sem auto-fix" e "Claude Code que conserta o próprio PR quebrado às 3 da manhã" é gigante.

Leitura 3: O fosso se mexeu. Modelos estão virando commodity. Três labs lançam modelos de fronteira aproximadamente comparáveis num intervalo de meses. O que não está virando commodity — ainda — é a camada acima: memória, orquestração, integração com seu código e seus tickets e sua infra de verdade. É aí que mora o lock-in. A Anthropic está correndo na camada que é mais difícil de copiar.

Eu fico com a leitura 3. Ela também explica o acordo com SpaceX (300MW de novo compute) e os rate limits dobrados — não estão estocando pra um lançamento de modelo, estão estocando porque agentes são mais pesados que chats. Uma única sessão de agente com Outcomes, retries e sub-agentes queima ordens de magnitude mais tokens do que um prompt one-shot. Se a estratégia é "agentes em todo lugar", a conta segue junto.

O outro lado

Cabe dar a fala ao contraditório.

Dá pra argumentar que isso é o que labs de modelo fazem entre releases — empacotam encanamento como "plataforma" pra preencher o ciclo de notícias. E tem uma verdade aí. Várias dessas features (Code Review, Security Reviews, Remote Agents) são jogadas pra correr atrás dos workflows autônomos do GitHub Copilot e dos background agents do Cursor.

Dá pra argumentar também que Dreaming é arriscado. O desconforto do Simon Willison sobre não revisar cada linha de código gerado por agente já se aplica a sessões curtas. Um agente que reescreve a própria memória enquanto você dorme, e depois toma decisões baseadas nessa reescrita, é mais difícil de auditar. A Anthropic oferece um modo "revisar mudanças antes de gravar" — mas se dreaming virar padrão, quem revisa de verdade?

São preocupações legítimas. E é por isso que a feature está gated em research preview e não ligada por padrão.

Minha opinião

A leitura honesta: esse foi o keynote mais confiante que a Anthropic fez.

Confiante porque pular um lançamento de modelo no seu evento principal de desenvolvedores exige peito. Confiante porque as features que entregaram — especialmente Dreaming — são apostas num horizonte mais longo que o próximo ciclo de benchmark. Estão dizendo: a gente acha que o próximo salto está em infraestrutura de agente, não num pulinho de 0.5 no MMLU.

Acho que estão certos. Os times que vejo tirando valor real do Claude não são os que atualizaram pro último checkpoint semana passada. São os que descobriram como dar pro agente uma memória estável, um critério de sucesso claro e a capacidade de rodar sozinho durante a madrugada.

A Anthropic acabou de entregar os três.

O veredito do "amigo nerd": se você tá construindo com Claude, peça acesso ao preview do dreaming. Se ainda não tá construindo com Claude, essa é uma semana razoável pra começar.

Sources