Anthropic novo modelo "Claude Mythos" exposto como o mais forte da história, capacidade de ataque cibernético preocupa até os próprios.

動區BlockTempo

Uma falha humana interna fez com que o novo modelo flagship da Anthropic, codificado como “Claude Mythos”, fosse exposto. A empresa descreve-o como um “salto significativo na eficiência da IA”, ao mesmo tempo que alerta que suas capacidades de segurança cibernética superam de longe qualquer modelo de IA existente.
(Resumo: Juiz apoia a Anthropic, proíbe o Departamento de Defesa dos EUA de penalizar Claude com “rótulo de risco na cadeia de suprimentos”)
(Informação adicional: Relatório de mil palavras do Índice Económico da Anthropic AI: a frequência dos fluxos de trabalho de negociação automatizados duplicou, Claude está a transitar de ferramenta para assistente de vida)

Índice do artigo

Toggle

  • Camada Capybara: um novo nível acima do Opus
  • Os defensores já têm, os hackers já estão a usar
  • Cimeira de CEOs, propriedade rural, funcionalidades ainda não lançadas

Não foi uma divulgação intencional, mas sim uma falha humana? De acordo com uma reportagem exclusiva da Fortune, a Anthropic, devido a um erro na gestão de conteúdo (CMS), expôs quase 3.000 artigos internos não publicados em dados pesquisáveis ​​publicamente.

A Fortune obteve e revisou alguns dos rascunhos de artigos de blog, descobrindo que a Anthropic está a desenvolver um novo modelo flagship codificado como “Claude Mythos” (ou Capybara), e já o abriu silenciosamente para testes com clientes de acesso antecipado.

Este rascunho afirma diretamente:

Este é “sem dúvida o modelo de IA mais poderoso que desenvolvemos até agora”

Camada Capybara: um novo nível acima do Opus

Do ponto de vista da arquitetura, Claude Mythos não é uma versão atualizada do Opus, mas sim uma nova camada “Capybara” adicionada acima do nível existente: substituindo o Opus como o modelo de mais alto nível da Anthropic. O arquivo de rascunho indica que, em comparação com Claude Opus 4.6, o novo modelo apresentou melhorias significativas em testes de programação de software, raciocínio acadêmico, segurança cibernética, entre outros.

Claude atualmente é dividido em três níveis: Haiku (extremamente barato), Sonnet (equilíbrio total) e Opus (flagship de reflexão profunda)

O custo é o custo computacional. A Anthropic admite que este modelo “tem custos de execução elevados” e ainda não está pronta para ser aberta ao público em geral. A estratégia atual é um lançamento em fases: primeiro permitir que parceiros de acesso antecipado o testem, recolher feedback e depois decidir se expandem o alcance da implementação.

A origem da fuga foi a configuração de permissões padrão dos ativos do CMS como pública, obrigando os funcionários a marcar manualmente como privados; uma omissão levaria à pesquisa direta. Nesta ocorrência, as informações expostas não incluíram apenas detalhes do modelo: também incluíram arquivos de licença parental dos funcionários, imagens não publicadas, PDFs e áudios. A Fortune notificou a Anthropic, que fechou o acesso imediatamente. A Anthropic reconheceu que foi um “erro humano”, e os pesquisadores Roy Paz da LayerX Security e Alexandre Pauwels da Universidade de Cambridge também ajudaram a revisar e validar a veracidade dos arquivos relacionados.

Os defensores já têm, os hackers já estão a usar

É importante notar que o rascunho alerta que estes modelos “antecipam uma onda prestes a chegar, em que a capacidade de explorar vulnerabilidades superará em muito a velocidade de resposta dos defensores”. Por isso, a estratégia inicial de lançamento do Mythos foca nos defensores cibernéticos, permitindo-lhes fortalecer as bibliotecas de código antes, tentando manter uma certa janela de amortecimento entre ataque e defesa.

As preocupações oficiais não são infundadas. A Anthropic registrou um caso verificável; uma organização apoiada pelo Estado chinês já utilizou Claude Code para invadir cerca de 30 instituições, abrangendo empresas de tecnologia, instituições financeiras e agências governamentais. A Anthropic levou 10 dias a investigar, eventualmente banindo contas relacionadas e notificando as vítimas. Este incidente ocorreu antes da divulgação oficial do Mythos, utilizando ferramentas Claude existentes, e não o modelo de próxima geração.

O panorama competitivo também está a mudar. O GPT-5.3-Codex, lançado simultaneamente pela OpenAI, também foi classificado pela indústria como um modelo de “alta capacidade” em segurança cibernética, significando que a fronteira das capacidades da IA de ponta foi coletivamente ultrapassada, não sendo mais um problema de um único fornecedor.

Cimeira de CEOs, propriedade rural, funcionalidades ainda não lançadas

Este conjunto de arquivos vazados também inclui pistas sobre o arranjo comercial: a Anthropic planeia realizar uma cimeira fechada de dois dias numa propriedade rural do século XVIII na Inglaterra, convidando “os líderes empresariais mais influentes da Europa”, com o CEO Dario Amodei a comparecer pessoalmente, e os participantes experimentarão funcionalidades de Claude que ainda não foram lançadas ao público.

Os detalhes desta cimeira vazaram inesperadamente, refletindo que a Anthropic está a acelerar a penetração no panorama empresarial europeu, e o Mythos muito provavelmente será a peça central dessa apresentação fechada.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário