Utilização de modelos chineses volta a superar EUA; Socionics: espaço de valor do hardware de IA já foi aberto

robot
Geração de resumo em curso

OpenRouter os dados mais recentes mostram que, de 2 a 8 de março, o total de uso de modelos grandes na plataforma atingiu 4,19 trilhões de tokens, um aumento de 34,9% em relação ao mês anterior, ultrapassando novamente os Estados Unidos. Entre eles, os grandes modelos chineses MiniMax M2.5, DeepSeekV3.2 e Step3.5 Flash estão entre os cinco principais.

A equipe de Huang Zhonghuang do Shenwan Hongyuan publicou um relatório de pesquisa afirmando que,

  1. Na era do Agent, o consumo de tokens pelos modelos aumentou exponencialmente em comparação com chatbots, portanto, os desenvolvedores estão mais sensíveis ao preço por token do modelo;

  2. Os modelos nacionais demonstram uma relação custo-benefício extremamente forte em comparação com os estrangeiros, com custos totais aproximadamente entre 1/6 e 1/10 dos modelos estrangeiros;

  3. A relação custo-benefício dos modelos nacionais advém das melhorias na arquitetura do modelo, como DeepSeek, especialmente MLA e arquiteturas esparsas, que reduzem significativamente os custos de inferência;

  4. A vantagem do custo de energia doméstico também explica parte dessa relação, pois, segundo nossas estimativas, usando energia de data centers chineses, uma única GPU B200 teoricamente pode economizar 900 dólares por ano.

OpenClaw provoca reflexões no mercado sobre a forma dos produtos na era da IA. Acreditamos que a formação de um OS baseado em Agent já está se tornando evidente, e no futuro, o Agent incluirá pelo menos três níveis de colaboração: a base será OpenClaw + modelos fundamentais, o intermediário será a conexão entre ferramentas básicas e skills, e o nível superior será a utilização de skills para chamar ferramentas/API e resolver problemas reais. Os terminais de IA também se tornarão uma ferramenta importante para alcançar os usuários no futuro, e a forma de terminais nativos de IA passará por mudanças significativas.

A personalização profunda de setores verticais está se tornando uma rota-chave para superar a sensação de “brinquedo” nos hardwares de IA. Com o surgimento de terminais nativos de IA, gigantes tecnológicos como OpenAI estão investindo nesses terminais, enquanto fabricantes especializados estão implementando produtos em áreas como industrial, jurídico, financeiro e saúde. Os terminais nativos de IA irão transformar a lógica de interação e os modelos de negócio, simplificando os fluxos de interação, passando de navegação por toque para uma comunicação direta por linguagem natural, olhar ou gestos; e os modelos de negócio evoluirão de uma compra única de hardware para uma assinatura de serviços de hardware + IA.

Para ações recomendadas, sugerimos atenção a:

Aplicações de AIGC: Hikvision, Kingsoft Office, Hengsheng Electronics, China Control Technology

Capacidade de computação de AIGC: Inspur, Hygon, Digital China

Core do mercado de Hong Kong: China Software International, Kingdee International, China Civil Aviation Information Network, Lenovo Group

大量资讯、精准解读,尽在新浪财经APP

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar