Tether Lança o Genesis II do QVAC

22 de dezembro de 2025 – A divisão de pesquisa em IA da Tether Data, QVAC, anunciou hoje o lançamento do QVAC Genesis II, uma expansão importante do maior conjunto de dados sintéticos educacionais disponíveis publicamente para pré-treinamento de inteligência artificial. Com a adição de 107 bilhões de novos tokens, o conjunto de dados combinado QVAC Genesis agora totaliza 148 bilhões de tokens em 19 domínios educacionais, ampliando significativamente a escala, profundidade e qualidade de raciocínio dos dados de treinamento de IA aberta. O QVAC Genesis II baseia-se diretamente na fundação estabelecida pelo QVAC Genesis I, que introduziu um conjunto de dados sintéticos rigorosamente validados, focado em educação, abrangendo disciplinas essenciais de STEM. Esta segunda versão amplia a cobertura para 10 novos domínios, incluindo química, ciência da computação, estatística, aprendizado de máquina, astronomia, geografia, econometria e engenharia elétrica, além de regenerar física de nível universitário usando uma metodologia aprimorada. Juntos, Genesis I e II formam o conjunto de dados educacionais sintéticos mais abrangente já lançado ao público. No núcleo desta versão está uma nova abordagem de geração de dados chamada Raciocínio em Nível de Opção, projetada para extrair raciocínio estruturado não apenas de falhas do modelo, mas também de respostas corretas. Em vez de tratar respostas corretas como saídas finalizadas, esse método analisa sistematicamente cada opção de resposta em uma questão de múltipla escolha, reforçando o raciocínio correto enquanto aborda explicitamente equívocos comuns. O resultado é um dado de treinamento que enfatiza clareza, causalidade e tomada de decisão, não apenas correção superficial. Essa nova abordagem complementa o método original de Análise de Falhas introduzido no Genesis I, formando um pipeline de dupla metodologia que garante que cada questão gerada contribua com valor educacional. Avaliações independentes mostram que modelos treinados com os dados do Genesis II demonstram uma precisão de raciocínio substancialmente maior e produzem respostas claras e inequívocas com muito mais consistência do que modelos treinados com conjuntos de dados sintéticos anteriores. Mais do que um aumento de escala, esta versão reflete uma mudança deliberada na forma como os dados de IA educacional devem ser construídos. Enquanto grande parte da indústria foca na raspagem e agregação de volumes cada vez maiores de texto, a abordagem da QVAC é projetada para ensinar os modelos a pensar, raciocinar e explicar, fundamentando a inteligência na compreensão ao invés da imitação. “A maior parte do treinamento de IA hoje otimiza a fluência, não a compreensão,” disse Paolo Ardoino, CEO da Tether. “Com este lançamento, estamos indo além do volume, rumo à estrutura, raciocínio e clareza. A inteligência deve ser construída com base na compreensão do porquê de algo ser verdadeiro, não apenas na previsão do que parece correto. Ao tornar este conjunto de dados aberto, estamos dando aos pesquisadores e construtores as ferramentas para desenvolver IA mais confiável, mais explicável e, em última análise, mais útil para a sociedade.” Assim como o Genesis I, o conjunto de dados expandido é lançado de forma aberta para apoiar pesquisadores, instituições acadêmicas e desenvolvedores independentes que trabalham fora de sistemas fechados e proprietários. Está disponível sob uma licença Creative Commons Atribuição–NãoComercial (CC-BY-NC 4.0), reforçando o compromisso da QVAC com a pesquisa em IA aberta e orientada pela comunidade. O lançamento continua a missão mais ampla da QVAC de promover uma inteligência local e descentralizada, onde modelos de IA podem ser treinados, aprimorados e implantados sem dependência de plataformas de nuvem centralizadas. Ao fortalecer as bases abertas dos dados de treinamento de IA, a Tether Data busca reduzir barreiras estruturais à inovação e garantir que inteligência de alta qualidade permaneça acessível à comunidade global de pesquisa. A análise técnica completa do conjunto de dados, intitulada “QVAC Genesis II: Expanding the Largest and Highest-Quality Multi-domain Educational Synthetic Dataset for Pre-training”, já está disponível no blog de pesquisa da QVAC, juntamente com o acesso ao conjunto de dados e aos modelos no Hugging Face. Mais informações, incluindo uma seção de FAQ detalhada, estão disponíveis no site da QVAC.

Este artigo foi originalmente publicado como Tether Releases QVAC Genesis II no Crypto Breaking News – sua fonte confiável para notícias de criptomoedas, notícias de Bitcoin e atualizações de blockchain.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt