22 décembre 2025 – La division de recherche en IA de Tether Data, QVAC, a annoncé aujourd’hui la sortie de QVAC Genesis II, une expansion majeure du plus grand ensemble de données éducatives synthétiques disponibles publiquement pour le pré-entraînement en intelligence artificielle. Avec l’ajout de 107 milliards de nouveaux tokens, l’ensemble de données QVAC Genesis combiné atteint désormais 148 milliards de tokens répartis sur 19 domaines éducatifs, étendant de manière significative l’échelle, la profondeur et la qualité du raisonnement des données d’entraînement en IA ouverte. QVAC Genesis II s’appuie directement sur la base posée par QVAC Genesis I, qui a introduit un ensemble de données synthétiques validé rigoureusement, axé sur l’éducation, couvrant les disciplines STEM fondamentales. Cette deuxième version étend la couverture à 10 nouveaux domaines, notamment la chimie, l’informatique, la statistique, l’apprentissage automatique, l’astronomie, la géographie, l’économétrie et l’ingénierie électrique, tout en régénérant la physique de niveau universitaire en utilisant une méthodologie améliorée. Ensemble, Genesis I et II forment l’ensemble de données éducatives synthétiques le plus complet jamais publié au public. Au cœur de cette sortie se trouve une nouvelle approche de génération de données appelée Raisonnement au Niveau d’Option, conçue pour extraire un raisonnement structuré non seulement des échecs du modèle, mais aussi des réponses correctes. Plutôt que de considérer les réponses correctes comme des résultats finis, cette méthode analyse systématiquement chaque option de réponse dans une question à choix multiple, renforçant le raisonnement correct tout en traitant explicitement les idées fausses courantes. Le résultat est un ensemble de données d’entraînement qui met l’accent sur la clarté, la causalité et la prise de décision, et pas seulement sur la correction superficielle. Cette nouvelle approche complète la méthode d’analyse des échecs introduite dans Genesis I, formant une pipeline à double méthode qui garantit que chaque question générée apporte une valeur éducative. Des évaluations indépendantes montrent que les modèles entraînés sur les données de Genesis II démontrent une précision de raisonnement nettement supérieure et produisent des réponses claires et sans ambiguïté beaucoup plus régulièrement que les modèles entraînés sur les ensembles de données synthétiques précédents. Plus qu’une simple augmentation de l’échelle, cette sortie reflète un changement délibéré dans la façon dont les données éducatives pour l’IA doivent être construites. Alors qu’une grande partie de l’industrie se concentre sur le scraping et l’agrégation de volumes de texte toujours plus importants, l’approche de QVAC vise à apprendre aux modèles comment penser, raisonner et expliquer, en ancrant l’intelligence dans la compréhension plutôt que dans l’imitation. « La plupart des entraînements en IA aujourd’hui optimisent la fluidité, pas la compréhension », a déclaré Paolo Ardoino, PDG de Tether. « Avec cette sortie, nous allons au-delà du volume vers la structure, le raisonnement et la clarté. L’intelligence devrait être construite sur la compréhension de pourquoi quelque chose est vrai, et pas seulement sur la prédiction de ce qui semble correct. En rendant cet ensemble de données ouvert, nous donnons aux chercheurs et aux développeurs les outils pour développer une IA plus fiable, plus explicable et, en fin de compte, plus utile pour la société. » Comme pour Genesis I, l’ensemble de données élargi est publié en accès libre pour soutenir les chercheurs, les institutions académiques et les développeurs indépendants travaillant en dehors des systèmes fermés et propriétaires. Il est mis à disposition sous une licence Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0), renforçant l’engagement de QVAC envers la recherche en IA ouverte et communautaire. La sortie poursuit la mission plus large de QVAC visant à faire progresser l’intelligence locale et décentralisée, où les modèles d’IA peuvent être entraînés, affinés et déployés sans dépendance aux plateformes cloud centralisées. En renforçant les fondations ouvertes des données d’entraînement en IA, Tether Data vise à réduire les barrières structurelles à l’innovation et à garantir que l’intelligence de haute qualité reste accessible à la communauté mondiale de la recherche. La présentation complète de la structure technique de l’ensemble de données, intitulée « QVAC Genesis II : Expansion du plus grand et du plus haut de gamme ensemble de données synthétiques éducatives multi-domaines pour le pré-entraînement », est disponible dès maintenant via le blog de recherche QVAC, ainsi que l’accès à l’ensemble de données et aux modèles sur Hugging Face. Pour plus d’informations, y compris une section FAQ détaillée, consultez le site Web de QVAC.
Cet article a été publié à l’origine sous le titre Tether Releases QVAC Genesis II sur Crypto Breaking News – votre source de confiance pour les actualités crypto, les actualités Bitcoin et les mises à jour blockchain.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Tether publie QVAC Genesis II
22 décembre 2025 – La division de recherche en IA de Tether Data, QVAC, a annoncé aujourd’hui la sortie de QVAC Genesis II, une expansion majeure du plus grand ensemble de données éducatives synthétiques disponibles publiquement pour le pré-entraînement en intelligence artificielle. Avec l’ajout de 107 milliards de nouveaux tokens, l’ensemble de données QVAC Genesis combiné atteint désormais 148 milliards de tokens répartis sur 19 domaines éducatifs, étendant de manière significative l’échelle, la profondeur et la qualité du raisonnement des données d’entraînement en IA ouverte. QVAC Genesis II s’appuie directement sur la base posée par QVAC Genesis I, qui a introduit un ensemble de données synthétiques validé rigoureusement, axé sur l’éducation, couvrant les disciplines STEM fondamentales. Cette deuxième version étend la couverture à 10 nouveaux domaines, notamment la chimie, l’informatique, la statistique, l’apprentissage automatique, l’astronomie, la géographie, l’économétrie et l’ingénierie électrique, tout en régénérant la physique de niveau universitaire en utilisant une méthodologie améliorée. Ensemble, Genesis I et II forment l’ensemble de données éducatives synthétiques le plus complet jamais publié au public. Au cœur de cette sortie se trouve une nouvelle approche de génération de données appelée Raisonnement au Niveau d’Option, conçue pour extraire un raisonnement structuré non seulement des échecs du modèle, mais aussi des réponses correctes. Plutôt que de considérer les réponses correctes comme des résultats finis, cette méthode analyse systématiquement chaque option de réponse dans une question à choix multiple, renforçant le raisonnement correct tout en traitant explicitement les idées fausses courantes. Le résultat est un ensemble de données d’entraînement qui met l’accent sur la clarté, la causalité et la prise de décision, et pas seulement sur la correction superficielle. Cette nouvelle approche complète la méthode d’analyse des échecs introduite dans Genesis I, formant une pipeline à double méthode qui garantit que chaque question générée apporte une valeur éducative. Des évaluations indépendantes montrent que les modèles entraînés sur les données de Genesis II démontrent une précision de raisonnement nettement supérieure et produisent des réponses claires et sans ambiguïté beaucoup plus régulièrement que les modèles entraînés sur les ensembles de données synthétiques précédents. Plus qu’une simple augmentation de l’échelle, cette sortie reflète un changement délibéré dans la façon dont les données éducatives pour l’IA doivent être construites. Alors qu’une grande partie de l’industrie se concentre sur le scraping et l’agrégation de volumes de texte toujours plus importants, l’approche de QVAC vise à apprendre aux modèles comment penser, raisonner et expliquer, en ancrant l’intelligence dans la compréhension plutôt que dans l’imitation. « La plupart des entraînements en IA aujourd’hui optimisent la fluidité, pas la compréhension », a déclaré Paolo Ardoino, PDG de Tether. « Avec cette sortie, nous allons au-delà du volume vers la structure, le raisonnement et la clarté. L’intelligence devrait être construite sur la compréhension de pourquoi quelque chose est vrai, et pas seulement sur la prédiction de ce qui semble correct. En rendant cet ensemble de données ouvert, nous donnons aux chercheurs et aux développeurs les outils pour développer une IA plus fiable, plus explicable et, en fin de compte, plus utile pour la société. » Comme pour Genesis I, l’ensemble de données élargi est publié en accès libre pour soutenir les chercheurs, les institutions académiques et les développeurs indépendants travaillant en dehors des systèmes fermés et propriétaires. Il est mis à disposition sous une licence Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0), renforçant l’engagement de QVAC envers la recherche en IA ouverte et communautaire. La sortie poursuit la mission plus large de QVAC visant à faire progresser l’intelligence locale et décentralisée, où les modèles d’IA peuvent être entraînés, affinés et déployés sans dépendance aux plateformes cloud centralisées. En renforçant les fondations ouvertes des données d’entraînement en IA, Tether Data vise à réduire les barrières structurelles à l’innovation et à garantir que l’intelligence de haute qualité reste accessible à la communauté mondiale de la recherche. La présentation complète de la structure technique de l’ensemble de données, intitulée « QVAC Genesis II : Expansion du plus grand et du plus haut de gamme ensemble de données synthétiques éducatives multi-domaines pour le pré-entraînement », est disponible dès maintenant via le blog de recherche QVAC, ainsi que l’accès à l’ensemble de données et aux modèles sur Hugging Face. Pour plus d’informations, y compris une section FAQ détaillée, consultez le site Web de QVAC.
Cet article a été publié à l’origine sous le titre Tether Releases QVAC Genesis II sur Crypto Breaking News – votre source de confiance pour les actualités crypto, les actualités Bitcoin et les mises à jour blockchain.