22 de diciembre de 2025 – La división de investigación en IA de Tether Data, QVAC, anunció hoy el lanzamiento de QVAC Genesis II, una expansión importante del conjunto de datos sintéticos educativos de acceso público más grande del mundo para el preentrenamiento de inteligencia artificial. Con la adición de 107 mil millones de nuevos tokens, el conjunto de datos combinado QVAC Genesis ahora suma 148 mil millones de tokens en 19 dominios educativos, ampliando significativamente la escala, profundidad y calidad del razonamiento de los datos de entrenamiento de IA abierta. QVAC Genesis II se basa directamente en la base establecida por QVAC Genesis I, que introdujo un conjunto de datos sintéticos validados rigurosamente y enfocados en la educación, abarcando disciplinas STEM fundamentales. Esta segunda versión amplía la cobertura a 10 nuevos dominios, incluyendo química, ciencias de la computación, estadística, aprendizaje automático, astronomía, geografía, econometría y ingeniería eléctrica, además de regenerar física a nivel universitario utilizando una metodología mejorada. Juntos, Genesis I y II constituyen el conjunto de datos educativos sintéticos más completo jamás lanzado al público. En el núcleo de este lanzamiento se encuentra un nuevo enfoque de generación de datos llamado Razonamiento a Nivel de Opción, diseñado para extraer razonamiento estructurado no solo de fallos del modelo, sino también de respuestas correctas. En lugar de tratar las respuestas correctas como resultados terminados, este método analiza sistemáticamente cada opción en una pregunta de opción múltiple, reforzando el razonamiento correcto y abordando explícitamente conceptos erróneos comunes. El resultado es un conjunto de datos de entrenamiento que enfatiza la claridad, la causalidad y la toma de decisiones, no solo la corrección superficial. Este nuevo enfoque complementa el método original de Análisis de Fallos introducido en Genesis I, formando una doble vía de métodos que garantiza que cada pregunta generada aporte valor educativo. Evaluaciones independientes muestran que los modelos entrenados con datos de Genesis II demuestran una precisión de razonamiento sustancialmente mayor y producen respuestas claras y sin ambigüedades con mucha más consistencia que los modelos entrenados con conjuntos de datos sintéticos anteriores. Más que un aumento de escala, esta versión refleja un cambio deliberado en la forma en que se debe construir el datos de IA educativa. Mientras gran parte de la industria se enfoca en raspar y agregar volúmenes cada vez mayores de texto, el enfoque de QVAC está diseñado para enseñar a los modelos cómo pensar, razonar y explicar, fundamentando la inteligencia en la comprensión en lugar de la imitación. “La mayoría de la capacitación en IA hoy en día optimiza la fluidez, no la comprensión,” dijo Paolo Ardoino, CEO de Tether. “Con este lanzamiento, estamos yendo más allá del volumen hacia la estructura, el razonamiento y la claridad. La inteligencia debe basarse en entender por qué algo es cierto, no solo en predecir qué suena correcto. Al hacer este conjunto de datos abierto, estamos dando a investigadores y desarrolladores las herramientas para desarrollar IA que sea más confiable, más explicable y, en última instancia, más útil para la sociedad.” Como con Genesis I, el conjunto de datos ampliado se lanza de forma abierta para apoyar a investigadores, instituciones académicas y desarrolladores independientes que trabajan fuera de sistemas cerrados y propietarios. Está disponible bajo una licencia Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0), reforzando el compromiso de QVAC con la investigación en IA abierta y comunitaria. El lanzamiento continúa la misión más amplia de QVAC de avanzar en la inteligencia local y descentralizada, donde los modelos de IA pueden ser entrenados, perfeccionados y desplegados sin depender de plataformas en la nube centralizadas. Al fortalecer las bases abiertas de los datos de entrenamiento de IA, Tether Data busca reducir las barreras estructurales a la innovación y garantizar que la inteligencia de alta calidad siga siendo accesible para la comunidad global de investigación. La descripción técnica completa del conjunto de datos, titulada “QVAC Genesis II: Expandiendo el Conjunto de Datos Sintéticos Educativos Multidominio más Grande y de Mayor Calidad para Preentrenamiento”, ya está disponible en el blog de investigación de QVAC, junto con el acceso al conjunto de datos y modelos en Hugging Face. Para más información, incluyendo una sección de preguntas frecuentes detallada, visita la página web de QVAC.
Este artículo fue publicado originalmente como Tether Releases QVAC Genesis II en Crypto Breaking News – tu fuente confiable para noticias de criptomonedas, noticias de Bitcoin y actualizaciones de blockchain.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Tether lanza QVAC Genesis II
22 de diciembre de 2025 – La división de investigación en IA de Tether Data, QVAC, anunció hoy el lanzamiento de QVAC Genesis II, una expansión importante del conjunto de datos sintéticos educativos de acceso público más grande del mundo para el preentrenamiento de inteligencia artificial. Con la adición de 107 mil millones de nuevos tokens, el conjunto de datos combinado QVAC Genesis ahora suma 148 mil millones de tokens en 19 dominios educativos, ampliando significativamente la escala, profundidad y calidad del razonamiento de los datos de entrenamiento de IA abierta. QVAC Genesis II se basa directamente en la base establecida por QVAC Genesis I, que introdujo un conjunto de datos sintéticos validados rigurosamente y enfocados en la educación, abarcando disciplinas STEM fundamentales. Esta segunda versión amplía la cobertura a 10 nuevos dominios, incluyendo química, ciencias de la computación, estadística, aprendizaje automático, astronomía, geografía, econometría y ingeniería eléctrica, además de regenerar física a nivel universitario utilizando una metodología mejorada. Juntos, Genesis I y II constituyen el conjunto de datos educativos sintéticos más completo jamás lanzado al público. En el núcleo de este lanzamiento se encuentra un nuevo enfoque de generación de datos llamado Razonamiento a Nivel de Opción, diseñado para extraer razonamiento estructurado no solo de fallos del modelo, sino también de respuestas correctas. En lugar de tratar las respuestas correctas como resultados terminados, este método analiza sistemáticamente cada opción en una pregunta de opción múltiple, reforzando el razonamiento correcto y abordando explícitamente conceptos erróneos comunes. El resultado es un conjunto de datos de entrenamiento que enfatiza la claridad, la causalidad y la toma de decisiones, no solo la corrección superficial. Este nuevo enfoque complementa el método original de Análisis de Fallos introducido en Genesis I, formando una doble vía de métodos que garantiza que cada pregunta generada aporte valor educativo. Evaluaciones independientes muestran que los modelos entrenados con datos de Genesis II demuestran una precisión de razonamiento sustancialmente mayor y producen respuestas claras y sin ambigüedades con mucha más consistencia que los modelos entrenados con conjuntos de datos sintéticos anteriores. Más que un aumento de escala, esta versión refleja un cambio deliberado en la forma en que se debe construir el datos de IA educativa. Mientras gran parte de la industria se enfoca en raspar y agregar volúmenes cada vez mayores de texto, el enfoque de QVAC está diseñado para enseñar a los modelos cómo pensar, razonar y explicar, fundamentando la inteligencia en la comprensión en lugar de la imitación. “La mayoría de la capacitación en IA hoy en día optimiza la fluidez, no la comprensión,” dijo Paolo Ardoino, CEO de Tether. “Con este lanzamiento, estamos yendo más allá del volumen hacia la estructura, el razonamiento y la claridad. La inteligencia debe basarse en entender por qué algo es cierto, no solo en predecir qué suena correcto. Al hacer este conjunto de datos abierto, estamos dando a investigadores y desarrolladores las herramientas para desarrollar IA que sea más confiable, más explicable y, en última instancia, más útil para la sociedad.” Como con Genesis I, el conjunto de datos ampliado se lanza de forma abierta para apoyar a investigadores, instituciones académicas y desarrolladores independientes que trabajan fuera de sistemas cerrados y propietarios. Está disponible bajo una licencia Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0), reforzando el compromiso de QVAC con la investigación en IA abierta y comunitaria. El lanzamiento continúa la misión más amplia de QVAC de avanzar en la inteligencia local y descentralizada, donde los modelos de IA pueden ser entrenados, perfeccionados y desplegados sin depender de plataformas en la nube centralizadas. Al fortalecer las bases abiertas de los datos de entrenamiento de IA, Tether Data busca reducir las barreras estructurales a la innovación y garantizar que la inteligencia de alta calidad siga siendo accesible para la comunidad global de investigación. La descripción técnica completa del conjunto de datos, titulada “QVAC Genesis II: Expandiendo el Conjunto de Datos Sintéticos Educativos Multidominio más Grande y de Mayor Calidad para Preentrenamiento”, ya está disponible en el blog de investigación de QVAC, junto con el acceso al conjunto de datos y modelos en Hugging Face. Para más información, incluyendo una sección de preguntas frecuentes detallada, visita la página web de QVAC.
Este artículo fue publicado originalmente como Tether Releases QVAC Genesis II en Crypto Breaking News – tu fuente confiable para noticias de criptomonedas, noticias de Bitcoin y actualizaciones de blockchain.