El departamento de investigación de IA de Tether Data, QVAC, ha anunciado recientemente una importante actualización: el lanzamiento oficial del conjunto de datos Genesis II. En comparación con la versión anterior, Genesis I, la nueva versión ha añadido 107 mil millones de tokens (etiquetas de datos), lo que eleva directamente el tamaño total del conjunto de datos sintético utilizado para educación pública a 148 mil millones de tokens.
¿Qué significa esta expansión? La cobertura se ha ampliado. El nuevo conjunto de datos abarca contenidos de 19 diferentes campos, lo que es un gran impulso para entrenar modelos de IA más generales y precisos. Desde el punto de vista de la cantidad de datos, el salto de Genesis I a Genesis II no solo es un crecimiento numérico, sino que también refleja la inversión continua de Tether Data en el campo de la investigación de IA.
En la actual era de profunda fusión entre la IA y Web3, este tipo de conjuntos de datos públicos de alta calidad tiene un efecto de impulso en todo el ecosistema. Una mayor escala de datos y una cobertura de categorías más rica significan que los desarrolladores e investigadores pueden realizar el entrenamiento y la validación de modelos basados en información más completa. En cierto sentido, esto es un paso más de Tether Data hacia la apertura de recursos en la industria y la promoción de la democratización de la IA.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
El departamento de investigación de IA de Tether Data, QVAC, ha anunciado recientemente una importante actualización: el lanzamiento oficial del conjunto de datos Genesis II. En comparación con la versión anterior, Genesis I, la nueva versión ha añadido 107 mil millones de tokens (etiquetas de datos), lo que eleva directamente el tamaño total del conjunto de datos sintético utilizado para educación pública a 148 mil millones de tokens.
¿Qué significa esta expansión? La cobertura se ha ampliado. El nuevo conjunto de datos abarca contenidos de 19 diferentes campos, lo que es un gran impulso para entrenar modelos de IA más generales y precisos. Desde el punto de vista de la cantidad de datos, el salto de Genesis I a Genesis II no solo es un crecimiento numérico, sino que también refleja la inversión continua de Tether Data en el campo de la investigación de IA.
En la actual era de profunda fusión entre la IA y Web3, este tipo de conjuntos de datos públicos de alta calidad tiene un efecto de impulso en todo el ecosistema. Una mayor escala de datos y una cobertura de categorías más rica significan que los desarrolladores e investigadores pueden realizar el entrenamiento y la validación de modelos basados en información más completa. En cierto sentido, esto es un paso más de Tether Data hacia la apertura de recursos en la industria y la promoción de la democratización de la IA.