Tether випускає QVAC Genesis II

22 грудня 2025 – Відділ досліджень штучного інтелекту Tether Data, QVAC, сьогодні оголосив про випуск QVAC Genesis II, значного розширення найбільшого у світі публічно доступного синтетичного навчального набору даних для попереднього навчання штучного інтелекту. З додаванням 107 мільярдів нових токенів, сумарний набір даних QVAC Genesis тепер становить 148 мільярдів токенів у 19 навчальних галузях, значно розширюючи масштаб, глибину та якість логічного мислення даних для відкритого AI. QVAC Genesis II безпосередньо базується на основі, закладеній QVAC Genesis I, яка представила ретельно валідований синтетичний набір даних, орієнтований на освіту, що охоплює основні STEM-дисципліни. Цей другий реліз розширює охоплення до 10 нових галузей, включаючи хімію, інформатику, статистику, машинне навчання, астрономію, географію, економетрику та електротехніку, а також оновлює фізику коледжного рівня за допомогою покращеної методології. Разом Genesis I та II утворюють найвибагливіший синтетичний навчальний набір даних, коли-небудь випущений для публіки. В основі цього релізу лежить новий підхід до генерації даних, званий Reasoning на рівні опцій, розроблений для вилучення структурованого логічного мислення не лише з невдач моделей, а й з правильних відповідей. Замість того, щоб вважати правильні відповіді завершеними результатами, цей метод систематично аналізує кожну опцію відповіді у багатовибірковому питанні, підсилюючи правильне логічне мислення та явно враховуючи поширені помилки. Результатом є навчальні дані, що наголошують на ясності, причинності та прийнятті рішень, а не лише на поверхневій правильності. Цей новий підхід доповнює оригінальний метод аналізу невдач, впроваджений у Genesis I, формуючи двовекторний конвеєр, що гарантує, що кожне згенероване питання має освітню цінність. Незалежні оцінки показують, що моделі, навчені на даних Genesis II, демонструють значно вищу точність логічного мислення та більш послідовно дають чіткі, однозначні відповіді, ніж моделі, навчені на попередніх синтетичних наборах даних. Більше ніж просто масштабне розширення, цей реліз відображає свідомий перехід у підході до створення освітніх даних для AI. У той час як більшість галузі зосереджена на зборі та агрегації дедалі більшого обсягу тексту, підхід QVAC спрямований на навчання моделей мислити, логічно обґрунтовувати та пояснювати, закладаючи інтелект у розуміння, а не імітацію. «Більшість сучасних тренувань AI орієнтовані на плавність викладу, а не на розуміння», — сказав Паоло Ардойно, генеральний директор Tether. «З цим релізом ми рухаємося за межі обсягу до структури, логіки та ясності. Інтелект має базуватися на розумінні, чому щось є істинним, а не лише на передбаченні, що звучить правильно. Роблячи цей набір даних відкритим, ми даємо дослідникам і розробникам інструменти для створення більш надійного, більш пояснюваного та, зрештою, більш корисного для суспільства штучного інтелекту». Як і з Genesis I, розширений набір даних випущено відкрито для підтримки дослідників, академічних установ та незалежних розробників, що працюють поза межами закритих, пропрієтарних систем. Він доступний за ліцензією Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0), що підкреслює прихильність QVAC до відкритих, спільнотних досліджень у сфері AI. Реліз продовжує широку місію QVAC щодо просування локального, децентралізованого інтелекту, де моделі AI можна тренувати, вдосконалювати та розгортати без залежності від централізованих хмарних платформ. Посилюючи відкриті основи даних для тренування AI, Tether Data прагне зменшити структурні бар’єри для інновацій та забезпечити доступність високоякісного інтелекту для глобальної дослідницької спільноти. Повний технічний розбір набору даних під назвою “QVAC Genesis II: Expanding the Largest and Highest-Quality Multi-domain Educational Synthetic Dataset for Pre-training” доступний вже зараз на блозі досліджень QVAC, а також через доступ до набору даних і моделей на Hugging Face. Детальніша інформація, включаючи розділ FAQ, доступна на сайті QVAC.

Ця стаття була спочатку опублікована як Tether Releases QVAC Genesis II на Crypto Breaking News – вашому надійному джерелі новин у сфері криптовалют, Bitcoin та блокчейну.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити