OpenAI представляє FrontierScience — новий еталон для оцінки рівня експертного мислення штучного інтелекту (AI) у галузях фізики, хімії та біології, з метою прискорення наукових досліджень.
OpenAI запроваджує FrontierScience — інноваційний еталон, створений для оцінки здатності штучного інтелекту (AI) виконувати наукове мислення рівня експерта у різних сферах, таких як фізика, хімія та біологія. Ця ініціатива має на меті прискорити темпи наукових досліджень, повідомляє OpenAI.
Прискорення наукових досліджень
Розробка FrontierScience стала можливою завдяки значним досягненням у моделях штучного інтелекту, таких як GPT-5, які продемонстрували потенціал прискорення дослідницьких процесів, що зазвичай займають дні або тижні, до кількох годин. Останні експерименти OpenAI, задокументовані у листопаді 2025 року, підкреслюють здатність GPT-5 значно прискорювати дослідницькі зусилля.
Зусилля OpenAI щодо вдосконалення моделей штучного інтелекту для складних наукових завдань підкреслюють ширше прагнення використовувати AI на благо людства. Покращуючи продуктивність моделей у складних математичних і наукових задачах, OpenAI прагне надати дослідникам інструменти для максимальної реалізації потенціалу AI у наукових дослідженнях.
Введення FrontierScience
FrontierScience слугує новим стандартом для оцінки наукових можливостей рівня експерта. Він складається з двох основних компонентів: Олімпіада, яка оцінює наукове мислення, подібне до міжнародних змагань, та Дослідження, яке оцінює реальні дослідницькі навички. Еталон містить сотні питань, створених і перевірених експертами у галузях фізики, хімії та біології, з акцентом на оригінальність, складність і наукову значущість.
У перших оцінюваннях GPT-5.2 показав високі результати у категоріях (77%) Олімпіада та 25% Дослідження, перевершивши інші передові моделі. Ці досягнення підкреслюють зростаючу здатність AI долати виклики рівня експерта, хоча ще є простір для покращення, особливо у відкритих, дослідницьких завданнях.
Створення FrontierScience
FrontierScience складається з понад 700 текстових питань, до яких долучилися медалісти Олімпіад і докторські дослідники. Відділ Олімпіади містить 100 питань, розроблених переможцями міжнародних змагань, а розділ Досліджень — 60 унікальних завдань, що імітують реальні дослідницькі сценарії. Ці завдання мають на меті імітувати складне, багатоступеневе мислення, необхідне у передових наукових дослідженнях.
Щоб забезпечити строгий рівень оцінювання, кожне завдання створюється і перевіряється експертами, а дизайн еталону враховує внесок внутрішніх моделей OpenAI для підтримки високого рівня складності.
Оцінка роботи AI
FrontierScience використовує комбінацію коротких відповідей і оцінювання за рубриками для аналізу відповідей AI. Такий підхід дозволяє детально аналізувати продуктивність моделі, зосереджуючись не лише на кінцевих відповідях, а й на процесі мислення. Моделі AI оцінюються за допомогою автоматизованого системи оцінювання, що забезпечує масштабованість і послідовність у процесі оцінювання.
Майбутні напрямки
Незважаючи на досягнення, FrontierScience визнає свої обмеження у повному відображенні складності реальних наукових досліджень. OpenAI планує продовжувати розвиток еталону, розширюючи його у нові сфери та інтегруючи реальні застосування для кращої оцінки потенціалу AI у наукових відкриттях.
Загалом, успіх AI у наукових дослідженнях буде визначатися його здатністю сприяти новим науковим відкриттям, і FrontierScience стане важливим інструментом для відстеження прогресу AI у цій галузі.
Джерело зображення: Shutterstock
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
OpenAI запускає FrontierScience для оцінки наукового мислення штучного інтелекту
Джессі Е. Елліс
20 грудня 2025 04:04
OpenAI представляє FrontierScience — новий еталон для оцінки рівня експертного мислення штучного інтелекту (AI) у галузях фізики, хімії та біології, з метою прискорення наукових досліджень.
OpenAI запроваджує FrontierScience — інноваційний еталон, створений для оцінки здатності штучного інтелекту (AI) виконувати наукове мислення рівня експерта у різних сферах, таких як фізика, хімія та біологія. Ця ініціатива має на меті прискорити темпи наукових досліджень, повідомляє OpenAI.
Прискорення наукових досліджень
Розробка FrontierScience стала можливою завдяки значним досягненням у моделях штучного інтелекту, таких як GPT-5, які продемонстрували потенціал прискорення дослідницьких процесів, що зазвичай займають дні або тижні, до кількох годин. Останні експерименти OpenAI, задокументовані у листопаді 2025 року, підкреслюють здатність GPT-5 значно прискорювати дослідницькі зусилля.
Зусилля OpenAI щодо вдосконалення моделей штучного інтелекту для складних наукових завдань підкреслюють ширше прагнення використовувати AI на благо людства. Покращуючи продуктивність моделей у складних математичних і наукових задачах, OpenAI прагне надати дослідникам інструменти для максимальної реалізації потенціалу AI у наукових дослідженнях.
Введення FrontierScience
FrontierScience слугує новим стандартом для оцінки наукових можливостей рівня експерта. Він складається з двох основних компонентів: Олімпіада, яка оцінює наукове мислення, подібне до міжнародних змагань, та Дослідження, яке оцінює реальні дослідницькі навички. Еталон містить сотні питань, створених і перевірених експертами у галузях фізики, хімії та біології, з акцентом на оригінальність, складність і наукову значущість.
У перших оцінюваннях GPT-5.2 показав високі результати у категоріях (77%) Олімпіада та 25% Дослідження, перевершивши інші передові моделі. Ці досягнення підкреслюють зростаючу здатність AI долати виклики рівня експерта, хоча ще є простір для покращення, особливо у відкритих, дослідницьких завданнях.
Створення FrontierScience
FrontierScience складається з понад 700 текстових питань, до яких долучилися медалісти Олімпіад і докторські дослідники. Відділ Олімпіади містить 100 питань, розроблених переможцями міжнародних змагань, а розділ Досліджень — 60 унікальних завдань, що імітують реальні дослідницькі сценарії. Ці завдання мають на меті імітувати складне, багатоступеневе мислення, необхідне у передових наукових дослідженнях.
Щоб забезпечити строгий рівень оцінювання, кожне завдання створюється і перевіряється експертами, а дизайн еталону враховує внесок внутрішніх моделей OpenAI для підтримки високого рівня складності.
Оцінка роботи AI
FrontierScience використовує комбінацію коротких відповідей і оцінювання за рубриками для аналізу відповідей AI. Такий підхід дозволяє детально аналізувати продуктивність моделі, зосереджуючись не лише на кінцевих відповідях, а й на процесі мислення. Моделі AI оцінюються за допомогою автоматизованого системи оцінювання, що забезпечує масштабованість і послідовність у процесі оцінювання.
Майбутні напрямки
Незважаючи на досягнення, FrontierScience визнає свої обмеження у повному відображенні складності реальних наукових досліджень. OpenAI планує продовжувати розвиток еталону, розширюючи його у нові сфери та інтегруючи реальні застосування для кращої оцінки потенціалу AI у наукових відкриттях.
Загалом, успіх AI у наукових дослідженнях буде визначатися його здатністю сприяти новим науковим відкриттям, і FrontierScience стане важливим інструментом для відстеження прогресу AI у цій галузі.
Джерело зображення: Shutterstock