OpenAI запускає FrontierScience для оцінки наукового мислення штучного інтелекту

2025-12-20 15:32:45

Джессі Е. Елліс

20 грудня 2025 04:04

OpenAI представляє FrontierScience — новий еталон для оцінки рівня експертного мислення штучного інтелекту (AI) у галузях фізики, хімії та біології, з метою прискорення наукових досліджень.

OpenAI запроваджує FrontierScience — інноваційний еталон, створений для оцінки здатності штучного інтелекту (AI) виконувати наукове мислення рівня експерта у різних сферах, таких як фізика, хімія та біологія. Ця ініціатива має на меті прискорити темпи наукових досліджень, повідомляє OpenAI.

Прискорення наукових досліджень

Розробка FrontierScience стала можливою завдяки значним досягненням у моделях штучного інтелекту, таких як GPT-5, які продемонстрували потенціал прискорення дослідницьких процесів, що зазвичай займають дні або тижні, до кількох годин. Останні експерименти OpenAI, задокументовані у листопаді 2025 року, підкреслюють здатність GPT-5 значно прискорювати дослідницькі зусилля.

Зусилля OpenAI щодо вдосконалення моделей штучного інтелекту для складних наукових завдань підкреслюють ширше прагнення використовувати AI на благо людства. Покращуючи продуктивність моделей у складних математичних і наукових задачах, OpenAI прагне надати дослідникам інструменти для максимальної реалізації потенціалу AI у наукових дослідженнях.

Введення FrontierScience

FrontierScience слугує новим стандартом для оцінки наукових можливостей рівня експерта. Він складається з двох основних компонентів: Олімпіада, яка оцінює наукове мислення, подібне до міжнародних змагань, та Дослідження, яке оцінює реальні дослідницькі навички. Еталон містить сотні питань, створених і перевірених експертами у галузях фізики, хімії та біології, з акцентом на оригінальність, складність і наукову значущість.

У перших оцінюваннях GPT-5.2 показав високі результати у категоріях (77%) Олімпіада та 25% Дослідження, перевершивши інші передові моделі. Ці досягнення підкреслюють зростаючу здатність AI долати виклики рівня експерта, хоча ще є простір для покращення, особливо у відкритих, дослідницьких завданнях.

Створення FrontierScience

FrontierScience складається з понад 700 текстових питань, до яких долучилися медалісти Олімпіад і докторські дослідники. Відділ Олімпіади містить 100 питань, розроблених переможцями міжнародних змагань, а розділ Досліджень — 60 унікальних завдань, що імітують реальні дослідницькі сценарії. Ці завдання мають на меті імітувати складне, багатоступеневе мислення, необхідне у передових наукових дослідженнях.

Щоб забезпечити строгий рівень оцінювання, кожне завдання створюється і перевіряється експертами, а дизайн еталону враховує внесок внутрішніх моделей OpenAI для підтримки високого рівня складності.

Оцінка роботи AI

FrontierScience використовує комбінацію коротких відповідей і оцінювання за рубриками для аналізу відповідей AI. Такий підхід дозволяє детально аналізувати продуктивність моделі, зосереджуючись не лише на кінцевих відповідях, а й на процесі мислення. Моделі AI оцінюються за допомогою автоматизованого системи оцінювання, що забезпечує масштабованість і послідовність у процесі оцінювання.

Майбутні напрямки

Незважаючи на досягнення, FrontierScience визнає свої обмеження у повному відображенні складності реальних наукових досліджень. OpenAI планує продовжувати розвиток еталону, розширюючи його у нові сфери та інтегруючи реальні застосування для кращої оцінки потенціалу AI у наукових відкриттях.

Загалом, успіх AI у наукових дослідженнях буде визначатися його здатністю сприяти новим науковим відкриттям, і FrontierScience стане важливим інструментом для відстеження прогресу AI у цій галузі.

Джерело зображення: Shutterstock

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

0/400

Немає коментарів

Популярні темиДізнатися більше
#Gate2025AnnualReportComing
81.22K Популярність
#JoinGrowthPointsDrawToWinGoldenBar
34.03K Популярність
#ETHTrendWatch
151.68K Популярність
#FedRateCutPrediction
78.29K Популярність
#ShowMyAlphaPoints
177.31K Популярність

Популярні активності Gate FunДізнатися більше

1
tttTEK
Рин. кап.:$3.52KХолдери:1
0.00%
2
LUCKLUCKY
Рин. кап.:$3.57KХолдери:2
0.04%
3
100000BtcBd
Рин. кап.:$3.53KХолдери:1
0.00%
4
WTHwealth9231
Рин. кап.:$3.58KХолдери:2
0.04%
5
大门大门交易所
Рин. кап.:$3.56KХолдери:2
0.00%

Закріпити

карта сайту