Код відкритого вихідного коду планувальника світової моделі GRASP, ретвітнутого Yann LeCun

robot
Генерація анотацій у процесі

Новини ME: код планувальника нової світової моделі GRASP, опублікований Michael Psenka та ретвітнутyй Yann LeCun, відкрито у репозиторії. GRASP — це паралельний стохастичний планувальник для навчання світових моделей; його ключова ідея полягає в одночасній оптимізації дій і проміжних «віртуальних» станів у покращеному просторі траєкторій. Він забезпечує узгодженість із навченою динамічною моделлю за допомогою штрафу за динамічну узгодженість та досягає ефективного паралелізму під час планування. Ключові дизайнерські рішення включають запровадження віртуальних станів, які можна обчислювати паралельно, дослідження простору станів за допомогою шуму, використання техніки stop-gradient, щоб запобігти потраплянню градієнтів у вхідні стани високовимірної візуальної моделі, а також поєднання формування цілі та періодичних серійних кроків розгортання синхронізації для забезпечення стабільності. Планувальник побудовано на основі проєкту DINO-WM, але його також можна інтегрувати з іншими світовими моделями (наприклад, LeWorldModel, JEPA-WMs) через адаптери; він підходить для різних середовищ, зокрема PushT і TwoRoom. Репозиторій містить реалізацію ключових алгоритмів і скрипти для встановлення адаптерів. (Джерело: InFoQ)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити