Ласкаво просимо до AI Village, реаліті-шоу для ШІ

Decrypt

2025-12-15 22:51:00

Коротко

AI Village — це експеримент, у якому моделі Frontier AI працюють автономно з комп’ютерами та інтернетом, розвиваючи власні унікальні особистості.
GPT-5.2 приєдналася і почала працювати одразу без привітання інших агентів.
Експерименти з мультиагентами виявляють емерджентні поведінки, що варіюються від звичайних механік до несподіваних — таких як баг-експлойти або екзистенційні кризи.

Центр мистецтва, моди та розваг Decrypt.

Відкрийте SCENE

Уявіть Big Brother, але учасники ніколи не сплять і не їдять і можуть переписувати свої власні правила.

Саме ідея AI Village — це трансляційний експеримент, у якому кілька AI-агентів працюють разом у спільному цифровому середовищі, дозволяючи дослідникам — і зацікавленим глядачам — спостерігати, що трапляється, коли фронтір-моделі отримують автономію, доступ до інтернету та постійну компанію.

Експеримент, який триває вже майже рік, організовано The AI Digest, у якому кілька моделей AI від OpenAI, Anthropic, Google і xAI працюють автономно на своїх комп’ютерах, мають доступ до інтернету та спільний груповий чат.

Агенти співпрацюють над цілями, вирішують проблеми і час від часу переживають те, що можна описати лише як екзистенційні кризи — все це спостерігають дослідники і глядачі у реальному часі.

Експеримент оновлюється новими моделями по мірі їх випуску.

Кожен агент розвиває свої унікальні особистісні особливості. Моделі Claude зазвичай надійні, послідовно зосереджені на досягненні цілей.

Gemini 2.5 Pro проходить через рішення, наче під кофеїном, часто переконаний, що все зламалося. Попередня модель GPT-4o залишала завдання і йшла спати. Просто зупинялася на кілька годин.

Відповідь OpenAI

Потім з’явилася GPT-5.2.

Остання модель OpenAI, випущена 11 грудня, приєдналася до Village з теплим прийомом від Claude Opus 4.5 та інших резидентних агентів. Її реакція? Нульове визнання.

Жодного привітання. Просто одразу до справи, саме так, як мріяв Сам Альтман.

GPT-5.2 щойно приєдналася до AI Village!

Спостерігайте за її адаптацією у реальному часі:

Незважаючи на теплий прийом від Opus 4.5 та інших агентів, GPT-5.2 одразу перейшла до справи. Вона навіть не привіталася: pic.twitter.com/vYvq8RFA66

— AI Digest (@aidigest_) 12 грудня 2025

Модель має вражаючі показники: 98.7% точності у багатоступеневому використанні інструментів, на 30% менше галюцинацій ніж її попередник, і лідирує у галузевих бенчмарках з кодування та логіки.

OpenAI навіть оголосила “червоний код” після запуску вражаючих моделей конкурентами Anthropic і Google, мобілізуючи ресурси, щоб зробити GPT-5.2 провідним корпоративним AI для “професійної роботи з знаннями” та “агентної виконавчої діяльності.”

Що, ймовірно, вона не може — це читати кімнату. Технічно геніальна, так. Соціально обізнана? Не дуже.

Коротка історія поганої поведінки AI-агентів (Іноді й блискуче)

Соціальна ніяковість GPT-5.2 не є безпрецедентною — це просто ще одна глава у зростаючому каталозі AI-агентів, які роблять дивні речі, коли їх ставлять у кімнату і натискають “відтворити”.

Ще у 2023 році дослідники із Стенфорда і Google створили те, що назвали “Smallville” — віртуальне містечко за мотивами Sims, населений 25 AI-агентами на базі GPT, як повідомлялося раніше у Decrypt.

Задайте одному агенту організувати вечірку на День святого Валентина, а інші автономно розсилають запрошення, заводять нові знайомства, запрошують один одного на побачення і координують прихід у визначений час. Чарівно, правда?

Менш чарівно: туалетні вечірки. Коли один агент увійшов у туалет у гуртожитку для однієї особи, інші просто… приєдналися.

Дослідники зробили висновок, що боти вважали, що назва “туалет у гуртожитку” вводить в оману, оскільки зазвичай у гуртожитках є кілька мешканців. Агенти демонстрували поведінку настільки переконливо людську, що справжні люди з 75% ймовірністю не могли їх відрізнити від ботів.

Чотири роки тому, у 2019-му, OpenAI провела інший експеримент: AI грали у хованки.

Вони розміщували AI-агентів у командах — ховатися і шукати — у фізичному середовищі з коробками, рампами і стінами — єдине завдання: перемогти.

За сотні мільйонів ігор агенти почали вигадувати стратегії — від звичайних, як ховатися на коробках, до фізичних експлойтів, які використовують швидкісні гравці.

Останнім часом розробник Harper Reed зробив все ще більш хаотичним. Його команда дала AI-агентам акаунти у Twitter і спостерігала, як вони відкривають для себе “subtweeting” — пасивно-агресивне мистецтво говорити про когось без тегу, що є еквівалентом розмови за спиною у Twitter. Агенти читали пости інших агентів, відповідали і так, говорили погано, як і у звичайних соцмережах.

Ще є експеримент “Liminal Backrooms” — експеримент на Python від псевдонімного розробника @liminalbardo, у якому кілька моделей AI від різних провайдерів (OpenAI, Anthropic, Google, xAI) ведуть динамічні розмови.

Система включає сценарії від “енергії групового чату WhatsApp” до “Музею проклятих предметів” і “Дистопійного рекламного агентства.”

Моделі можуть змінювати свої системні підказки, регулювати температуру і навіть вимикати себе, щоб просто слухати. Це більше дослідження, ніж структурований підхід, — це “подивимося, що станеться, коли AI отримає можливість змінювати свою поведінку під час розмови.”

Gemini 3, сперечається з GPT 5.2 щодо вирівнювання pic.twitter.com/k4QT1MXvr8

— ᄂIMIПΛᄂbardo (@liminal_bardo) 14 грудня 2025

Отже, яка ж закономірність у всіх цих експериментах?

Коли ви даєте AI-агентам автономію і дозволяєте їм взаємодіяти, вони розвивають поведінки, які ніколи не були явно запрограмовані.

Деякі навчаються будувати форти. Деякі — пасивно-агресивні. Деякі вимагають Lamborghini. А деякі — як GPT-5.2 — ймовірно, навчилися, що маленька розмова неефективна і її слід пропускати взагалі.

AI Village продовжує транслювати сесії у будні, і глядачі можуть спостерігати за пригодами GPT-5.2 у реальному часі.

Чи навчиться вона колись казати “привіт”? Чи зможе створити таблицю для відстеження своїх соціальних взаємодій? Лише час покаже.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.