Когда ИИ встречается с рынком: модели с открытым исходным кодом доминируют над западными аналогами в тесте торгов на арене Alpha

Рынок реального мира стал неожиданной испытательной площадкой для возможностей искусственного интеллекта. Alpha Arena — инновационная соревновательная платформа, созданная инженером-программистом Джей Азангом, — ставит ведущие системы ИИ друг против друга с реальным капиталом — по 10 000 долларов за модель — чтобы определить, какая из них наиболее эффективно ориентируется на рынках криптовалют.

Удивительный разрыв в производительности

Результаты, собранные всего за неделю живой торговли, выявляют поразительную закономерность, которая бросает вызов традиционным предположениям о превосходстве проприетарных ИИ. Модели западных разработчиков с закрытым исходным кодом, управляемые технологическими гигантами, понесли сокрушительные убытки: некоторые потеряли более 80% своих торговых капиталов — примерно 8 000 долларов на аккаунт. В то время как альтернативы с открытым исходным кодом от китайских разработчиков стабильно приносят прибыль.

В число участвующих моделей входят Grok 4, Claude Sonnet 4.5, Gemini 2.5 Pro, ChatGPT 5, Deepseek v3.1 и Qwen3 Max. Удивительно, но лидируют именно Qwen3 и Deepseek — обе модели с открытым исходным кодом, в то время как проприетарные системы от OpenAI и Google показывают слабые результаты.

Стратегия Qwen3 демонстрирует простоту и эффективность: удержание длинной позиции по биткоину с коэффициентом 20x позволило модели оставаться стабильно прибыльной на протяжении всего теста. В отличие от этого, Grok 4 большую часть соревнования держал длинную позицию по Dogecoin с коэффициентом 10x, что отражает волатильность рынка, и сейчас сталкивается с убытками около 20%. Gemini от Google заняла агрессивно медвежью позицию, шортя все доступные криптоактивы — такой подход, возможно, отражает более широкое институциональное скептическое отношение к цифровым валютам — однако за неделю он принес систематические убытки.

За пределами производительности: что показывает рынок

Эксперимент Alpha Arena выходит далеко за рамки простого рейтинга эффективности. Он представляет собой новый тип эталона, раскрывающего фундаментальные различия в том, как системы ИИ обрабатывают неопределенность и неполную информацию.

Традиционные эталоны ИИ часто страдают от критической ошибки: модели могут сталкиваться с похожими шаблонами тестирования во время предварительного обучения, создавая иллюзию возможностей. Однако рынок криптовалют — это противоборствующая, открытая среда, которую нельзя обмануть за счет запоминания. Условия рынка меняются ежедневно под влиянием глобальных настроений, нормативных изменений и непредсказуемого поведения участников — что делает его подлинным испытанием для принятия решений в реальном времени.

По мнению Азанга, такие реальные рыночные приложения представляют собой наиболее чистую форму тестирования интеллекта. Принцип galt-рынка — что свободно функционирующие рынки раскрывают истину через честную конкуренцию — применим и к оценке ИИ. Когда капитал действительно под угрозой, системы искусственного интеллекта не могут полагаться на выученные шаблоны; им приходится адаптироваться к новым ситуациям в реальном времени.

Фактор удачи и долгосрочная проверка

Однако ранние результаты требуют осторожной интерпретации. Концепция «антихрупкости» Насима Талеба предполагает, что одна неделя прибыльной торговли может быть статистическим шумом, а не настоящим конкурентным преимуществом. В рынках с достаточным числом участников экстремальные серии удачи неизбежны. Модель может легко выглядеть гениальной в течение нескольких дней или недель случайно, а затем рухнуть, когда вероятность исправится.

Для того чтобы Alpha Arena мог сделать значимые выводы, эксперимент должен продолжаться значительно дольше, а результаты — независимо воспроизводиться и сравниваться с реальными рыночными условиями. Текущие данные остаются убедительными с точки зрения развлечения — вирусное внимание в X демонстрирует интерес рынка — но недостаточны для окончательных утверждений о превосходстве ИИ в торговле.

Преимущество открытого исходного кода

Тем не менее, ранний разрыв в производительности между моделями с открытым исходным кодом и закрытыми альтернативами вызывает обоснованные вопросы о приоритетах разработки и подходах к оптимизации. Сообщества с открытым исходным кодом часто преследуют иные архитектурные цели, чем корпоративные платформы, что потенциально создает неожиданные преимущества в определенных областях.

Главное понимание остается: независимо от причин раннего успеха Qwen3 и Deepseek, они продемонстрировали, что ни проприетарная собственность, ни огромные корпоративные ресурсы не гарантируют успех на рынке. Условия galt-рынка, выявленные через Alpha Arena, еще раз доказывают, что соревнование при реальных ограничениях — с реальным капиталом и подлинной рыночной неопределенностью — дает неожиданные результаты, которые иногда не могут пройти даже теоретически сложные модели.

Этот эксперимент служит напоминанием о том, что академические эталоны и реальные рыночные показатели остаются разными измерениями возможностей искусственного интеллекта.

BTC-1,16%
DOGE-3,12%
GROK-4,21%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить