Революционный шаг Deepseek: когда технология меняет правила игры (1 декабря)

Выпуск Deepseek v3.2 стал сегодня главной топ-темой, и это не без причины. Компания продемонстрировала результаты, которые прямо конкурируют с последними закрытыми моделями лидеров индустрии, включая gemini3.0. Это однозначно переводит Deepseek в категорию open-source SOTA, со всеми измеряемыми метриками, подтверждающими этот статус.

На что на самом деле опирается этот прорыв?

С технической точки зрения, инновация заключается не в революционных новинках архитектуры. Deepseek продолжает применять DSA и постоянно инвестирует в post-training этап, который составляет более 10% от общего вычислительного бюджета. Но как-то компания нашла способ максимально повысить эффективность этого подхода. Используя полный потенциал экспериментальной версии v3.2, команда достигла результатов, которые прямо противоречат нарративу о “стене вычислительных мощностей”.

Зибин Гоу, один из ключевых исследователей Deepseek, высказал интересную гипотезу: если Gemini3 доказал возможности на фронте pretraining, то v3.2 фокусируется на масштабировании подкрепляющего обучения (RL) и цепочек решений (CoT). Это не означает дефляцию вычислительной мощности — наоборот, это требует больших затрат во время инференса. Ключевая идея: масштабирование должно продолжаться на всех уровнях, и колебания о его границах — это просто шум.

Рыночный контекст и реальная ценность

Однако здесь возникает очень критический момент. Deepseek сам признает, что эффективность использования токенов в этой версии является “inferior” по сравнению с альтернативами. Более того, в специальной версии модели используется значительно больше токенов для достижения тех же результатов. Это напрямую влияет на практическую стоимость внедрения.

По словам аналитиков, спрос на вычислительные мощности остается принципиально невысеченным. Реальная проблема не в том, что вычислений становится меньше, а в том, что их стоимость остается слишком высокой для масштабного коммерческого развертывания. Только революционные прорывы в аппаратном обеспечении и архитектурах моделей могут кардинально изменить это уравнение.

Какое это имеет значение для крупных игроков?

Для компаний типа OpenAI, которые строили свою конкурентную преимущество именно на “возможностях модели” как основном “moat”, этот выпуск Deepseek звучит как серьезное предупреждение. Open-source альтернатива, которая уже приближается к закрытым решениям, сокращает нарост о исключительной технологической преимущества закрытых разработок.

1 декабря: идеальная буря на рынке?

Интересно, что этот релиз выпадает точно на третью годовщину запуска ChatGPT. Рынок сегодня вечером, вероятно, станет насыщен волатильностью: несколько непредсказуемых макрофакторов из Японии, движение BTC, а также слухи о Amazon re:Invent как следующем катализаторе изменений. Среди аналитиков уже циркулируют прогнозы о том, насколько агрессивно рынок отреагирует на конкуренцию, которую символизирует сегодняшний день.

Что дальше: v3 выжат?

В завершение: некоторые участники исследовательских кругов уже задаются вопросом, не выжата ли версия v3 до своих пределов возможностей, и не пора ли подумать о v4. Если Deepseek потратил год просто на оптимизацию версии 3, то это говорит о глубине работы и серьезности амбиций компании. Количество рокировок на доске AI-пространства явно растет.

BTC-0,54%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить