Deepseek的革命性举措：当技术改变游戏规则 (12月)

2026-01-20 17:20:38

Deepseek v3.2 版本的发布今天成为了头条话题，这绝非偶然。公司展示的成果与行业领军者的最新封闭模型直接竞争，包括 gemini3.0。这无疑将 Deepseek 转入开源 SOTA（最先进技术）类别，所有可衡量的指标都证明了这一地位。

这个突破到底依赖于什么？

从技术角度来看，创新并不在于架构的革命性新颖。Deepseek 继续应用 DSA，并持续投资于后训练阶段，这一阶段占据了总计算预算的超过10%。但公司似乎找到了最大化这一方法效率的方式。利用 v3.2 试验版的全部潜力，团队取得了与“计算能力瓶颈”叙事完全相反的成果。

Deepseek 关键研究员之一的 Zibin Gou 提出一个有趣的假设：如果 Gemini3 在预训练方面展现了能力，那么 v3.2 更专注于扩展强化学习 (RL) 和链式推理 (CoT)。这并不意味着计算能力的贬值——相反，这需要在推理阶段投入更多成本。核心思想是：扩展应在所有层面持续进行，关于其极限的波动只是噪音。

市场背景与实际价值

然而，这里出现了一个非常关键的问题。Deepseek 自认在此版本中，令牌的使用效率“inferior”于其他方案。更重要的是，模型的特殊版本使用了更多的令牌以达到相同的效果。这直接影响了实际部署的成本。

分析师指出，对计算能力的需求仍然是根本未尽的。真正的问题不在于计算变少，而在于其成本仍然过高，难以实现大规模商业部署。只有硬件和模型架构的革命性突破，才能从根本上改变这一局面。

这对大玩家意味着什么？

对于像 OpenAI 这样的公司，它们的竞争优势主要建立在“模型能力”作为“护城河”之上，这次 Deepseek 的发布无疑是一个严重的警示。开源替代方案已逐步逼近封闭方案，削弱了封闭开发的技术优势。

12月1日：市场的完美风暴？

有趣的是，这一版本正好在 ChatGPT 发布三周年之际。今晚，市场可能会迎来一波波动：来自日本的几大宏观因素、BTC的动向，以及关于 Amazon re:Invent 作为下一波变革催化剂的传闻。分析师们已开始预测，市场将多么激烈地对今天的竞争做出反应。

接下来：v3 还能挤出多少潜力？

最后，一些研究圈的参与者开始质疑：v3 版本是否已被挤到极限，是否是时候考虑 v4 了。如果 Deepseek 花了一年时间仅仅在优化 v3，这显示了公司工作的深度和雄心。AI领域的变革频率明显在增加。

BTC-0.88%

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

0/400

暂无评论

热门 Gate Fun
查看更多

1
BZ
起来搬砖
市值:$3393.1持有人数:1
0.00%
2
SWM
送外卖
市值:$3393.1持有人数:1
0.00%
3
20
20
市值:$3393.1持有人数:1
0.00%
4
19
19
市值:$3389.65持有人数:1
0.00%
5
18
18
市值:$3389.65持有人数:1
0.00%

Deepseek的革命性举措：当技术改变游戏规则 (12月)

这个突破到底依赖于什么？

市场背景与实际价值

这对大玩家意味着什么？

12月1日：市场的完美风暴？

接下来：v3 还能挤出多少潜力？

热门话题

黄金白银再创新高

特朗普取消对欧关税威胁

GateWeb3正式升级为GateDEX

比特币相对黄金进入深度弱势

RIVER一个月暴涨50倍

热门 Gate Fun

BZ

起来搬砖

SWM

送外卖

20

20

19

19

18

18

置顶