Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
Deepseek的革命性举措:当技术改变游戏规则 (12月)
Deepseek v3.2 版本的发布今天成为了头条话题,这绝非偶然。公司展示的成果与行业领军者的最新封闭模型直接竞争,包括 gemini3.0。这无疑将 Deepseek 转入开源 SOTA(最先进技术)类别,所有可衡量的指标都证明了这一地位。
这个突破到底依赖于什么?
从技术角度来看,创新并不在于架构的革命性新颖。Deepseek 继续应用 DSA,并持续投资于后训练阶段,这一阶段占据了总计算预算的超过10%。但公司似乎找到了最大化这一方法效率的方式。利用 v3.2 试验版的全部潜力,团队取得了与“计算能力瓶颈”叙事完全相反的成果。
Deepseek 关键研究员之一的 Zibin Gou 提出一个有趣的假设:如果 Gemini3 在预训练方面展现了能力,那么 v3.2 更专注于扩展强化学习 (RL) 和链式推理 (CoT)。这并不意味着计算能力的贬值——相反,这需要在推理阶段投入更多成本。核心思想是:扩展应在所有层面持续进行,关于其极限的波动只是噪音。
市场背景与实际价值
然而,这里出现了一个非常关键的问题。Deepseek 自认在此版本中,令牌的使用效率“inferior”于其他方案。更重要的是,模型的特殊版本使用了更多的令牌以达到相同的效果。这直接影响了实际部署的成本。
分析师指出,对计算能力的需求仍然是根本未尽的。真正的问题不在于计算变少,而在于其成本仍然过高,难以实现大规模商业部署。只有硬件和模型架构的革命性突破,才能从根本上改变这一局面。
这对大玩家意味着什么?
对于像 OpenAI 这样的公司,它们的竞争优势主要建立在“模型能力”作为“护城河”之上,这次 Deepseek 的发布无疑是一个严重的警示。开源替代方案已逐步逼近封闭方案,削弱了封闭开发的技术优势。
12月1日:市场的完美风暴?
有趣的是,这一版本正好在 ChatGPT 发布三周年之际。今晚,市场可能会迎来一波波动:来自日本的几大宏观因素、BTC的动向,以及关于 Amazon re:Invent 作为下一波变革催化剂的传闻。分析师们已开始预测,市场将多么激烈地对今天的竞争做出反应。
接下来:v3 还能挤出多少潜力?
最后,一些研究圈的参与者开始质疑:v3 版本是否已被挤到极限,是否是时候考虑 v4 了。如果 Deepseek 花了一年时间仅仅在优化 v3,这显示了公司工作的深度和雄心。AI领域的变革频率明显在增加。