在史上最大规模 WAIC 中寻找 DeepSeek

日期:2025-07-31 18:30:23 / 人气:22


今年的上海世界人工智能大会(WAIC)比去年有什么不同,最简单现成的答案,就是 DeepSeek。
从巴黎人工智能峰会到 WAIC,DeepSeek 从未亲临现场,却依然是中国开源技术栈叙事的支点,定义了叙事节奏、商业尺度与国际话语权的边界。WAIC 的几处关键画面印证了这一切。
无论 DeepSeek 未来如何,它正如 OpenAI 证明扩展涌现智能一样,打破了原先束缚中国创新的思维惯性。开源模型可以逼近最前沿的闭源模型,这样的硬核创新也完全可以只由中国本土人才实现;开源模型将冲击闭源模型创建的商业体系,中国可以凭借开源技术栈争夺全球市场,并在与美国竞争中提高自己的话语权。在这个意义上,DeepSeek 正在潜移默化地化身为具体的方法论。
也许前 Google CEO 埃里克・施密特(Eric Schmidt)对这一切深有感触。今年,他同时出席了巴黎峰会与 WAIC。在巴黎峰会上,他警告西方国家需要加强构建开源 AI 模型,并呼吁西方与中国加强合作。这一次,他继续点赞 DeepSeek,同时提议要与中国及其他开源技术的倡导者们合作。“未来超级智能之间的协作最终是不可避免的”,美国与中国在这些问题上的合作也是不可避免的。
DeepSeek 不仅震撼了硅谷,也以冲击估值逻辑的方式,激活了 “六小虎” 中尚存 AGI 信仰的企业。在今年的 WAIC 上,“六小虎” 并没有悉数到场。已经放弃 AGI 的百川智能与零一万物缺席了;智谱 AI 和月之暗面(MoonShot)到场,但展位不大;阶跃星辰(StepFun)与稀宇科技(MiniMax)动静最大,这既是因为 “东道主” 的身份,也因为就差阶跃星辰拿出点什么来。
MiniMax 创始人闫俊杰的演讲,被主办方恰好排在了辛顿的开幕式演讲之后。后者也是这届 WAIC 最大亮点之一。闫俊杰为更多 AI 初创企业鼓劲称,大模型参数规模的增长速度,在过去半年已经放缓,拥有非常多算力的公司和没有那么多算力的公司,在训练上的差异可能不会那么大。
增量部署的算力,很多花在做更多的研究跟探索上。但是,研究和探索,除了取决于算力之外,还取决于高效的整体实验设计、高效的研发团队,以及一些天才的创意。这呼应了辛顿所说的,如果想做真正原创性研究,就应该去寻找那些你认为 “所有人都搞错了” 的领域。
阶跃星辰则拿出了旗舰基础模型 Step 3。这就是该公司研究与探索的最新成果。这个 3210 亿总参数规模,每次激活 380 亿参数的模型,在多项基准测试中表现突出,阶跃星辰称之为 “最强开源多模态推理模型”。作为推理模型,它具备视觉能力。多模态也正是阶跃星辰最擅长的,CEO 姜大昕称,多模态领域也开始向强化学习过渡。在这次 WAIC 上,阶跃星辰还发布了多模理解生成一体化模型 Step 3o Vision 以及第二代端到端语音大模型 Step-Audio 2。
Step 3 会在 7 月 31 日开源,将迎来更严格的一线开发者的试用与评价,也会有更多技术细节披露。刷榜粉饰无法被利益中立的第三方成功复现。如果说实现 AGI 存在验证者定律,验证是否容易决定着能力的边界,那么,某种意义上开源模型一直都在接受着最广泛与最深入的验证。这正是开源真正推动了创新的关键之一。这也是去年底至今 DeepSeek 被推向聚光灯下最关键的原因之一。
至此,“六小虎” 中仍在研发预训练大模型的全部交卷,而且都将 DeepSeek 视为了不得不超越的对象。与 OpenAI 在发布 ChatGPT 与 GPT-4,证明 Transformer 可以带来智能涌现后一样,证明了中国可以主导开源创新,而且开源创新可以无限逼近全球最领先水平的 DeepSeek,成为了其他企业追赶与超越的对象。
今年二季度,智谱更新了 GLM-4-0414,称其性能可与 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列相媲美;MiniMax 与月之暗面更不用说,前者整整一周的上新活动,就是 DeepSeek 曾用过的方式,后者的 K2 更是实现了对 R1-0528 的超越,登顶 LMArena 的开源模型榜单。这次,阶跃星辰也称在国产芯片上的推理效率,最高可达 DeepSeek-R1 的 300%。
不在场的 DeepSeek 仍然无处不在。蚂蚁数科在金融垂直领域的大模型 Agentar-Fin-R1-32B,宣称在各项金融测评集上,超越了超大尺寸推理模型 R1 和 GPT-o1。而壁仞科技创始人张文则提到,Deepseek 等国产大模型牵动了国内芯片的设计发展。
OpenAI 仍然没有发布 GPT-5。这使得世界停留在 GPT-4 时代,持续小步创新。从 GPT-4 到 GPT-5 的这段时间,成为其他企业纷纷超越的窗口期。传言这一切最快会在本月底或 8 月初改变。DeepSeek 也没有发布 V4 或者 R2,也给了国内企业追赶反超的机会。在缺乏颠覆性创新的情况下,反超存在不同解读语境。
DeepSeek 曾以更低的训练成本与更高性价比的推理震惊硅谷。但是,token 经济学的现实意义,在于它必须服务于应用场景的具体实践。在这个时候,单纯比较每百万 token 的价格意义并不唯一,它必须与首个 token 生成延迟、每秒每用户 token 数,以及上下文窗口等关键性能指标联动。
这也是初创企业通过技术创新与模型迭代,可以超越 DeepSeek 的现实维度。MiniMax 的 M1 引入了闪电注意力机制(Lightning Attention),以更低的算力消耗,带来了更长的推理空间;它支持 100 万 tokens 输入,是 DeepSeek-R1 的八倍。
月之暗面的 K2 采用了更少的注意力头,更多的专家,改良了 MuonClip 与 QK-Clip,可以提高长上下文效率与每个 token 的处理效率。阶跃星辰的 Step 3 则强调了对国产芯片更彻底的软硬件优化,还联合了 10 家国产芯片、基础设施厂商,发起成立了 “模芯创新生态联盟”;在英伟达的 CUDA 生态上,Step 3 相较 R1 的吞吐量也提升了超 70%。
在 DeepSeek 开启的中国开源技术栈的叙事上,这些聚焦于低成本与高效率的创新与反超,更具现实与时代意义。最近很长一段时间,AI 行业的重心已经从基础模型突破转向了应用落地。开源模型正是推动应用创新的关键力量。
这场有史以来规模最大的世界人工智能大会(WAIC)也不例外。谈论基础模型创新的越来越少,谈论智能体与端侧应用的越来越多,它们都是具体的 “执行者”,分别对应数字世界与物理世界。机器人企业占据了整整一层楼,从去年的 18 家攀升至今年的 80 家,与 AI 还隔着一层机器人的供应链企业也来了;阿里巴巴把大模型装进了夸克 AI 眼镜,腾讯在发布混元世界模型 1.0 之外,还推出了智能体全家桶。
不过,在基础模型领域,阶跃星辰与稀宇科技是这次在 WAIC 亮相的少数真正打出 “硬牌” 的初创公司。相比 DeepSeek 目前仍以追求 AGI 为唯一目标,对终端用户体验和商业化路径兴趣不大,这两家公司仍然在意。它们相对 DeepSeek 的进步,也正是围绕如何多快好省地推动应用落地展开的。年化收入 10 亿元人民币正在成为新的门槛。在本届 WAIC 中,达到这一收入规模的初创公司,除了阶跃星辰,还有宇树科技与智元机器人,后两者最近也开源了不少数据集。
从年初至今,美国对中国开源技术栈的解读,都更具地缘竞争意味。硅谷与华盛顿担心美国以外的世界,都是中国的开源模型的。在这一届 WAIC 上,中国更前进了一步,把这一叙事做实了。会上发布的《人工智能全球治理行动计划》,提议打造跨国开源社区和安全、可靠开源平台,释放出了强烈的信号。

作者:先锋娱乐




现在致电 xylmwohu OR 查看更多联系方式 →

COPYRIGHT 先锋娱乐 版权所有