文 | 版面之外,撰文|画画 腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。 MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度,…文 | 版面之外,撰文|画画 腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。 MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度,…

姚顺雨的88天

2026/04/24 04:36
阅读时长 19 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。

MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度,1月底开训,不到三个月发布。

这样一个体量的模型放在今天,很容易被淹没。

但如果把这件事放在三个月前的背景下看,就有意思了。

这次发布看起来是模型升级,真正变化发生在模型之外,腾讯开始用AI反过来重写自己的组织方式。

今年1月26日,腾讯年会现场,腾讯总裁刘炽平在台上做了一件高管很少做的事,公开复盘混元大模型为什么不行。

他用了一个比喻:高中生背题应考。成绩单好看,但真正上了考场就露馅。盘点之后发现,每个关键模块都有缺失。

马化腾的措辞更直接:太慢了。慢了9个月到1年。

从那场年会到今天 Hy3 preview上线,88天。

一、背题拿不了真分

腾讯混元的故事要从2023年9月说起,腾讯在全球数字生态大会上正式发布混元大模型,大厂入场,声势不小。

然后就开始进入一种自证的逻辑。

不是缺投入,不是缺人。问题出在路径上。

刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限,团队选了捷径,用SFT(监督微调)去打榜。效果立竿见影,成绩单漂亮,但一进真实业务场景就暴露,泛化能力差,模型能力无法复用到产品上。

再往下挖,每一层都有裂缝。数据做得不够多,预训练不稳定,AI Infra无法规模化,强化学习缺因子和目标,底座模型撑不起上层应用。

这直接导致了产品端的困局。元宝,腾讯的AI助手应用,今年一季度月活约5700万。听起来在涨,但同期豆包月活3.45亿,千问1.66亿,差距不是在缩小,是在拉大。

差距已经不在规模层面,而是在入口的定义权。

更麻烦的是内部。腾讯体系内的业务线,微信、游戏、广告、企业服务,需要AI能力,但过去的混元接不住。不是业务不想用,是用了效果不达标。一些核心业务甚至不敢接混元,宁可绕开自己找方案。

一个大厂自研的大模型,在自己家里都坐不上主桌,这是混元过去困境最直接的写照。

彼时,腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心,AI团队是配角。先做产品,再让AI适配。用刘炽平的话说,腾讯的AI开发像是产品里没有产品经理,研发团队没人把控方向,很多工作做了等于白做。

而同一时期,字节仅AI芯片采购一项就砸了约900亿元,DeepSeek用极致效率的小团队做出R1震动全球,阿里千问的全球API调用量攀上前列。

混元不是输给了某一个对手,是组织结构本身,让它上不了战场。

二、先借一条命

2025年春节前后,DeepSeek R1爆火,全球AI行业的注意力被这家杭州公司劫持。

腾讯做了一个极其务实且讨巧的决定。2月13日,元宝全面接入DeepSeek-R1满血版,免费开放。

元宝日活在一个月内暴涨超过20倍,2月22日超越豆包登上苹果中国区免费App下载榜第二,一度还拿下榜单第一。

腾讯在那个窗口期的反应速度,整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima,一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。

全行业都在围观DeepSeek的时候,腾讯是第一个全方位把它接进自家生态的大厂。

但腾讯比谁都清楚,这次机遇是借来的。

DeepSeek帮元宝拉来了用户,但留存是另一回事。搜索链路被割裂,一部分走混元一部分走DeepSeek,体验不统一。

简单来说,拥抱DeepSeek的本质,是在混元自己还没准备好的时候,用外部能力把用户先接住、把场景先撑起来。

但问题在于,腾讯的微信生态、企业服务、游戏AI、广告智能投放,这些核心业务需要深度定制、可控可调的AI能力,一个通用API解决不了。

混元必须自己站起来。问题是怎么站。

三、拆房子的人

2025 年 9 月,一位 27 岁的年轻人低调入职腾讯。

姚顺雨,清华姚班本科、普林斯顿大学博士,师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间,他提出ReAct 框架与思维树(Tree of Thoughts),二者均为全球 AI Agent 领域的奠基性工作。

2024 年博士毕业后,他加入 OpenAI,深度参与Operator、Deep Research两大核心智能体项目研发。

但履历并非关键,更重要的是他入职后带来的架构级变革。

2025 年 12 月,腾讯发布内部组织架构调整公告,正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家,同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人,实行双线汇报,直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。

27 岁直通腾讯二号人物、执掌两大 AI 核心部门,这样的晋升与权限,在腾讯发展史上都极其罕见。

有媒体报道,入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因,经常和同事、实习生交流到半夜。诊断结果上报刘炽平,直接推动了后续一连串的组织手术。

他接手的不是一个模型优化任务,而是一整套需要被推翻的工作方式。

2025 年 12 月,腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门,基建先行、推倒重打底层技术地基。与此同时,公司全面加速全球顶尖 AI 人才引进,补齐技术短板。

今年3 月 20 日,成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部,归入混元大模型研发主线,统一向姚顺雨汇报。

自此,腾讯不再保留独立于大模型体系之外的专属 AI 研究机构,所有 AI 研究力量全部收拢,聚焦混元单一主线。

这是一次全链路的重建,从底层Infra到数据管线到训练流程到组织架构,不是修补旧系统,是拆了重来,从头搭建完整研发闭环。

用姚顺雨团队的话说,Hy3 preview是混元大语言模型从读万卷书到行万里路的开端。

对照过去两年混元读了书但做不了题的现实,这句话的指向很明确,不在测试集里自嗨了,去真实世界做事。

四、Preview,不是Answer

回到产品本身。

快慢思考融合的MoE架构,总参数295B,激活参数21B,最大支持256K上下文。2026年1月底启动训练,4月上线。

不到三个月,从零到可用。这本身是混元研发加速演进的一个重要信号。

业界的模型研发通常包括高质量数据准备、预训练、后训练和强化学习/精调,如果算上前期架构探索和后期评测优化,从0到1做一个完整的大版本周期大约6-12个月。

腾讯反其道而行,没有去扎堆追求同质化模型,结合腾讯在社交、游戏、广告等核心业务场景需求进行Co-design设计,这样的好处是腾讯对AI的巨额投入能得到市场的快速验证。

和过去的混元完全反过来。过去是先打榜再找场景,找到场景发现用不了。现在是先进场景,再给外界看。

而在发布之前,Hy3 preview已经在元宝、WorkBuddy、CodeBuddy、ima、QQ等腾讯核心产品里完成了实测和协同适配,模型和产品从设计阶段就同步推进。

这就是Co-design,边训边用,让产品反馈来倒逼模型迭代。

某种意义上,这是对刘炽平那句”产品里没有产品经理”的直接回应。

对腾讯内部来说,Hy3 preview带来的变化可能比外界感知到的更大。过去的混元,业务线不敢接、不想接,各找各的出路,模型团队和产品团队之间隔着一堵墙。

这一次混元真正成了腾讯内部业务的模型底座,不再是一个需要业务线配合打榜的面子工程。

当内部业务愿意把自己的产品体验押在混元上的时候,这件事本身就是信号。

但Preview就是Preview。意思很坦诚,这是第一版,拿到真实用户和业务里去磨,用反馈来迭代。

态度对了,方向有了,产品上线了。至于结果,考试才刚开始。

五、龙虾是桥,混元才是地基

事实上,在Hy3 preview上线之前,腾讯还做了一件容易被忽略的事。

今年初OpenClaw爆火,龙虾热潮席卷整个AI行业。腾讯的反应速度又一次让人意外,几乎是最早、最全面拥抱龙虾的大厂。

WorkBuddy、QClaw、Lighthouse,一系列基于龙虾协议的产品密集上线,腾讯的产品矩阵在短时间内全面接入。

现在回头看,龙虾热潮虽然慢慢退烧。但对腾讯来说,这件事的价值不在龙虾本身,更像一个过渡装置。

它做了两件事。一是让腾讯散落在各条业务线的产品力重新形成合力,微信、元宝、企业服务、开发者工具,在龙虾这个公共协议层上第一次真正协同起来。二是更关键的,它为混元争取了时间。

当用户通过各种Agent入口涌进来的时候,腾讯用龙虾生态先接住了他们,而混元在幕后完成了从Infra到模型的重建。

Agent的入口可以有很多个。但最终决定用户留不留下来的,是底层模型的能力。龙虾是桥,混元才是地基。桥搭好了,地基也终于跟上了。

六、窗口期不会等人

今年4月,可能是中国AI历史上最拥挤的一个月。

阿里在72小时内连发三款战略级模型,Kimi发布并开源Kimi K2.6模型,通用Agent、代码、视觉理解等综合能力全面提升,字节Seed持续迭代,豆包生态扩张不停。DeepSeek V4也传言定于4月下旬发布。(参考阅读:梁文峰和姚顺雨,四月交卷

混元选在这个窗口交卷,要面对的不只是技术竞赛,更是一个现实问题:窗口期还有多长?

腾讯有全中国最大的社交生态、最多的用户触点、最丰富的应用场景。微信月活超过14亿,QQ、腾讯会议、腾讯文档、企业微信,都是天然的AI落地入口。

但这些资源要发挥作用,前提是底层模型能撑得住。

过去一年多,混元产品能力乏力,腾讯不得不借DeepSeek的热度和力量,不得不看着豆包在用户端把自己甩开。

Hy3 preview说明姚顺雨听到了马化腾的批评。听到了,而且动手了。

不到90天,拆掉旧流水线,重建Infra,撤掉AI Lab,并入团队,挖来核心人才,和产品Co-design,交出一个可用的版本。

这个速度本身就是组织效率改变的证据。

但听到了和做到了之间,还有距离。

混元追上来的速度够不够快,最终不取决于一次Preview的参数量,取决于这次重建的组织效率能不能持续。

这一次姚顺雨的答卷上写着Preview。显然,后面还有大招。

【版面之外】的话:

混元过去最大的问题,不是模型不够大,是组织不够对。

一个自家业务都不愿意接的大模型,参数再多也是自嗨。

Hy3 preview最重要的变化,不是参数变了,是墙拆了,模型和产品之间的墙,研究和工程之间的墙,混元和腾讯生态之间的墙。

拆墙这件事,比堆参数难得多。

但这件事的意义,也不只在腾讯。在大模型这场竞争里,参数、算法、人才都可以被追赶。

真正难以复制的,是一家公司有没有决心为AI重写自己。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

USD1 Genesis:0 费率 + 12% APR

USD1 Genesis:0 费率 + 12% APRUSD1 Genesis:0 费率 + 12% APR

新用户:质押最高享 600% APR。限时福利!