文 | 版面之外，撰文｜画画腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。 MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度，…文 | 版面之外，撰文｜画画腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。 MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度，…

姚顺雨的88天

来源：BlockWeek

2026/04/24 04:36

阅读时长 19 分钟

如需对本内容提供反馈或相关疑问，请通过邮箱 [email protected] 联系我们。

腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。

MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度，1月底开训，不到三个月发布。

这样一个体量的模型放在今天，很容易被淹没。

但如果把这件事放在三个月前的背景下看，就有意思了。

这次发布看起来是模型升级，真正变化发生在模型之外，腾讯开始用AI反过来重写自己的组织方式。

今年1月26日，腾讯年会现场，腾讯总裁刘炽平在台上做了一件高管很少做的事，公开复盘混元大模型为什么不行。

他用了一个比喻：高中生背题应考。成绩单好看，但真正上了考场就露馅。盘点之后发现，每个关键模块都有缺失。

马化腾的措辞更直接：太慢了。慢了9个月到1年。

从那场年会到今天 Hy3 preview上线，88天。

一、背题拿不了真分

腾讯混元的故事要从2023年9月说起，腾讯在全球数字生态大会上正式发布混元大模型，大厂入场，声势不小。

然后就开始进入一种自证的逻辑。

不是缺投入，不是缺人。问题出在路径上。

刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限，团队选了捷径，用SFT（监督微调）去打榜。效果立竿见影，成绩单漂亮，但一进真实业务场景就暴露，泛化能力差，模型能力无法复用到产品上。

再往下挖，每一层都有裂缝。数据做得不够多，预训练不稳定，AI Infra无法规模化，强化学习缺因子和目标，底座模型撑不起上层应用。

这直接导致了产品端的困局。元宝，腾讯的AI助手应用，今年一季度月活约5700万。听起来在涨，但同期豆包月活3.45亿，千问1.66亿，差距不是在缩小，是在拉大。

差距已经不在规模层面，而是在入口的定义权。

更麻烦的是内部。腾讯体系内的业务线，微信、游戏、广告、企业服务，需要AI能力，但过去的混元接不住。不是业务不想用，是用了效果不达标。一些核心业务甚至不敢接混元，宁可绕开自己找方案。

一个大厂自研的大模型，在自己家里都坐不上主桌，这是混元过去困境最直接的写照。

彼时，腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心，AI团队是配角。先做产品，再让AI适配。用刘炽平的话说，腾讯的AI开发像是产品里没有产品经理，研发团队没人把控方向，很多工作做了等于白做。

而同一时期，字节仅AI芯片采购一项就砸了约900亿元，DeepSeek用极致效率的小团队做出R1震动全球，阿里千问的全球API调用量攀上前列。

混元不是输给了某一个对手，是组织结构本身，让它上不了战场。

二、先借一条命

2025年春节前后，DeepSeek R1爆火，全球AI行业的注意力被这家杭州公司劫持。

腾讯做了一个极其务实且讨巧的决定。2月13日，元宝全面接入DeepSeek-R1满血版，免费开放。

元宝日活在一个月内暴涨超过20倍，2月22日超越豆包登上苹果中国区免费App下载榜第二，一度还拿下榜单第一。

腾讯在那个窗口期的反应速度，整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima，一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。

全行业都在围观DeepSeek的时候，腾讯是第一个全方位把它接进自家生态的大厂。

但腾讯比谁都清楚，这次机遇是借来的。

DeepSeek帮元宝拉来了用户，但留存是另一回事。搜索链路被割裂，一部分走混元一部分走DeepSeek，体验不统一。

简单来说，拥抱DeepSeek的本质，是在混元自己还没准备好的时候，用外部能力把用户先接住、把场景先撑起来。

但问题在于，腾讯的微信生态、企业服务、游戏AI、广告智能投放，这些核心业务需要深度定制、可控可调的AI能力，一个通用API解决不了。

混元必须自己站起来。问题是怎么站。

三、拆房子的人

2025 年 9 月，一位 27 岁的年轻人低调入职腾讯。

姚顺雨，清华姚班本科、普林斯顿大学博士，师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间，他提出ReAct 框架与思维树（Tree of Thoughts），二者均为全球 AI Agent 领域的奠基性工作。

2024 年博士毕业后，他加入 OpenAI，深度参与Operator、Deep Research两大核心智能体项目研发。

但履历并非关键，更重要的是他入职后带来的架构级变革。

2025 年 12 月，腾讯发布内部组织架构调整公告，正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家，同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人，实行双线汇报，直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。

27 岁直通腾讯二号人物、执掌两大 AI 核心部门，这样的晋升与权限，在腾讯发展史上都极其罕见。

有媒体报道，入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因，经常和同事、实习生交流到半夜。诊断结果上报刘炽平，直接推动了后续一连串的组织手术。

他接手的不是一个模型优化任务，而是一整套需要被推翻的工作方式。

2025 年 12 月，腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门，基建先行、推倒重打底层技术地基。与此同时，公司全面加速全球顶尖 AI 人才引进，补齐技术短板。

今年3 月 20 日，成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部，归入混元大模型研发主线，统一向姚顺雨汇报。

自此，腾讯不再保留独立于大模型体系之外的专属 AI 研究机构，所有 AI 研究力量全部收拢，聚焦混元单一主线。

这是一次全链路的重建，从底层Infra到数据管线到训练流程到组织架构，不是修补旧系统，是拆了重来，从头搭建完整研发闭环。

用姚顺雨团队的话说，Hy3 preview是混元大语言模型从读万卷书到行万里路的开端。

对照过去两年混元读了书但做不了题的现实，这句话的指向很明确，不在测试集里自嗨了，去真实世界做事。

四、Preview，不是Answer

回到产品本身。

快慢思考融合的MoE架构，总参数295B，激活参数21B，最大支持256K上下文。2026年1月底启动训练，4月上线。

不到三个月，从零到可用。这本身是混元研发加速演进的一个重要信号。

业界的模型研发通常包括高质量数据准备、预训练、后训练和强化学习/精调，如果算上前期架构探索和后期评测优化，从0到1做一个完整的大版本周期大约6-12个月。

腾讯反其道而行，没有去扎堆追求同质化模型，结合腾讯在社交、游戏、广告等核心业务场景需求进行Co-design设计，这样的好处是腾讯对AI的巨额投入能得到市场的快速验证。

和过去的混元完全反过来。过去是先打榜再找场景，找到场景发现用不了。现在是先进场景，再给外界看。

而在发布之前，Hy3 preview已经在元宝、WorkBuddy、CodeBuddy、ima、QQ等腾讯核心产品里完成了实测和协同适配，模型和产品从设计阶段就同步推进。

这就是Co-design，边训边用，让产品反馈来倒逼模型迭代。

某种意义上，这是对刘炽平那句”产品里没有产品经理”的直接回应。

对腾讯内部来说，Hy3 preview带来的变化可能比外界感知到的更大。过去的混元，业务线不敢接、不想接，各找各的出路，模型团队和产品团队之间隔着一堵墙。

这一次混元真正成了腾讯内部业务的模型底座，不再是一个需要业务线配合打榜的面子工程。

当内部业务愿意把自己的产品体验押在混元上的时候，这件事本身就是信号。

但Preview就是Preview。意思很坦诚，这是第一版，拿到真实用户和业务里去磨，用反馈来迭代。

态度对了，方向有了，产品上线了。至于结果，考试才刚开始。

五、龙虾是桥，混元才是地基

事实上，在Hy3 preview上线之前，腾讯还做了一件容易被忽略的事。

今年初OpenClaw爆火，龙虾热潮席卷整个AI行业。腾讯的反应速度又一次让人意外，几乎是最早、最全面拥抱龙虾的大厂。

WorkBuddy、QClaw、Lighthouse，一系列基于龙虾协议的产品密集上线，腾讯的产品矩阵在短时间内全面接入。

现在回头看，龙虾热潮虽然慢慢退烧。但对腾讯来说，这件事的价值不在龙虾本身，更像一个过渡装置。

它做了两件事。一是让腾讯散落在各条业务线的产品力重新形成合力，微信、元宝、企业服务、开发者工具，在龙虾这个公共协议层上第一次真正协同起来。二是更关键的，它为混元争取了时间。

当用户通过各种Agent入口涌进来的时候，腾讯用龙虾生态先接住了他们，而混元在幕后完成了从Infra到模型的重建。

Agent的入口可以有很多个。但最终决定用户留不留下来的，是底层模型的能力。龙虾是桥，混元才是地基。桥搭好了，地基也终于跟上了。

六、窗口期不会等人

今年4月，可能是中国AI历史上最拥挤的一个月。

阿里在72小时内连发三款战略级模型，Kimi发布并开源Kimi K2.6模型，通用Agent、代码、视觉理解等综合能力全面提升，字节Seed持续迭代，豆包生态扩张不停。DeepSeek V4也传言定于4月下旬发布。（参考阅读：梁文峰和姚顺雨，四月交卷）

混元选在这个窗口交卷，要面对的不只是技术竞赛，更是一个现实问题：窗口期还有多长？

腾讯有全中国最大的社交生态、最多的用户触点、最丰富的应用场景。微信月活超过14亿，QQ、腾讯会议、腾讯文档、企业微信，都是天然的AI落地入口。

但这些资源要发挥作用，前提是底层模型能撑得住。

过去一年多，混元产品能力乏力，腾讯不得不借DeepSeek的热度和力量，不得不看着豆包在用户端把自己甩开。

Hy3 preview说明姚顺雨听到了马化腾的批评。听到了，而且动手了。

不到90天，拆掉旧流水线，重建Infra，撤掉AI Lab，并入团队，挖来核心人才，和产品Co-design，交出一个可用的版本。

这个速度本身就是组织效率改变的证据。

但听到了和做到了之间，还有距离。

混元追上来的速度够不够快，最终不取决于一次Preview的参数量，取决于这次重建的组织效率能不能持续。

这一次姚顺雨的答卷上写着Preview。显然，后面还有大招。

【版面之外】的话：

混元过去最大的问题，不是模型不够大，是组织不够对。

一个自家业务都不愿意接的大模型，参数再多也是自嗨。

Hy3 preview最重要的变化，不是参数变了，是墙拆了，模型和产品之间的墙，研究和工程之间的墙，混元和腾讯生态之间的墙。

拆墙这件事，比堆参数难得多。

但这件事的意义，也不只在腾讯。在大模型这场竞争里，参数、算法、人才都可以被追赶。

真正难以复制的，是一家公司有没有决心为AI重写自己。

错过等一年！U狂欢$200,000奖池开抢

拉宝箱赢U/黄金/BNB，质押U享12%APR，新用户再领$200

免责声明: 本网站转载的文章均来源于公开平台，仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利，请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证，并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考，不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。