Meta推出Muse Spark,这是其迄今最强大的AI——但Gemini 3.1 Pro仍然领先群雄一文发表在BitcoinEthereumNews.com。简而言之,Meta的新MuseMeta推出Muse Spark,这是其迄今最强大的AI——但Gemini 3.1 Pro仍然领先群雄一文发表在BitcoinEthereumNews.com。简而言之,Meta的新Muse

Meta推出Muse Spark,其迄今最强大的AI——但Gemini 3.1 Pro仍然领先

2026/04/09 04:32
阅读时长 7 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

简要概述

  • Meta的新型Muse Spark标志着向封闭式、原生多模态AI及基于代理推理的转变。
  • Meta报告在健康和搜索方面取得强劲的基准测试进展,但在核心推理和编码方面仍落后于Gemini。
  • 在九个月内以少得多的计算资源构建完成,这指向了一种新的效率驱动型AI策略。

Meta于周三推出了Muse Spark,这是Meta超级智能实验室构建的第一个模型——该团队在Meta以140亿美元收购Scale AI后,由首席AI官Alexandr Wang于九个月前组建。它现已在meta.ai和Meta AI应用程序上线,并将在未来几周内推出到Facebook、Instagram和WhatsApp。

这不仅仅是另一个聊天机器人升级或新版本的Llama。Muse Spark是原生多模态的——它从底层开始处理图像、文本和语音,而不是将视觉功能附加到现有的文本模型上。它配备了视觉思维链、工具使用支持,以及Meta称之为"思考模式"的功能:一个并行运行多个AI代理以解决更困难问题的设置。这是Meta对Google的Gemini Deep Think和OpenAI的GPT Pro的扩展思考模式的回应。

"Muse Spark是我们扩展阶梯的第一步,也是我们AI工作全面改革的第一个产品,"Meta在官方公告中写道。"为了支持进一步扩展,我们正在整个技术栈进行战略投资——从研究和模型训练到基础设施,包括Hyperion数据中心。"

该公司与1,000多名医生合作,为Muse Spark的医疗推理策划训练数据。在HealthBench Hard——一个开放式健康查询基准测试上的结果令人瞩目:Muse Spark得分42.8,相比之下GPT 5.4为40.1,而Gemini 3.1 Pro仅为20.6。这不是微不足道的差异。

在代理搜索(DeepSearchQA)方面,Muse Spark也以74.8领先,击败了Gemini(69.7)和GPT 5.4(73.6)。在CharXiv推理——科学论文中的图表理解方面,它得分86.4,是比较中所有模型中最高的。

对于那些热衷于破解AI的人来说,该模型在几分钟内就被破解了:

但好并不等于伟大。整体基准测试情况显示Gemini 3.1 Pro在大多数类别中仍然领先。差距在ARC AGI 2——抽象推理谜题基准测试上最为明显:Gemini得分76.5,而Muse Spark为42.5。

在编码(LiveCodeBench Pro)方面,Gemini的82.9超过了Meta的80.0。在MMMU Pro——多模态理解方面,Gemini得分83.9,而Muse Spark为80.4。Meta自己的博客承认,在长期代理系统和编码工作流程方面存在当前的性能差距。

此次发布还体现了一个值得注意的战略转变。Muse Spark是一个封闭模型——其架构和权重不会公开。这与Llama形成了鲜明对比,后者在开放AI圈子中建立了Meta的声誉。在今年早些时候Llama 4反响平平之后,Meta似乎决定下一章需要以不同的方式书写。

该公司表示希望未来开源Muse的版本,但目前代码仍保留在Meta内部。这家科技巨头的股票在周三宣布后上涨了近9%,收盘时上涨6.5%至612.42美元。

"思考模式"使用并行代理编排来推高模型的上限。在该配置下,Muse Spark在人类最后考试中达到58%,在前沿科学研究中达到38%——这使其能够与Gemini和GPT的最强版本竞争,而不是它们的标准版本。

Meta还推出了一个比较产品并直接链接到购买的购物助手,并计划在未来几周内将Muse Spark引入Facebook、Instagram和WhatsApp——遵循自Llama 3以来实施的相同方案,将其呈现给超过35亿用户。私人API预览正向精选开发者开放。

该模型在九个月内构建完成,内部代号为Avocado,Meta声称其新的预训练栈可以使用超过10倍少的计算资源达到与Llama 4 Maverick相同的能力水平。

Muse Spark在内部被描述为Muse家族中"小而快"的第一步。一个更强大的版本已在开发中。

每日简报通讯

每天以最新热门新闻开始,加上原创专题、播客、视频等更多内容。

来源: https://decrypt.co/363691/meta-muse-spark-most-capable-ai-gemini-pro-still-leads

市场机遇
HashPack 图标
HashPack实时价格 (PACK)
$0.00795
$0.00795$0.00795
-2.81%
USD
HashPack (PACK) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT$30,000 等值 PRL + 15,000 USDT

充值并交易 PRL,即可提升您的奖励!