豆包向推理算力又“砍了一刀”：新模型架构最高降本83%

yfc · 2025 年2 月 12 日 06:15

作者：科创板日报宋子乔| 发布时间：2025-02-12 14:02:52

豆包大模型推出新架构，大幅降低推理成本

字节跳动旗下的豆包大模型团队近期推出了一种全新的稀疏模型架构——UltraMem，该架构能够在保证模型效果的前提下，将推理成本最高降低83%，推理速度提升2-6倍。这一创新成果已被顶级会议ICLR 2025接收，为大模型推理效率和扩展能力问题提供了全新解决方案。

豆包概念股在午后大幅走强，其中汉得信息一度拉升封板，广和通、移远通信、润欣科技、博通集成等也纷纷大幅冲高。

UltraMem架构在保证模型效果的前提下，实现了以下突破：

随着模型规模的扩大，推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。现有的MoE和PKM架构各有局限性：

UltraMem架构参考了PKM的设计，但针对其缺陷进行了补充，实现了更高效的访存和更优质的检索，同时降低了显存和部署成本。

豆包研究团队在151M、680M、1.6B三个不同规模的模型上进行了广泛的实验。实验结果表明，UltraMem在模型效果和推理速度方面均优于MoE和PKM架构，且在680M、1.6B模型上具有显著的效果优势。

无论是训练端还是推理端，随着大模型厂商的成本降低，AI应用将在未来更加高效、易用。

推理成本大幅降低：将为AI技术在更多领域的应用提供可能，特别是对于资源受限的场景，如边缘计算和移动设备等。
用户体验优化：UltraMem架构的突破和推理速度的提升，将使AI应用如智能助手、自然语言处理等在实时应用中响应更迅速，交互更流畅，优化用户的使用体验，提高内容创作、日常办公等场景下的效率。

延伸阅读
原文链接

话题		回复	浏览量
字节豆包大模型团队提出稀疏模型架构推理成本最高可降低83% A股题材逻辑	1	12	2025 年2 月 12 日
豆包又把算力成本“打了下来” 但压力才刚刚开始 A股题材逻辑	0	6	2025 年2 月 12 日
[山西证券]计算机行业快报：UltraMem架构为推理降本，AI应用全面落地可期热门研报	0	4	2025 年2 月 18 日
豆包概念再度走强汉得信息涨停常规	0	8	2025 年2 月 12 日
[华鑫证券]计算机行业周报：豆包1.5模型发布，微信AI助手“元宝”上线热门研报	0	5	2025 年4 月 23 日