DeepSeek深夜发布多模态大模型图像性能跑分力压OpenAI竞品

yfc · 2025 年1 月 27 日 20:02

作者：财联社史正丞| 发布时间：2025-01-28 03:51:56

DeepSeek发布多模态大模型Janus-Pro，图像性能超越OpenAI竞品

在除夕凌晨，中国公司DeepSeek发布了新一代多模态大模型Janus-Pro，该模型在图像生成基准测试中表现优异，超越了OpenAI的DALL-E 3模型。Janus-Pro不仅具备在消费级电脑上本地运行的潜力，还采用了新颖的自回归框架，统一了多模态理解和生成。

在华尔街紧张评估“DeepSeek风暴”之际，DeepSeek公司再度推出新品：Janus-Pro多模态大模型。该模型在图像生成基准测试中超越了OpenAI的DALL-E 3，并且同样开源。

Janus-Pro 7B和1.5B模型是对去年10月发布的Janus模型的升级，参数量分别为15亿和70亿，具备在消费级电脑上本地运行的潜力。Janus-Pro采用MIT许可证，在商用方面没有限制。

Janus-Pro采用了一种新颖的自回归框架，统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径，解决了以往方法的局限性，提升了框架的灵活性。

从报告给出的“跑分”数据来看，在部分文生图基准测试中，Janus-Pro 70亿参数模型表现好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。

技术报告显示，Janus-Pro通过添加7200万张高质量合成图像，使得在统一预训练阶段真实数据与合成数据的比例达到1：1，实现“更具视觉吸引力和稳定性的图像输出”。在多模态理解的训练数据方面，新模型参考了DeepSeek VL2并增加了大约9000万个样本。

作为一个多模态模型，Janus-Pro不仅可以“文生图”，同样也能对图片进行描述，识别地标景点（例如杭州的西湖），识别图像中的文字，并能对图片中的知识（例如下图中的“猫和老鼠”蛋糕）进行介绍。

DeepSeek的Janus-Pro模型在图像生成性能上展现了强大的竞争力，不仅在技术上有创新，还在多模态理解与生成方面表现出色。随着该模型的开源，预计将在未来推动多模态AI技术的发展。

**图片来源：**技术报告

延伸阅读
原文链接

话题	回复	浏览量
[上海证券]通信：25年度春节期间AI新闻信息汇总-DeepSeek引领效率模型潮流，中美AI竞赛提速热门研报	5	2025 年2 月 7 日
春节档AI唱主角！国产大模型密集更新 A股题材逻辑	4	2025 年1 月 29 日
[华福证券]计算机行业定期报告：大模型硝烟再起，DeepSeek、通义千问、Google、OpenAI先后迎来更新热门研报	2	2025 年3 月 30 日
[东莞证券]半导体行业事件点评：deepseek大模型实现训练降本，有望加快AI应用场景落地热门研报	7	2025 年2 月 5 日
[太平洋]计算机行业周报：AI国产化趋势延续热门研报	3	2025 年3 月 17 日