作者: 财联社记者 黄心怡|
发布时间:2025-01-29 15:04:00
春节档AI唱主角!国产大模型密集更新
摘要
春节期间,中国大模型技术迎来了密集更新,阿里云和DeepSeek等公司发布了多款新模型,展示了AI技术的快速发展。开源与闭源路线的选择成为行业焦点,开源模型的优势逐渐显现。
正文
阿里云通义千问新模型发布
1月29日凌晨,阿里云通义千问发布了超大规模的MoE模型 Qwen2.5-Max。该模型预训练数据超过 20万亿tokens,在多个基准测试中表现优异,超越了DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o。
新模型发布后,阿里巴巴美股大涨6.76%。此外,通义千问还开源了全新的视觉模型 Qwen2.5-VL,推出 3B、7B和72B 三个尺寸版本,支持超1小时的视频理解。
DeepSeek新模型发布
1月28日,DeepSeek团队发布了两款多模态框架—— Janus-Pro 和 JanusFlow。其中,Janus-Pro在图像生成基准测试中超越了OpenAI的DALL·E 3,并继续选择开源。
开源与闭源路线之争
当下,国内外厂商在开源与闭源路线上各有侧重。OpenAI的GPT-4采用闭源模式,而Meta选择完全开源。DeepSeek和阿里云通义团队则坚持开源路线。图灵奖得主Yann LeCun认为,开源模型正在超越专有模型。
AI应用的春节比拼
春节期间,AI应用成为厂商比拼的焦点。百度智能云推出了“飞帖贺新春”微信小程序,阿里云则为央视春晚提供了云计算和AI技术支持,宇树科技的人形机器人H1在春晚上表演秧歌,展示了AI驱动的运动控制技术。
8K超高清技术支持
今年是央视第四次开展8K春晚直播,“8K超高清+三维菁彩声” 公共信号全部采用国产装备完成制作。科创板上市公司当虹科技提供了技术支持,通过“百城千屏”超高清传播平台,将8K画面呈现在全国上百个城市、近千块公共大屏。
结论
春节期间,国产大模型的密集更新展示了AI技术的快速发展,开源模型的优势逐渐显现。开源与闭源路线的选择成为行业焦点,云基础设施厂商有望受益于此次开源的胜利。AI应用在春节档的广泛应用,进一步推动了AI技术的普及和创新。![]()
延伸阅读
原文链接