[信达证券]电子:世界模型探索空间智能,AI复杂场景落地可期

:memo: 作者: | :date: 发布时间:Wed, 05 Mar 2025 00:00:00 GMT

电子:世界模型探索空间智能,AI复杂场景落地可期

摘要

世界模型的研究正在迅速进展,尤其在自动驾驶和机器人领域展现了巨大潜力。各大厂商如英伟达、谷歌、昆仑万维等都在积极推出世界模型,推动AI技术的前进。本文探讨了世界模型的技术进展、应用前景以及投资建议。

正文

世界模型的研究进展

世界模型的研究进展迅速,尤其在自动驾驶机器人领域展现了巨大潜力。长期以来,科学界一直渴望开发一个统一的模型,该模型可以复制其世界的基本动态,以追求通用人工智能(AGI)。世界模型的定义尚未统一,但英伟达的定义为:“世界模型是理解现实世界动态,包括其物理和空间属性的生成式AI模型。”

Sora的发布引起了广泛关注,其在理解和预测世界方面展现出一定的能力,尤其是在视频生成的一致性上表现良好。然而,Sora在像素层面的生成可能导致一些无法解释的现象,表明其并未完全理解物理世界。从技术架构上看,Sora是一种基于扩散的视频生成模型,表明扩展视频生成模型是构建物理世界通用模拟器的一条有前景的途径。

应用端机遇与挑战

随着视觉生成模型多模态大模型的进展,世界模型在自动驾驶领域受到了广泛关注。使用基于扩散的视频生成模型作为世界模型可以部分解决信息丢失和建模效率低下的问题。机器人领域的应用也是主要方向之一,世界模型让机器人在现实中处理通用任务展现出巨大前景。

传统的机器人关键组件会被建模,机器人在执行任务时无需理解世界。而当机器人被部署在新的场景中时,机器人可能会手足无措。因此,世界模型对物理世界的理解和预测能力是机器人智能化的关键利器。

**LLMs(大语言模型)**和世界模型被认为是实现通用人工智能(AGI)的可能途径之一,它们可以成为机器理解世界基本规律的起点。目前AI发展迅速,大模型正快速学习如何理解物理世界,世界模型也有望迎来快速迭代时期。

厂商角逐与技术成果

众多厂商推出了世界模型,相关领域已展开角逐。英伟达推出了Cosmos,赋能机器人和自动驾驶开发者。Cosmos世界基础模型是一套用于物理感知视频生成的开放式扩散和自回归Transformer模型,已基于2000万小时的真实世界数据训练。

李飞飞创立的World Labs,致力于构建空间智能大型世界模型(LWM),目标是将AI模型从像素的2D平面提升到完整的3D世界。World Labs仅创立了三个月,便吸引了英伟达、AMD等公司的融资,估值超过10亿美元。

谷歌旗下DeepMind推出了Genie2,性能强大且应用广泛。Genie2是一种自回归潜在扩散模型,在大型视频数据集上进行了训练。昆仑万维发布的Matrix-Zero世界模型包含两款子模型,其中3D场景生成大模型支持将用户输入的图片转化为可自由探索的真实合理的3D场景。

投资建议

无论是在北美还是国内,推理成本的降低及推理性能的迅速提升趋势非常显著。微软董事长Satya Nadella曾在法说会表示,每代硬件的性价比提高2倍以上,而由于软件优化,每代模型的性能提升10倍以上。DeepSeek卓越的性价比给人印象深刻,据Semianalysis观察,在GPT-4上同样有类似的趋势,即每过一年,算法改进和优化使得推理成本降低10倍,同时性能提升10倍。

我们认为,AI的发展目前正如火如荼地进行着,大模型不会满足于帮人类查找资料这样的小事,长期看它甚至具备改变部分行业运行逻辑的潜力。而当前伴随推理性能的提升和推理成本的降低,许多算力密集型的场景有了落地的可能,本文所探讨的世界模型便是其中一个例子。

世界模型可以帮助端侧理解并预测世界,从而产生正确的决策。从云来看,由于多模态数据的训练与推理,算力需求总体仍然呈现迅速增长的趋势;而从端来看,人形机器人自动驾驶等重要赛道有望迅速前进,以突破目前的智能化瓶颈。

相关个股

**【AI云侧】**工业富联/沪电股份/生益科技/深南电路/胜宏科技/寒武纪/海光信息
**【AI端侧】**蓝思科技/领益智造/鹏鼎控股/东山精密/乐鑫科技/瑞芯微/恒玄科技/全志科技/兆易创新/晶晨股份等

结论

世界模型的研究和发展为AI在复杂场景中的落地提供了可能。各大厂商的角逐和技术进步,使得AI的智能化进入更高的水平。投资于相关产业链的优质个股,尤其是涉及AI云侧和端侧的公司,有望在未来获得可观的回报。

风险因素

  • 宏观经济下行风险
  • 下游需求不及预期风险
  • 中美贸易摩擦加剧风险

:light_bulb: 延伸阅读
研报PDF原文链接