作者: |
发布时间:Sat, 18 Apr 2026 16:00:00 GMT
【东吴证券】端侧AI周跟踪:多模态能力持续深化,系统级任务执行加速落地
核心摘要
端侧AI生态正经历快速催化,开源模型(如Gemma)与终端大厂共同驱动渗透率加速。当前端侧AI已从技术验证阶段迈向用户规模化渗透初期。产品演进主线清晰:多模态能力深化与系统级任务执行成为核心竞争点,AI正从“对话窗口”转型为“系统级分发入口”。
正文分析
1. 生态催化:开源模型与终端厂商共振 
- 模型热度: Google Gemma系列表现强劲。Gemma 2(原注首周)下载量突破 1,000万次,全系累计下载量超过 5亿次。开源端侧模型生态已具备规模化基础,支持在iPhone、Mac及Android本地运行视觉理解、代码生成及Agent工作流。
- 厂商驱动: 三星更新 Try Galaxy 应用(适配Galaxy S24系列等),允许非三星用户通过模拟体验AI功能。
- 核心功能: 隐私显示屏、夜视视频增强、AI图像编辑、AI创意工作室。
- 战略意义: 通过“无设备体验入口”扩大用户触达,降低AI感知门槛。
2. 厂商动态:多模态输入与系统级联动 
新一代手机AI功能重点向高频生活场景延伸,强化AI作为系统入口的角色:
苹果 (Apple Intelligence):
- 根据后端代码解析,未来或新增多项端侧功能:扫描营养标签录入健康App、自动生成联系人、生成Wallet通行证、浏览器标签智能命名等。
华为 (Pura系列):
- 推出**“AI姿势建议”功能。体现了AI在影像场景的深化:从单纯的画质优化,延伸至拍摄过程的智能辅助**。
摩托罗拉 (Moto G Stylus):
- 售价 499美元 的中端机型集成AI触控笔功能,包括**“草图转图像”及“手写计算器”**。
- 结论: AI功能正从旗舰机向中端价格带渗透,用户基数将快速扩大。
3. 演进逻辑:从对话式交互向任务执行对齐 
端侧AI的演进存在两条核心主线:
- 多模态是迭代重点: 终端设备拥有摄像头、麦克风等天然入口。拍照建议、手写识别等功能证明多模态能力能更直接对接真实场景。
- 系统级融合的轻量级生产力: 优先落地的功能(联系人录入、票据管理等)对响应速度、隐私保护、系统调用要求极高,这正是端侧模型的天然优势。
研究结论
- 核心竞争力: 端侧模型的核心价值不仅在于参数大小,而在于能否与操作系统、原生应用和硬件入口形成深层次融合,成为系统级任务分发与执行的核心。
- 发展趋势: AI正从单纯的“云端助手”转变为**“系统级入口”**,实现跨应用的自动化处理。
风险提示:
- 技术创新进度不及预期风险;
- 终端市场消费需求不足风险;
- 宏观经济波动环境风险。
延伸阅读
研报PDF原文链接