字节发布豆包实时语音模型 国内AI应用有望迎井喷式发展

:memo: 作者: 财联社| :date: 发布时间:2025-01-21 08:02:29

字节发布豆包实时语音模型 :studio_microphone:

摘要

字节跳动即将发布最新实时语音大模型,并基于此模型全量上线豆包App的实时语音通话功能。这一技术突破有望推动国内AI应用的井喷式发展,显示字节跳动在AI领域的投入已形成正反馈。

正文

豆包App实时语音通话功能即将全量上线
豆包即将发布最新实时语音大模型,并将基于此模型全量上线豆包App实时语音通话功能。目前,豆包APP已小范围测试最新能力,部分用户在豆包App的实时通话界面已更新。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过GPT-4o。据了解,该传言提及模型即为上述实时语音模型。

技术突破:统一建模提升对话效果
最新模型通过面向语音生成和理解进行统一建模,区别于此前的ASR+LLM+TTS级联方式,在对话效果上有大幅提升,实时交互上不仅低延时,也能流畅打断。

数据增长惊人
根据火山引擎2024冬季force原动力大会披露的数据,豆包大模型的日均调用量在高速增长:

  • 2024年5月:1200亿 tokens
  • 2024年7月:5000亿 tokens
  • 2024年9月:1.3万亿 tokens
  • 2024年12月15日:突破4万亿 tokens
    在7个月的时间里增长超过33倍。

市场影响
中信证券表示,豆包大模型表现超预期,体现字节跳动在AI的投入形成正反馈,国内AI产业追赶海外的效果开始体现,国内龙头公司有望加速在AI领域的投入。

相关上市公司

  • 海天瑞声:在互动平台回复称,字节跳动一直以来是公司的重要客户,公司为其提供智能语音、计算机视觉以及自然语言等各类数据产品或服务。
  • 乐鑫科技:在投资者关系活动上表示,公司联合推广豆包大模型落地在IoT设备的相关应用方案。

结论

字节跳动的这一技术突破不仅展示了其在AI领域的强大实力,也为国内AI产业的快速发展注入了强劲动力。随着豆包大模型的广泛应用,相关上市公司也将迎来新的发展机遇。:rocket:

:light_bulb: 延伸阅读
原文链接