AI News 2025-10-16(周四)

好的,我来为您总结一下:

阿里巴巴 (Alibaba) 篇

  • 发布了紧凑型稠密 Qwen3-VL 模型,包括 4B 和 8B 两种尺寸,并提供 FP8 选项。
  • 支持高达 1M 的上下文长度和开放词汇检测。
  • 性能可与更大的模型(如 Qwen2.5-VL-72B)相媲美。
  • 生态系统支持广泛,包括 MLX-VLMLM StudiovLLMKaggle modelsOllama Cloud

视频 AI 篇

  • Arena 增加了 Sora 2 模型,在视频基准测试中领先。
  • Higgsfield Enhancer 提高了视频质量。
  • Runway 推出了特定领域的工作流程应用程序,用于创意任务。

研究进展篇

  • 关于 Representation Autoencoders for DiTs (RAE-DiT) 的研究表明,它可以提高扩散模型的性能。

本地训练与推理篇

  • NVIDIA DGX Spark 支持强大的本地微调。
  • KarpathyNanochat 提供了一个用于训练和推理的最小堆栈。
  • Together AI 推出了 ATLAS,这是一种推测解码方法,在 DeepSeek-V3.1 上实现了高达 4 倍的推理速度提升。

这些进展主要集中在高效模型部署、视频 AI、本地微调和推理速度优化等方面。

原文链接 not much happened today | AINews