好的,我来为您总结一下:
阿里巴巴 (Alibaba) 篇
- 发布了紧凑型稠密 Qwen3-VL 模型,包括 4B 和 8B 两种尺寸,并提供 FP8 选项。
- 支持高达 1M 的上下文长度和开放词汇检测。
- 性能可与更大的模型(如 Qwen2.5-VL-72B)相媲美。
- 生态系统支持广泛,包括 MLX-VLM、LM Studio、vLLM、Kaggle models 和 Ollama Cloud。
视频 AI 篇
- Arena 增加了 Sora 2 模型,在视频基准测试中领先。
- Higgsfield Enhancer 提高了视频质量。
- Runway 推出了特定领域的工作流程应用程序,用于创意任务。
研究进展篇
- 关于 Representation Autoencoders for DiTs (RAE-DiT) 的研究表明,它可以提高扩散模型的性能。
本地训练与推理篇
- NVIDIA DGX Spark 支持强大的本地微调。
- Karpathy 的 Nanochat 提供了一个用于训练和推理的最小堆栈。
- Together AI 推出了 ATLAS,这是一种推测解码方法,在 DeepSeek-V3.1 上实现了高达 4 倍的推理速度提升。
这些进展主要集中在高效模型部署、视频 AI、本地微调和推理速度优化等方面。