AI News 2025-11-04（周二）

huha · 2025 年11 月 4 日 06:00

好的，我来为您总结一下：

AI 领域重要进展：算力、模型、框架与工具

算力基础设施：
- OpenAI 与 AWS 达成战略合作，投资 380 亿美元部署数十万 NVIDIA GB200/GB300 芯片。
- 微软获准向阿联酋出口 NVIDIA GPU，计划投资 79 亿美元建设数据中心。
NVIDIA 活动：
- NVIDIA 和 GPU_MODE 联合发起 Blackwell B200s 上的 NVFP4 内核优化竞赛，奖品包括 DGX Spark 和 RTX 50XX GPU。
本地 LLM 服务：
- vLLM 因其本地 LLM 服务能力而备受欢迎，PewDiePie 也在使用。
开源模型进展：
- 阿里巴巴预告 Qwen3-Max-Thinking 模型在 AIME 2025 和 HMMT 基准测试中表现出色，显示了工具使用方面的推理能力提升。
- MIT 许可的 MiniMax-M2 230B MoE 模型登顶 Arena WebDev 排行榜，与 Claude Sonnet 4.5 Thinking 32k 并列。
基准测试讨论：
- OSWorld 基准测试的稳定性和任务有效性受到质疑，强调了不同提示集导致分数不具可比性。
LlamaIndex 框架：
- LlamaIndex 的 LIGHT 框架在长期记忆任务中表现出显著改进，在 10M tokens 的摘要任务中，相比原始上下文和 RAG 基线，性能提升高达 +160.6%。
Amazon 模型发布：
- Amazon 发布 Chronos-2，这是一个用于零样本预测的时间序列基础模型。
MCP 生态系统扩展：
- MCP 生态系统新增 mcp2py OAuth 集成和 Gemini Docs MCP 服务器等工具。
- Anthropic 和 Gradio 联合举办构建冲刺活动，提供大量积分和奖品。