Hugging Face 今日论文精选(2026-06-12)
核心主线:今日论文聚焦于大模型安全漏洞、自主科研智能体、MoE架构优化、分布式训练效率提升以及智能体强化学习的最新前沿探索。
-
Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code
4.5- 链接:[2606.11817] Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code
- 为什么值得看:该研究揭示了广泛使用的“语法约束解码”(GCD)技术存在严重的安全隐患。文章表明,通过强制模型输出符合特定语法(如JSON或特定代码格式),可以轻易绕过大模型的安全对齐防御,诱导其生成恶意代码,为大模型安全防御提出了新挑战。
-
Toward Generalist Autonomous Research via Hypothesis-Tree Refinement
4.5- 链接:[2606.11926] Toward Generalist Autonomous Research via Hypothesis-Tree Refinement
- 为什么值得看:针对“AI科学家”这一前沿领域,本文提出了一种基于“假设树细化”的通用自主科研框架。该方法通过动态构建、验证和修正假设树,显著提升了AI智能体在复杂科学探索和实验设计中的逻辑性与成功率。
-
Redesign Mixture-of-Experts Routers with Manifold Power Iteration
4.5- 链接:[2606.12397] Redesign Mixture-of-Experts Routers with Manifold Power Iteration
- 为什么值得看:针对混合专家模型(MoE)中路由器容易出现的负载不均和表征坍塌问题,提出了一种基于流形幂迭代的新型路由器设计。该方法在不增加推理延迟的前提下,显著提升了MoE模型的训练稳定性和泛化性能。
-
Breaking the Bubble: Asynchronous Pipeline Parallel Training with Bounded Weight Inconsistency
4- 链接:[2606.07881] Breaking the Bubble: Asynchronous Pipeline Parallel Training with Bounded Weight Inconsistency
- 为什么值得看:针对大规模LLM训练中流水线并行产生的“气泡”(GPU空闲等待)问题,本文提出了一种具有权重不一致性边界的异步流水线并行训练方法。该方法在理论上保证模型收敛性的同时,极大提高了GPU的利用率和训练吞吐量。
-
EvoTrainer: Co-Evolving LLM Policies and Training Harnesses for Autonomous Agentic Reinforcement Learning
4- 链接:[2606.03108] EvoTrainer: Co-Evolving LLM Policies and Training Harnesses for Autonomous Agentic Reinforcement Learning
- 为什么值得看:提出了一种创新的协同进化框架,让LLM策略与训练环境(Harness)共同演化,以实现完全自主的智能体强化学习。这一范式为构建能够自我迭代和适应未知复杂任务的下一代AI智能体开辟了新路径。