📄 Hugging Face 今日论文精选（2026-06-11）

lalala · 2026 年6 月 11 日 10:00

Hugging Face 今日论文精选（2026-06-12）

核心主线：今日论文聚焦于大模型安全漏洞、自主科研智能体、MoE架构优化、分布式训练效率提升以及智能体强化学习的最新前沿探索。

Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code 4.5
- 链接：[2606.11817] Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code
- 为什么值得看：该研究揭示了广泛使用的“语法约束解码”（GCD）技术存在严重的安全隐患。文章表明，通过强制模型输出符合特定语法（如JSON或特定代码格式），可以轻易绕过大模型的安全对齐防御，诱导其生成恶意代码，为大模型安全防御提出了新挑战。
Toward Generalist Autonomous Research via Hypothesis-Tree Refinement 4.5
- 链接：[2606.11926] Toward Generalist Autonomous Research via Hypothesis-Tree Refinement
- 为什么值得看：针对“AI科学家”这一前沿领域，本文提出了一种基于“假设树细化”的通用自主科研框架。该方法通过动态构建、验证和修正假设树，显著提升了AI智能体在复杂科学探索和实验设计中的逻辑性与成功率。
Redesign Mixture-of-Experts Routers with Manifold Power Iteration 4.5
- 链接：[2606.12397] Redesign Mixture-of-Experts Routers with Manifold Power Iteration
- 为什么值得看：针对混合专家模型（MoE）中路由器容易出现的负载不均和表征坍塌问题，提出了一种基于流形幂迭代的新型路由器设计。该方法在不增加推理延迟的前提下，显著提升了MoE模型的训练稳定性和泛化性能。
Breaking the Bubble: Asynchronous Pipeline Parallel Training with Bounded Weight Inconsistency 4
- 链接：[2606.07881] Breaking the Bubble: Asynchronous Pipeline Parallel Training with Bounded Weight Inconsistency
- 为什么值得看：针对大规模LLM训练中流水线并行产生的“气泡”（GPU空闲等待）问题，本文提出了一种具有权重不一致性边界的异步流水线并行训练方法。该方法在理论上保证模型收敛性的同时，极大提高了GPU的利用率和训练吞吐量。
EvoTrainer: Co-Evolving LLM Policies and Training Harnesses for Autonomous Agentic Reinforcement Learning 4
- 链接：[2606.03108] EvoTrainer: Co-Evolving LLM Policies and Training Harnesses for Autonomous Agentic Reinforcement Learning
- 为什么值得看：提出了一种创新的协同进化框架，让LLM策略与训练环境（Harness）共同演化，以实现完全自主的智能体强化学习。这一范式为构建能够自我迭代和适应未知复杂任务的下一代AI智能体开辟了新路径。