Scholar Daily Brief · 2026-06-082026-06-08 学术摘要:8 篇重点论文,聚焦 LLM 后训练 RL、推荐排序、agentic reasoning。本次 79 篇候选 / 29 篇新论文,趋势话题 agent(15 篇 / 8 天)。