✨ 使用 AI 智能整理您的技术笔记、提取关键词和待办事项。立即体验 →
Technical Note

ReSum论文解读:RL中记忆压缩优化的双轨迹奖励方案

📅 2025-09-22Summary

# 个发帖

汉松 @Yonah_x

# 关注

DeepResearchAgent有一个很大的问题就是多次的搜索阅读很容易就把上下文窗口用光了,常规的做法是像ClaudeCode 一样,超过阈值就触发记忆压缩。通义的论文《ReSum》提出了一种在RL中让模型学会更好地利用压缩内容的方法。

想要查看完整笔记内容并体验 AI 智能整理功能吗?

免费注册 MeAct
ReSum论文RL记忆压缩双轨迹奖励上下文窗口优化DeepResearchAgent

提升学习效率

Memory 记录瞬间,AI 整理智慧。让每一个技术灵感都能沉淀为知识。

免费注册 MeAct