ByteNoteByteNote

字节笔记本

2026年5月30日

阿里巴巴新论文:让 LLM 自己管记忆,不用人写规则

API中转
¥120

LLM 的记忆管理长期依赖人工规则:设置窗口大小、按时间衰减、手动摘要。阿里巴巴的新论文提出了一种让模型自己学会管理记忆的方法。

核心思路是给模型一个"记忆读写"的工具接口。当模型需要记住某个信息时,调用写入接口保存;当需要回忆时,调用读取接口检索。写入和读取的时机、频率、优先级,都由模型自己判断,不需要人工预设规则。

实验结果表明,这种自主记忆管理比固定窗口和手动摘要的效果都好,尤其是在长对话和复杂任务场景中。模型能够根据任务需求主动保存关键信息、遗忘不相关内容,而不是被固定的上下文窗口限制。

这种方法的意义在于,它把"记忆管理"从工程问题变成了模型能力问题。不再需要工程师反复调参来优化上下文窗口,而是让模型自己学会什么该记、什么该忘。

分享: