架构
三层记忆关联架构
压缩
三阶段压缩算法 (Head + Middle + Tail = Result)
P-chain
会话链与跨会话上下文关联
快照
冻结快照与 Prompt Cache 优化
- 头部保留: 最近20条重要消息
- 中间摘要: Gemini Flash 生成(60条→5000字符)
- 尾部保留: 最新20条消息
- 目标: 100K-128K tokens
- 成本: $0.075/1M tokens
- 会话开始时加载一次
- 会话期间保持不变 → Prompt Cache
- 修改立即写磁盘,但快照不变
- 下次会话才生效
- 成本降低 90%
- parent_session_id 关联上下会话
- 压缩触发时创建新会话
- 自动命名: #2, #3, #4...
- SQL 递归查询追溯祖先
- 对话连续性不丢失
- SQLite 永久存储所有对话
- FTS5 全文索引
- session_search_tool 检索历史
- 自然语言查询: "上次讨论过的"
- Gemini Flash 摘要相关会话
对比
Claude vs Hermes 记忆策略