LangGraph Memory记忆系统：告别"金鱼脑"

发表于2026-02-19|更新于2026-04-29|技术系列LangGraph

|浏览量:

LangGraph Memory记忆系统：告别”金鱼脑”

你有没有遇到过这种情况：跟AI助手聊了半天，它突然忘了你叫啥？这就是典型的”金鱼脑”——七秒记忆，刚说完就忘。

今天咱们来聊聊 LangGraph 的 Memory 记忆系统，让你的 AI Agent 真正拥有”记性”。

引言：为什么需要记忆？

想象一下你走进一家咖啡店，店员问你要喝什么。你说：”来杯拿铁，少糖。”店员记下了。你又说：”哦对了，用燕麦奶。”店员点头。接着你补充：”还有，我叫小明，是老顾客了，上次存的积分记得用上。”

如果这位店员是个”金鱼脑”，会发生什么？

你刚说完燕麦奶，他就忘了你要的是拿铁
你说积分的时候，他问你：”您叫什么名字来着？”
等你坐下来，他又来问：”先生您要点什么？”

这就是没有记忆系统的 AI Agent 的写照。

短期记忆 vs 长期记忆

人类记忆分两种：

短期记忆（Short-term Memory）

临时保存当前对话的信息
容量有限，通常 5-9 个项目
持续几分钟到几小时
例如：记住对话中提到的名字、偏好

长期记忆（Long-term Memory）

持久保存重要信息
容量几乎无限
可以保存数天、数月甚至永久
例如：用户的名字、常用偏好、历史对话

在 AI Agent 中，这两种记忆分别对应：

记忆类型	LangGraph 实现	使用场景
短期记忆	`InMemorySaver`	开发调试、单次对话
长期记忆	`SqliteSaver` / `PostgresSaver`	生产环境、持久化存储

第一部分：InMemorySaver——开发者的”草稿纸”

什么是 InMemorySaver？

InMemorySaver 是 LangGraph 提供的最简单的记忆存储方式。顾名思义，它把记忆存在内存里。

优点：

配置简单，一行代码搞定
速度快，内存读写效率极高
不需要额外依赖

缺点：

程序重启，记忆归零
无法跨进程共享
不适合生产环境

代码示例：第一个”有记忆”的 Agent

让我们从一个最简单的例子开始——一个能记住用户偏好的助手：

from langgraph.graph import StateGraph, MessagesState, START, END
from langgraph.checkpoint.memory import InMemorySaver
from langchain_openai import ChatOpenAI

# 1. 创建记忆存储（内存版）
memory = InMemorySaver()

# 2. 初始化模型
model = ChatOpenAI(model="gpt-4o-mini")

# 3. 定义节点：调用模型
def call_model(state: MessagesState):
    response = model.invoke(state["messages"])
    return {"messages": [response]}

# 4. 构建图
builder = StateGraph(MessagesState)
builder.add_node("agent", call_model)
builder.add_edge(START, "agent")
builder.add_edge("agent", END)

# 5. 编译时加入记忆
graph = builder.compile(checkpointer=memory)

# 6. 运行对话
config = {"configurable": {"thread_id": "conversation_1"}}

# 第一轮对话
response1 = graph.invoke(
    {"messages": [{"role": "user", "content": "你好，我叫小明"}]},
    config
)
print("AI:", response1["messages"][-1].content)

# 第二轮对话（看看它还记得吗）
response2 = graph.invoke(
    {"messages": [{"role": "user", "content": "我叫什么名字？"}]},
    config
)
print("AI:", response2["messages"][-1].content)

运行结果：

1 2	AI: 你好小明！很高兴认识你。 AI: 你叫小明呀，我记得的。

见证奇迹的时刻！ 第二轮对话中，AI 没有问你”你是谁”，而是准确地记住了你叫小明。这就是记忆系统的魔力。

关键概念：thread_id

你可能注意到代码里的 thread_id="conversation_1"。这是什么意思？

thread_id 是记忆的”身份证”。每个唯一的 thread_id 对应一份独立的记忆空间。

# 用户 A 的对话
config_a = {"configurable": {"thread_id": "user_a_chat"}}

# 用户 B 的对话  
config_b = {"configurable": {"thread_id": "user_b_chat"}}

这样，用户 A 和用户 B 的记忆是隔离的，互不干扰。

可视化记忆状态

想知道当前记忆里存了什么？可以用 get_state 方法：

# 查看当前状态
state = graph.get_state(config)
print("消息历史：", len(state.values["messages"]), "条")
for msg in state.values["messages"]:
    print(f"- {msg.type}: {msg.content[:50]}...")

输出示例：

消息历史： 4 条
- human: 你好，我叫小明
- ai: 你好小明！很高兴认识你。
- human: 我叫什么名字？
- ai: 你叫小明呀，我记得的。

第二部分：SqliteSaver——轻量级持久化

为什么需要持久化？

用 InMemorySaver 开发调试没问题，但生产环境有两个致命问题：

程序重启，记忆丢失——用户明天再聊，AI 又成陌生人了
多进程无法共享——API 服务通常多个 worker，每个 worker 的记忆是独立的

解决方案：持久化存储。

SqliteSaver 登场

SqliteSaver 使用 SQLite 数据库存储记忆，解决了上述两个问题：

优点：

数据持久化，重启不丢
单文件数据库，零配置
支持多进程读写
轻量级，无需额外服务

缺点：

并发性能不如 PostgreSQL
不适合超大规模数据

代码示例：持久化的记忆

from langgraph.checkpoint.sqlite import SqliteSaver
from langgraph.graph import StateGraph, MessagesState, START, END
from langchain_openai import ChatOpenAI
import sqlite3

# 1. 创建持久化的记忆存储
conn = sqlite3.connect("chat_memory.db", check_same_thread=False)
memory = SqliteSaver(conn)

# 2. 其余代码相同
model = ChatOpenAI(model="gpt-4o-mini")

def call_model(state: MessagesState):
    response = model.invoke(state["messages"])
    return {"messages": [response]}

builder = StateGraph(MessagesState)
builder.add_node("agent", call_model)
builder.add_edge(START, "agent")
builder.add_edge("agent", END)

# 3. 编译时加入 SqliteSaver
graph = builder.compile(checkpointer=memory)

# 4. 运行对话
config = {"configurable": {"thread_id": "persistent_chat_1"}}

response = graph.invoke(
    {"messages": [{"role": "user", "content": "记住，我的最爱是抹茶拿铁"}]},
    config
)
print("AI:", response["messages"][-1].content)

关键区别： 现在关闭程序，重新运行，AI 依然记得你的最爱是抹茶拿铁。

查看 SQLite 数据库

好奇数据是怎么存的？用命令行看看：

sqlite3 chat_memory.db ".tables"
# 输出：checkpoints

sqlite3 chat_memory.db "SELECT * FROM checkpoints;"
# 输出：thread_id, checkpoint_ns, checkpoint_id, parent_checkpoint_id, type, checkpoint, metadata

进阶：异步支持

生产环境通常使用异步，LangGraph 也提供了异步版本：

from langgraph.checkpoint.sqlite.aio import AsyncSqliteSaver

# 异步连接
async with AsyncSqliteSaver.from_conn_string("chat_memory.db") as memory:
    graph = builder.compile(checkpointer=memory)
    # ... 异步调用

第三部分：实战——认识你的”老朋友”

现在让我们做一个更实用的例子：一个能记住用户偏好的个性化助手。

场景设定

想象一个咖啡订购助手，它需要记住：

用户的名字
常点的咖啡
口味偏好（糖度、奶类）

完整代码

from langgraph.graph import StateGraph, MessagesState, START, END
from langgraph.checkpoint.sqlite import SqliteSaver
from langchain_openai import ChatOpenAI
from typing import TypedDict, Annotated
import sqlite3
import operator

# 1. 定义状态（扩展 MessagesState）
class CoffeeState(MessagesState):
    user_name: str
    favorite_coffee: str
    preferences: Annotated[list, operator.add]  # 累加偏好

# 2. 创建持久化记忆
conn = sqlite3.connect("coffee_memory.db", check_same_thread=False)
memory = SqliteSaver(conn)

# 3. 初始化模型
model = ChatOpenAI(model="gpt-4o-mini")

# 4. 定义智能节点：理解并记忆用户信息
def understand_user(state: CoffeeState):
    messages = state["messages"]
    last_message = messages[-1].content
    
    # 让 AI 分析用户输入，提取关键信息
    extraction_prompt = f"""
    分析用户的消息，提取以下信息（JSON格式）：
    - user_name: 用户的名字（如果有）
    - favorite_coffee: 提到的咖啡种类（如果有）
    - preferences: 口味偏好（如少糖、燕麦奶等，数组格式）
    
    如果某项不存在，设为 null。
    
    用户消息：{last_message}
    """
    
    extraction = model.invoke([
        {"role": "system", "content": "你是一个信息提取助手，只返回JSON。"},
        {"role": "user", "content": extraction_prompt}
    ])
    
    import json
    try:
        info = json.loads(extraction.content)
        updates = {}
        if info.get("user_name"):
            updates["user_name"] = info["user_name"]
        if info.get("favorite_coffee"):
            updates["favorite_coffee"] = info["favorite_coffee"]
        if info.get("preferences"):
            updates["preferences"] = info["preferences"]
        return updates
    except:
        return {}

# 5. 定义节点：生成回复
def generate_response(state: CoffeeState):
    user_name = state.get("user_name", "顾客")
    favorite = state.get("favorite_coffee", "")
    prefs = state.get("preferences", [])
    
    # 构建个性化提示
    system_msg = f"""你是咖啡助手。当前服务顾客：{user_name}
    已知信息：最爱{favorite if favorite else '待定'}，偏好{', '.join(prefs) if prefs else '无'}
    语气友好，可以适当提及已知信息让顾客感到亲切。"""
    
    response = model.invoke(
        [{"role": "system", "content": system_msg}] + state["messages"]
    )
    return {"messages": [response]}

# 6. 构建图
builder = StateGraph(CoffeeState)
builder.add_node("understand", understand_user)
builder.add_node("respond", generate_response)

builder.add_edge(START, "understand")
builder.add_edge("understand", "respond")
builder.add_edge("respond", END)

graph = builder.compile(checkpointer=memory)

# 7. 测试对话
config = {"configurable": {"thread_id": "coffee_lover_123"}}

print("=== 第一次对话 ===")
result = graph.invoke(
    {"messages": [{"role": "user", "content": "你好，我是张伟，喜欢喝美式"}]},
    config
)
print("AI:", result["messages"][-1].content)

print("\n=== 第二次对话（重启程序后）===")
# 模拟重启：重新加载图
conn2 = sqlite3.connect("coffee_memory.db", check_same_thread=False)
memory2 = SqliteSaver(conn2)
graph2 = builder.compile(checkpointer=memory2)

result2 = graph2.invoke(
    {"messages": [{"role": "user", "content": "今天想换换口味"}]},
    config
)
print("AI:", result2["messages"][-1].content)

print("\n=== 第三次对话 ===")
result3 = graph2.invoke(
    {"messages": [{"role": "user", "content": "加点燕麦奶"}]},
    config
)
print("AI:", result3["messages"][-1].content)

print("\n=== 第四次对话（检查是否记住所有信息）===")
result4 = graph2.invoke(
    {"messages": [{"role": "user", "content": "我是谁？我喜欢什么？"}]},
    config
)
print("AI:", result4["messages"][-1].content)

运行结果示例

=== 第一次对话 ===
AI: 你好张伟！欢迎光临，美式咖啡是个不错的选择，需要我为你准备一杯吗？

=== 第二次对话（重启程序后） ===
AI: 嗨张伟！今天想尝试点什么新口味呢？你平时最喜欢美式，要不要试试我们的冷萃或者加点风味糖浆？

=== 第三次对话 ===
AI: 没问题！美式加燕麦奶，这是个健康的搭配。需要加糖吗？

=== 第四次对话（检查是否记住所有信息） ===
AI: 你是张伟呀！你喜欢喝美式咖啡，今天还加了燕麦奶。需要我现在为你做一杯吗？

看到没有？ 即使程序重启，AI 依然记得：

你的名字是张伟
你喜欢美式咖啡
你刚刚加了燕麦奶

这就是持久化记忆的威力！

第四部分：记忆管理——什么时候该清空？

记忆不是越多越好

想象你的房间——东西越多，找东西越难。AI 的记忆也一样：

对话太长：Token 消耗增加，成本上升
信息过多：模型可能”迷失”在信息中
旧信息干扰：三年前的偏好可能不再适用

策略一：限制对话长度

def trim_messages(messages, max_count=10):
    """只保留最近 N 条消息"""
    return messages[-max_count:]

# 在节点中使用
def call_model(state: MessagesState):
    trimmed = trim_messages(state["messages"], 10)
    response = model.invoke(trimmed)
    return {"messages": [response]}

策略二：总结压缩

当对话太长时，可以总结历史，只保留关键信息：

from langchain_core.messages import SystemMessage

def summarize_history(messages):
    """将长对话总结为关键信息"""
    summary_prompt = f"""
    总结以下对话的关键信息（用户偏好、重要事实）：
    {messages}
    
    用一句话概括。
    """
    summary = model.invoke([{"role": "user", "content": summary_prompt}])
    return SystemMessage(content=f"[历史摘要] {summary.content}")

# 在合适的时候调用
if len(state["messages"]) > 20:
    summary = summarize_history(state["messages"][:15])
    new_messages = [summary] + state["messages"][15:]

策略三：清空记忆

有时候，用户就是想”重新开始”。

# 方法一：使用新的 thread_id（推荐）
new_config = {"configurable": {"thread_id": "conversation_new"}}

# 方法二：删除特定 thread 的记忆
memory.delete(thread_id="conversation_old")

策略四：定期归档

对于需要长期保存但不常访问的记忆，可以定期归档到外部存储：

def archive_old_memories(thread_id, days=30):
    """将旧记忆归档到外部存储"""
    old_state = memory.get(thread_id)
    # 保存到数据库/文件
    # 清空当前记忆

总结与下篇预告

今天学了什么？

为什么需要记忆——没有记忆的 AI 就像金鱼，七秒就忘
短期记忆 InMemorySaver——开发调试的好帮手
长期记忆 SqliteSaver——轻量级持久化方案
实战应用——记住用户偏好的咖啡助手
记忆管理——清空、限制、总结，避免记忆过载

记忆系统的选择指南

场景	推荐方案	理由
开发调试	InMemorySaver	简单快捷，零配置
单机应用	SqliteSaver	持久化，开箱即用
生产服务	PostgresSaver	高并发，可扩展
分布式系统	RedisSaver	共享状态，低延迟

下篇预告

《LangGraph 状态管理：打造复杂多轮对话 Agent》

我们将深入探讨：

如何设计复杂的状态结构
条件边（Conditional Edges）的高级用法
人机协作：Human-in-the-loop 模式
子图（Subgraphs）：模块化你的 Agent

思考题： 如果你要做一个”心理咨询师 AI”，需要记住用户的哪些信息？是越详细越好吗？欢迎在评论区讨论。

延伸阅读：

文章首发于 Channing’s AI Lab，转载请联系作者。

文章作者: Channing

文章链接: https://blog.aichanning.cn/langgraph-memory-intro/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源晨启Tech！

AI Agent LangGraph Memory 入门教程

相关推荐

AI Agent 不确定性管理：构建可靠系统的核心能力

引言：当 AI 说”我不知道”2024 年，某医疗 AI 助手将患者的”轻微头痛”诊断为”脑膜炎前兆”，导致不必要的急诊就医。同一年，某金融分析 Agent 在市场波动期间给出了截然相反的投资建议。这些事件暴露了一个被忽视的核心问题：LLM 驱动的 Agent 系统缺乏对自身不确定性的认知能力。不确定性管理（Uncertainty Management）是构建生产级 Agent 系统的关键基础设施。本文将深入探讨如何在 LangGraph 框架中实现完整的不确定性量化、校准与处理机制。一、不确定性的本质与分类1.1 认知不确定性（Epistemic Uncertainty）认知不确定性源于模型知识的局限性。当 Agent 遇到训练数据分布之外的场景时，即使输出看起来 confident，也可能是幻觉。 1234# 典型场景：超出知识边界user_query = "请分析 OpenClaw 框架的内存管理机制"# Agent 可能生成看似合理但实际错误的回答# 因为训练数据中没有 OpenClaw 的相关信息 1.2 偶然不确定性（Aleatoric Un...

LangGraph Multi-Agent：团队协作的艺术

想象一下：你让AI写一篇投资研报。它搜索了资料、分析了数据、写出了报告，但最后你发现——数据引用错了，逻辑链条断了，结论站不住脚。这时候你可能会想：如果有个专门的研究员负责搜集资料，有个专门的分析师负责数据验证，还有个专门的写手负责行文逻辑，最后还有个审核员把关质量，该多好？这就是多智能体（Multi-Agent）的核心思想：让专业的人做专业的事。一、什么时候该拆分多个Agent？在LangGraph的世界里，单个Agent就像是一个全能选手。它能思考、能调用工具、能产出结果。但当任务变得复杂时，这个”全能选手”开始力不从心。单Agent的瓶颈想象你在用ChatGPT完成一个复杂任务： 123你：帮我分析苹果公司2024年财报，预测2025年股价走势AI：（开始搜索...下载财报...分析数据...写报告...）听起来不错？但问题很快就来了：工具太多：财报分析需要搜索、下载、PDF解析、数据计算、可视化等十几种工具，Agent经常选错上下文爆炸：搜索返回的内容、PDF的原始文本、中间计算结果混在一起，Agent迷失在信息海洋里角色混乱：一会儿是研究员在搜集...

LangGraph Streaming流式输出：告别"转圈圈"

适合人群：完全不懂 LangGraph 的小白，有一定 Python 基础即可阅读时长：约 15 分钟代码难度：⭐⭐⭐☆☆ 引言：为什么需要流式输出？想象一下这个场景：你正在使用一个 AI 代码助手，输入”帮我写一个 Python 爬虫”，然后…页面就开始”转圈圈”。等了 10 秒、20 秒、30 秒，你的耐心正在消耗，开始怀疑是不是程序卡死了。终于，一大段代码”啪”地一下全部出现在屏幕上。这就是非流式输出的体验——黑盒等待 + 结果突袭。流式输出的价值：就像 ChatGPT 那样，字一个一个”蹦”出来，用户知道系统在干活，可以随时打断，体验完全不在一个维度。在 LangGraph 中，这个问题更严重。因为 LangGraph 是多步骤的 Agent 编排框架，一个请求可能要经过：意图识别节点工具调用节点数据检索节点结果生成节点如果是非流式，用户要等所有节点都执行完才能看到结果。而流式输出可以让用户：实时看到每个节点的执行状态渐进式接收 AI 生成的内容随时中断不合适的请求本文将带你从零开始，彻底掌握 LangGraph 的 Strea...

LangGraph 是什么？5分钟搞懂核心概念

LangGraph 是什么？5分钟搞懂核心概念引言：为什么需要 LangGraph？想象一下，你正在开发一个智能助手，它不仅能回答简单问题，还能帮你完成复杂的多步骤任务——比如”帮我订一张明天去上海的机票，要上午的航班，价格不超过1000元，如果没有合适的就订高铁”。这样的任务看似简单，但对AI来说却充满挑战：需要搜索航班信息需要比较价格和时段可能需要备选方案（高铁）整个过程需要记住之前的决策这就是传统 AI Agent 面临的困境：它们往往是线性的、缺乏状态管理、难以处理复杂的循环和条件分支。传统 Agent 的三大痛点痛点一：对话像金鱼一样健忘传统的 Chain（链式调用）模式就像一条金鱼，只有7秒记忆。每次调用都是独立的，前面的上下文很容易丢失。比如用户说”还是选刚才那个航班吧”，传统 Agent 可能会问：”刚才哪个航班？” 痛点二：流程僵硬，无法回头想象你在走一条单向道，一旦迈出一步就不能回头。传统 Agent 的执行流程往往是固定的：A → B → C → D。但如果 B 步骤发现信息不足，需要回到 A 重新获取呢？传统模式很难优雅地处理这种”...

LangGraph Tool Calling：让AI拥有"超能力"

LangGraph Tool Calling：让AI拥有”超能力” 本文是 LangGraph 零基础入门系列的第4篇，我们将深入探讨 LangGraph 中最强大的功能之一——Tool Calling（工具调用）。通过工具调用，你的 AI Agent 将突破语言模型的知识边界，真正拥有与现实世界交互的能力。引言：为什么需要工具？想象你正在开发一个智能助手，用户问它：”北京今天的天气怎么样？” 如果你使用的是纯语言模型，它会这样回答：”作为AI，我无法获取实时天气信息，我的知识截止到训练数据的时间点…” 多么令人沮丧的回答！这就是工具（Tool）存在的意义。工具是 AI Agent 与外部世界交互的桥梁，它们让语言模型能够： 🌤️ 获取实时信息 — 天气、股价、新闻 🔍 搜索知识库 — 查询数据库、检索文档 🧮 执行精确计算 — 数学运算、代码执行 📝 操作外部系统 — 发送邮件、创建日历事件、调用API LangGraph 的 Tool Calling 机制，本质上是一种让 LLM 自主决策何时、如何使用工具的智能编排系统。它不是简单的函数调用，而是一个完整的...

LangGraph State状态管理：Agent的'记忆系统'

LangGraph State状态管理：Agent的”记忆系统” 从零开始理解LangGraph最核心的概念——State状态管理，让你的Agent拥有真正的”记忆”。引言：为什么需要状态管理？想象一下，你和一位朋友聊天。你说：”我昨天去看了《星际穿越》。”朋友回答：”那部电影太棒了！”然后你接着问：”你觉得结局是什么意思？” 这里有个关键问题——朋友怎么知道”那部电影”指的是《星际穿越》？因为他记住了之前的对话。这就是状态管理的本质：让程序记住之前发生过的事情。无状态的痛苦让我们先看一个没有状态管理的简单”机器人”： 123456789101112131415161718192021# 一个无状态的"机器人"def simple_bot(user_input): # 每次都只处理当前输入，完全不记得之前说过什么 if "你好" in user_input: return "你好！很高兴见到你。" elif "天气" in user_input: ...

评论