LangChain Agent 能处理多轮对话吗？上下文如何保持连贯？

作者： Dr.n8n 更新时间：2025-12-11 15:00:41 分类：n8n教程

“刚聊完优惠券，它怎么又问我买什么？”——多轮对话断裂是AI Agent的通病

你有没有遇到过这样的场景：客户前一句还在问“你们七夕活动有满减吗？”，你刚回复完规则，下一句AI就冷不丁蹦出“欢迎光临，请问您需要什么帮助？”——仿佛前一秒的记忆被格式化了。这不是Bug，而是绝大多数LangChain新手在搭建Agent时踩的第一个大坑：上下文丢失。

我在帮某母婴电商客户搭建自动客服Agent时，初期测试阶段客服机器人平均每3轮对话就会“失忆”一次，导致转化率暴跌40%。问题根源不是模型不行，而是我们没教会它“记笔记”。

LangChain Agent 的“记忆机制”本质：不是魔法，是工程

很多人误以为LangChain自带“长记忆”，其实不然。默认情况下，每次调用Agent都是无状态的独立请求，就像每次进店都换了个新店员——他根本不记得你上回买了奶粉还是纸尿裤。

要实现连贯对话，核心在于两个字：状态管理。你可以把它想象成餐厅服务员随身携带的“点菜单”：每和顾客说一句话，就在小本本上记一笔，下次开口前先翻翻记录。

实战教学：三步让Agent拥有“长期记忆”

下面我以电商客服场景为例，手把手教你配置一个能记住用户购物车、历史咨询记录的对话Agent。代码基于Python + LangChain最新版（v0.1+）。

第一步：选择合适的Memory类型

LangChain提供多种Memory模块，新手推荐从ConversationBufferMemory开始：

from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory(
    memory_key="chat_history",  # 存储对话历史的键名
    return_messages=True        # 返回Message对象而非纯文本
)

这个相当于给Agent配了个“聊天记录本”，但注意：它只在单次会话中有效，重启程序就清空。适合Web应用的Session级记忆。

第二步：把Memory“焊”进Agent

创建Agent时，通过memory参数注入记忆能力：

from langchain.agents import create_openai_tools_agent
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一个母婴用品专家..."),
    MessagesPlaceholder("chat_history"),  # 关键！插入历史对话占位符
    ("human", "{input}"),
    MessagesPlaceholder("agent_scratchpad")
])

agent = create_openai_tools_agent(
    llm=your_llm,
    tools=your_tools,
    prompt=prompt,
    memory=memory  # 注入记忆模块
)

这里的关键是MessagesPlaceholder("chat_history")——它告诉LLM：“请参考这段历史记录再回答”。

第三步：持久化存储（可选但强烈推荐）

如果想跨会话记住用户（比如明天登录还能接着聊），需要用RedisChatMessageHistory或数据库：

from langchain_community.chat_message_histories import RedisChatMessageHistory

message_history = RedisChatMessageHistory(
    session_id="user_123",  # 用户唯一标识
    url="redis://localhost:6379"
)

memory = ConversationBufferMemory(
    chat_memory=message_history,
    memory_key="chat_history",
    return_messages=True
)

进阶技巧：用“摘要记忆”对抗Token爆炸

当对话超过20轮，原始记录会撑爆LLM的Token上限。这时候需要ConversationSummaryMemory——它像会议纪要秘书，自动把长对话压缩成关键摘要：

from langchain.memory import ConversationSummaryMemory

memory = ConversationSummaryMemory(
    llm=your_llm,  # 用于生成摘要的模型
    memory_key="chat_history"
)

实测在客服场景中，摘要记忆能让Token消耗降低70%，同时保持90%以上的上下文准确率。