LangChainAgent支持知识检索吗？上下文如何增强？

作者： Dr.n8n 更新时间：2025-12-12 04:00:41 分类：n8n教程

“问啥都答非所问？”——你的LangChain Agent可能缺了“知识检索”这味药

上周帮一个做法律咨询SaaS的朋友调试他的LangChain客服Agent，他气得拍桌子：“用户明明上传了合同条款PDF，Agent却还在瞎编‘根据一般法律原则…’——这哪是AI助手，简直是法盲！”

这问题太典型了。很多初学者以为LangChain的Agent就是个“会调用工具的大语言模型”，但忽略了它最核心的能力之一：**动态知识检索 + 上下文增强**。没有这个，你的Agent就像没带眼镜的老花眼医生——看得见病历，抓不住重点。

LangChain Agent的知识检索：不是“能不能”，而是“怎么配”

先说结论：LangChain Agent 原生支持知识检索，而且这是它的默认能力之一（通过Retrieval Tool）。但90%的人没用对，是因为他们混淆了“检索”和“记忆”的区别。

类比时间：想象你请了个私人助理。你给他一本《公司产品手册》让他回答客户提问——这不是“靠记忆力”，而是“翻书查资料”。LangChain的Retrieval就是让Agent学会“翻书”，而不是死记硬背。

核心原理就三步：

知识入库：把你的PDF/网页/数据库切块、向量化，存进向量数据库（如Chroma, Pinecone）。
动态检索：当用户提问时，Agent自动用语义搜索找出最相关的几个“知识片段”。
上下文拼装：把这些片段塞进LLM的提示词里，让它“基于这些材料回答”。

我在给电商客户做退货政策Agent时，就是靠这招把准确率从43%拉到92%——用户问“奢侈品包能退吗？”，Agent不再瞎猜，而是精准定位到知识库里《2024高端品类退货细则》第3.2条。

实战：5行代码让Agent学会“查资料”

别被“向量数据库”吓到，用LangChain+Chroma本地跑起来只要几分钟。关键代码如下（Python）：

from langchain.agents import create_openai_tools_agent
from langchain_community.vectorstores import Chroma
from langchain.retrievers import ContextualCompressionRetriever

# 1. 加载你的知识库（比如一堆PDF）
vectorstore = Chroma.from_documents(documents, embedding_model)

# 2. 创建带压缩的检索器（避免塞太多无关内容）
retriever = ContextualCompressionRetriever(
    base_compressor=compressor, 
    base_retriever=vectorstore.as_retriever()
)

# 3. 把检索器包装成Agent可用的Tool
retrieval_tool = create_retriever_tool(
    retriever, 
    "search_policy_docs", 
    "查询公司政策文档"
)

# 4. 初始化Agent时传入这个Tool
agent = create_openai_tools_agent(
    llm=your_llm, 
    tools=[retrieval_tool, ...other_tools], 
    prompt=your_prompt
)

注意那个ContextualCompressionRetriever——这是我踩过坑后强推的。不加它，Agent可能会把整本50页的PDF摘要全塞进上下文，导致LLM“信息过载”而胡言乱语。

上下文增强的三大黄金法则

光有检索还不够，怎么让Agent“聪明地用资料”？分享三个我在项目里验证过的技巧：

法则	错误做法	正确姿势
相关性过滤	返回Top 5相似段落全塞进去	用rerank模型或元数据过滤，只留最相关的1-2段
位置提示	直接粘贴文本	标注“参考来源：《XX手册》第5页”，让LLM知道引用出处
冲突检测	多个矛盾结果同时输入	前置校验逻辑，发现冲突时主动询问用户“您指的是A政策还是B政策？”

特别是最后一点——我见过太多Agent因为同时检索到“2023版”和“2024版”条款而精神分裂。加个简单的版本号校验，稳定性立马上一个台阶。