对话式Agent真的会执行用户指令吗？如何确保严格指令跟随？

作者： Dr.n8n 更新时间：2025-12-17 05:00:41 分类：n8n教程

“我说东它偏往西”——对话式Agent为何总“阳奉阴违”？

上周一位做跨境电商的朋友气急败坏地找我：“Dr.n8n，我花大价钱部署的客服Agent，用户明明说‘取消订单’，它却回复‘好的，已为您加速发货’！这哪是AI助手，简直是业务杀手！”

这不是个例。我在帮某母婴品牌搭建自动退货流程时也踩过坑：用户输入“只退A商品”，Agent却把整单都退了——因为它的“语义理解模块”擅自脑补了“用户可能想全退”。这种“过度智能”比愚蠢更危险。

核心矛盾：人类指令是精确坐标，而大模型输出是概率云。不加约束的Agent就像没装刹车的自动驾驶——它确实“在动”，但方向由不得你。

三道锁：让Agent从“自由发挥”变成“令行禁止”

别被“对话式”三个字骗了。真正的生产级Agent必须像瑞士钟表一样精密。我在n8n工作流里总结出三层控制体系：

第一层：指令预处理——给用户输入戴“紧箍咒”

原始用户输入必须经过结构化清洗。比如用正则表达式强制提取关键参数：

// 在n8n的Function节点中预处理
const userInput = $input.all()[0].json.message;
// 强制匹配“取消订单+订单号”格式
const orderPattern = /取消订单s*(w+)/;
const match = userInput.match(orderPattern);
if (!match) {
  throw new Error('指令格式错误：请说“取消订单 [订单号]”');
}
return { order_id: match[1] };

这就像餐厅点餐——服务员不会接受“给我来点好吃的”，必须明确到“宫保鸡丁不要花生”。

第二层：执行沙盒——用代码逻辑替代自然语言推理

永远不要让LLM直接操作数据库或API。我的做法是：让大模型输出结构化JSON，再由n8n工作流解析执行：

危险做法	安全做法
LLM直接生成SQL语句	LLM输出{action: 'cancel', order_id: 'ORD123'}
让模型决定调用哪个API	用Switch节点根据action字段路由

这相当于给Agent戴上“机械臂”——它负责识别任务类型，但具体拧螺丝还是焊接，由预设程序完成。

第三层：结果校验——设置“熔断机制”

每次执行后必须验证结果是否符合预期。我在电商项目中设置的三重校验：

参数回显：执行前向用户确认“即将取消订单ORD123，是否继续？”
影响范围检查：若单次操作涉及金额＞5000元，强制转人工
日志审计：所有指令与执行记录存入Airtable，支持事后追溯

这就像银行转账的二次确认——宁可牺牲0.1秒体验，也要杜绝百万损失。

实战案例：用n8n构建“指哪打哪”的退货Agent

以刚才的母婴品牌为例，完整工作流架构：

用户输入 → 正则清洗 → LLM结构化输出 → Switch路由 → 
→ 【取消订单】→ 调用ERP API → 发送确认短信
→ 【修改地址】→ 更新CRM → 推送物流通知
→ 【异常指令】→ 触发企业微信告警

关键技巧：在LLM节点设置严格的output schema：

{
  "type": "object",
  "properties": {
    "intent": {"enum": ["cancel_order", "modify_address", "refund"]},
    "order_id": {"type": "string", "pattern": "^ORD\d{6}$"},
    "confirm": {"type": "boolean"}
  },
  "required": ["intent", "order_id"]
}

这样即使用户说“把那个蓝色的包裹给我退了”，LLM也会被迫输出标准格式，否则触发错误处理流程。