函数调用 vs 明确指令：何时让 Agent 自主，何时强约束

作者： Dr.n8n 更新时间：2025-10-13 16:28:24 分类：Agent

许多团队在把 LLM 接入 n8n 时，都会在「多变现实 vs. 稳定交付」之间拉扯：要不要让 Agent 自行探索？又如何把风险、成本与合规压住？工程上，一味放开或一味收紧都会碰壁，关键在于明确边界、可观测与可回滚。

是什么：两种控制范式与中间地带

自治模式（Goal-seeking）：给定目标与工具权限，Agent 自行规划与迭代；适合开放探索、信息不完备、路径不确定的场景。

优点：覆盖面广，能在未知空间里试错收敛。
风险：费用不确定、越权操作、不可重复性。

约束模式（Policy-driven）：以规则、模板与预设流程为主，Agent 只在护栏内填空或选择；适合高一致性、强 SLA 与强合规。

优点：稳定、可审计、成本可控。
代价：对变化适应慢，易出现「卡死于边界」的问题。

护栏内自治（Hybrid）：先以策略圈定空间，再让 Agent 在圈内自主规划；以评测与回退机制保证结果。

维度	自治模式	约束模式	护栏内自治
目标清晰度	模糊可行	需明确	中等
环境稳定性	低也可	高更好	中等
成本可控性	弱	强	中等
可观察性	需额外建设	天然较强	中等偏强
合规/审计	需补充	强	可强化

为什么：边界、价值与风险的平衡

业务价值：开放问题（如竞品洞察）更适合自治；强流程（如报销审核）更适合约束。
组织成熟度：有 SRE/数据治理/灰度体系的团队，更能驾驭自治；否则先从约束起步。
可观测与回滚：凡是不可观测的自治，等于「黑箱押注」。必须先把日志、轨迹与撤销通路打通。

怎么做：在 n8n 的工程落地

总体思路：先建「策略-工具-评测」三层，再以工作流编排联通人机与外部系统。

策略层（Policy）：把角色、权限、预算、重试与停机条件写成结构化变量（JSON/环境变量）。
工具层（Tools）：只暴露最小可用集合（HTTP 请求、数据库、搜索、文档读取等），并加参数白名单与节流。
评测层（Evaluator）：对每轮行动输出「证据、评分、信心、成本」四元组，超阈值才允许提交。
人机联动：在关键节点设置「人工确认」分支，超时自动走安全默认值。
可观测：为每一步打 traceId，汇总到日志/BI；异常走「补偿交易」或「反向调用」。

下面给出一个在 n8n 的最小原型骨架（以护栏内自治为例）。

// Function 节点：装载策略与上下文 const policy = { maxSteps: 8, budgetUSD: 0.8, allowTools: ["http:getSearch","db:read","docs:retrieve"], requireEvidence: true, stopOn: ["low_confidence","policy_violation"] }; return [{ json: { policy, goal: $json.goal, traceId: $json.traceId } }];

// Agent Planner（LLM）节点：生成下一步行动（受 policy 约束）
// 产物：{tool, params, rationale}

// IF 节点：工具白名单 + 预算控制 const { tool, params, cost } = $json.action; if (!policy.allowTools.includes(tool)) { return [{json:{error:"policy_violation", detail:"tool_not_allowed"}}]; } if (($json.costSoFar || 0) + cost > policy.budgetUSD) { return [{json:{error:"budget_exceeded"}}]; } return $input.all();

// HTTP Request / DB / Docs 节点：实际执行 // ……（各工具节点按需配置，参数取自 params） // Evaluator（LLM 或规则）节点：对证据打分 // 输出：{score, confidence, critique, costDelta} // IF 节点：低置信度则回到 Planner 重试（步数+1），或走人工确认

落地清单（Rubric）：

所有外呼都记录 traceId、输入哈希与输出摘要；敏感字段脱敏。
每轮动作必须给出可验证「证据」：如 URL、文档片段、SQL 结果摘要。
成本与步数双阈值；越界则回退到上个安全快照。
关键操作（下单/转账/发信）前置人工确认或双人复核。

运行策略矩阵：

场景	推荐策略	必要护栏	可选增强
市场调研	护栏内自治	预算/来源白名单	多代理交叉验证
客服回复	约束模式	模板库/语气与合规检查	低信心转人工
数据清洗	约束模式	字段级校验/取样回放	自动回滚
运营增长实验	护栏内自治	曝光/频控/黑名单	离线评测 + A/B