2026年5月15日 12 个节点 #LLMAgents#AgentDesignPatterns#AgenticAI#MultiAgent#Orchestration#GraphBit#GAIA

LLM 智能体设计模式

arXiv:2605.13850 从 7 个认知轴 × 6 个执行拓扑体系化出 27 种智能体设计模式，并给出 5 条选择经验法则。GraphBit（arXiv:2605.13848）用 DAG＋Rust 引擎方案在 GAIA 上达到 67.6%——提升 14.7pp 且幻觉率 0%。

完整简报

arXiv:2605.13850 将 LLM 智能体设计体系化为「7 个认知功能轴 × 6 个执行拓扑轴」的矩阵，归纳出 27 种命名模式。该分类法首次给出了关于「何时该用哪种模式」的 5 条经验法则。与之同期发表的 arXiv:2605.13848（GraphBit）把这套框架落到真实系统，在 GAIA 基准上达到 67.6%。

7 个认知功能轴

智能体认知的维度

该框架把智能体的认知能力拆解为 7 个轴：(1) 感知（Perception）：如何处理输入；(2) 记忆（Memory）：维持上下文的策略；(3) 规划（Planning）：如何拆解任务；(4) 推理（Reasoning）：逻辑与推理模式；(5) 执行（Execution）：如何使用工具；(6) 学习（Learning）：如何整合经验；(7) 沟通（Communication）：智能体之间的信息交换。这 7 个轴的组合决定了智能体的「认知画像」。

记忆的三层结构

In-context · 外部 · 情景

记忆轴以三个层级实现。(1) 上下文内（In-context）：直接保留在 LLM 的上下文窗口中——速度快但容量有限。(2) 外部：向量数据库、图数据库、KV 存储——容量大但检索有延迟。(3) 情景式（Episodic）：保存过往任务历史与成败模式——支持长期学习。GraphBit 把这三层全部实现，消除了长时任务中的上下文丢失。

ReAct 模式

推理与行动交替

ReAct 是经过最充分验证的推理模式：循环执行思考（Thought）→行动（Action）→观察（Observation）。优点：中间推理过程透明、便于调试。缺点：步数越多，成本与延迟线性上升。Plan-and-Execute 则先制定完整计划再执行——利于并行化，但计划修订的灵活性较低。

6 个执行拓扑轴

智能体如何连接

智能体系统的执行结构沿 6 个轴分类：(1) 单/多智能体；(2) 集中式/分布式控制；(3) 同步/异步执行；(4) 固定/动态角色分配；(5) 串行/并行任务执行；(6) 信任/校验的升级路径。这 6 个轴的组合决定了智能体的「拓扑」，而 7×6 矩阵生成 27 种独有模式。

监督者-工作者模式

采用最广的拓扑

采用最广泛的多智能体拓扑。监督者（编排者）拆解任务并分派给工作者（Worker）智能体，每个工作者拥有专属的工具与上下文。优点：角色分离、并行执行、故障隔离。缺点：监督者构成单点故障，以及工作者之间共享上下文的开销。LangGraph 的默认结构就是这一模式。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

DAG 执行引擎

GraphBit 的核心创新

GraphBit（arXiv:2605.13848）将任务执行图表示为 DAG（有向无环图），并用 Rust 引擎执行。DAG 结构的优点：基于依赖的并行执行、确定性的执行路径、失败后可局部重跑。Rust 引擎：内存安全＋高性能。结果：GAIA 67.6%（+14.7pp），幻觉率 0%。相较于既有的 Python 智能体框架，其执行可靠性在结构上截然不同。

GAIA 67.6%

+14.7pp · 幻觉率 0%

GAIA（General AI Assistant）是一项在真实世界任务上评估 AI 智能体的基准，涵盖网页搜索、文件操作、代码执行与多步推理。GraphBit 的 67.6% 相较此前 SOTA 提升 14.7pp，而幻觉率 0% 源于 DAG 结构切断了不确定的推理路径。现实意义：GAIA 级别的任务完成率，正成为生产级智能体的可靠性标杆。

5 条经验法则

选择模式的标准

arXiv:2605.13850 归纳的模式选择 5 条经验法则：(1) 时间预算——超时窗口短就用简单模式；(2) 权限——高权限任务必须配置校验升级；(3) 失败成本——不可逆操作需人在回路（human-in-the-loop）；(4) 吞吐量——高吞吐需求采用并行拓扑；(5) 不确定性——高不确定性采用迭代精化模式。这些法则代表一次范式转变：不再问「GPT-4 能不能做」，而是问「哪种结构匹配这一风险画像」。

人在回路

当失败成本很高时

这是 5 条法则中「失败成本」法则的落地：不可逆操作（发送邮件、付款、部署代码、删除文件）不由智能体自主执行，而是请求人工确认。实现模式：检测到低于信任阈值的决策 → 连同上下文呈现给人工 → 获批后再继续。缺少这一模式的智能体，根本无法部署到生产环境。

框架选型指南

LangGraph · CrewAI · Anthropic SDK

把分类法套到实际选型上：(1) 基于状态机的复杂工作流 → LangGraph；(2) 基于角色的多智能体 → CrewAI；(3) 单智能体工具调用 → 直接用 Anthropic Tool Use API；(4) 基于 DAG 的高可靠生产 → 参考 GraphBit 架构；(5) 快速原型 → LangChain Agents。框架选型应当是拓扑选型的结果——绝不能本末倒置。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

智能体 AI 工程师

新兴职位需求

理解 27 种模式与 5 条选择法则的工程师，是 2026 年最抢手的 AI 专精方向。聊天机器人实现者与智能体系统工程师的区别：前者调用模型，后者设计可靠完成任务的结构。工具设计质量＞提示词质量——智能体所用工具的 schema，决定了智能体的表现。

LLM 智能体设计模式

完整简报

🧠7 个认知功能轴

🗂️记忆的三层结构

🔍ReAct 模式

🌐6 个执行拓扑轴

👥监督者-工作者模式

🔄DAG 执行引擎

📊GAIA 67.6%

⚖️5 条经验法则

🛡️人在回路

🔧框架选型指南

📐智能体 AI 工程师

来源与相关