2026年5月15日 12 个节点 #LLMAgents#AgentDesignPatterns#AgenticAI#MultiAgent#Orchestration#GraphBit#GAIA

LLM 智能体设计模式

arXiv:2605.13850 从 7 个认知轴 × 6 个执行拓扑体系化出 27 种智能体设计模式,并给出 5 条选择经验法则。GraphBit(arXiv:2605.13848)用 DAG+Rust 引擎方案在 GAIA 上达到 67.6%——提升 14.7pp 且幻觉率 0%。

完整简报

arXiv:2605.13850 将 LLM 智能体设计体系化为「7 个认知功能轴 × 6 个执行拓扑轴」的矩阵,归纳出 27 种命名模式。该分类法首次给出了关于「何时该用哪种模式」的 5 条经验法则。与之同期发表的 arXiv:2605.13848(GraphBit)把这套框架落到真实系统,在 GAIA 基准上达到 67.6%。

7 个认知功能轴

智能体认知的维度

该框架把智能体的认知能力拆解为 7 个轴:(1) 感知(Perception):如何处理输入;(2) 记忆(Memory):维持上下文的策略;(3) 规划(Planning):如何拆解任务;(4) 推理(Reasoning):逻辑与推理模式;(5) 执行(Execution):如何使用工具;(6) 学习(Learning):如何整合经验;(7) 沟通(Communication):智能体之间的信息交换。这 7 个轴的组合决定了智能体的「认知画像」。

记忆的三层结构

In-context · 外部 · 情景

记忆轴以三个层级实现。(1) 上下文内(In-context):直接保留在 LLM 的上下文窗口中——速度快但容量有限。(2) 外部:向量数据库、图数据库、KV 存储——容量大但检索有延迟。(3) 情景式(Episodic):保存过往任务历史与成败模式——支持长期学习。GraphBit 把这三层全部实现,消除了长时任务中的上下文丢失。

ReAct 模式

推理与行动交替

ReAct 是经过最充分验证的推理模式:循环执行思考(Thought)→行动(Action)→观察(Observation)。优点:中间推理过程透明、便于调试。缺点:步数越多,成本与延迟线性上升。Plan-and-Execute 则先制定完整计划再执行——利于并行化,但计划修订的灵活性较低。

6 个执行拓扑轴

智能体如何连接

智能体系统的执行结构沿 6 个轴分类:(1) 单/多智能体;(2) 集中式/分布式控制;(3) 同步/异步执行;(4) 固定/动态角色分配;(5) 串行/并行任务执行;(6) 信任/校验的升级路径。这 6 个轴的组合决定了智能体的「拓扑」,而 7×6 矩阵生成 27 种独有模式。

监督者-工作者模式

采用最广的拓扑

采用最广泛的多智能体拓扑。监督者(编排者)拆解任务并分派给工作者(Worker)智能体,每个工作者拥有专属的工具与上下文。优点:角色分离、并行执行、故障隔离。缺点:监督者构成单点故障,以及工作者之间共享上下文的开销。LangGraph 的默认结构就是这一模式。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

DAG 执行引擎

GraphBit 的核心创新

GraphBit(arXiv:2605.13848)将任务执行图表示为 DAG(有向无环图),并用 Rust 引擎执行。DAG 结构的优点:基于依赖的并行执行、确定性的执行路径、失败后可局部重跑。Rust 引擎:内存安全+高性能。结果:GAIA 67.6%(+14.7pp),幻觉率 0%。相较于既有的 Python 智能体框架,其执行可靠性在结构上截然不同。

GAIA 67.6%

+14.7pp · 幻觉率 0%

GAIA(General AI Assistant)是一项在真实世界任务上评估 AI 智能体的基准,涵盖网页搜索、文件操作、代码执行与多步推理。GraphBit 的 67.6% 相较此前 SOTA 提升 14.7pp,而幻觉率 0% 源于 DAG 结构切断了不确定的推理路径。现实意义:GAIA 级别的任务完成率,正成为生产级智能体的可靠性标杆。

5 条经验法则

选择模式的标准

arXiv:2605.13850 归纳的模式选择 5 条经验法则:(1) 时间预算——超时窗口短就用简单模式;(2) 权限——高权限任务必须配置校验升级;(3) 失败成本——不可逆操作需人在回路(human-in-the-loop);(4) 吞吐量——高吞吐需求采用并行拓扑;(5) 不确定性——高不确定性采用迭代精化模式。这些法则代表一次范式转变:不再问「GPT-4 能不能做」,而是问「哪种结构匹配这一风险画像」。

人在回路

当失败成本很高时

这是 5 条法则中「失败成本」法则的落地:不可逆操作(发送邮件、付款、部署代码、删除文件)不由智能体自主执行,而是请求人工确认。实现模式:检测到低于信任阈值的决策 → 连同上下文呈现给人工 → 获批后再继续。缺少这一模式的智能体,根本无法部署到生产环境。

框架选型指南

LangGraph · CrewAI · Anthropic SDK

把分类法套到实际选型上:(1) 基于状态机的复杂工作流 → LangGraph;(2) 基于角色的多智能体 → CrewAI;(3) 单智能体工具调用 → 直接用 Anthropic Tool Use API;(4) 基于 DAG 的高可靠生产 → 参考 GraphBit 架构;(5) 快速原型 → LangChain Agents。框架选型应当是拓扑选型的结果——绝不能本末倒置。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

智能体 AI 工程师

新兴职位需求

理解 27 种模式与 5 条选择法则的工程师,是 2026 年最抢手的 AI 专精方向。聊天机器人实现者与智能体系统工程师的区别:前者调用模型,后者设计可靠完成任务的结构。工具设计质量 > 提示词质量——智能体所用工具的 schema,决定了智能体的表现。

来源与相关