2026年5月15日 12 個節點 #LLMAgents#AgentDesignPatterns#AgenticAI#MultiAgent#Orchestration#GraphBit#GAIA
LLM 代理設計模式
arXiv:2605.13850 從 7 個認知軸 × 6 個執行拓撲體系化出 27 種代理設計模式,並給出 5 條選擇經驗法則。GraphBit(arXiv:2605.13848)用 DAG+Rust 引擎方案在 GAIA 上達到 67.6%——提升 14.7pp 且幻覺率 0%。
完整簡報
arXiv:2605.13850 將 LLM 代理設計體系化為「7 個認知功能軸 × 6 個執行拓撲軸」的矩陣,歸納出 27 種命名模式。此分類法首次提出「何時該用哪種模式」的 5 條經驗法則。同期發表的 arXiv:2605.13848(GraphBit)把這套框架落實到真實系統,在 GAIA 基準上達到 67.6%。
7 個認知功能軸
代理認知的維度
此框架把代理的認知能力拆解為 7 個軸:(1) 感知(Perception):如何處理輸入;(2) 記憶(Memory):維持脈絡的策略;(3) 規劃(Planning):如何拆解任務;(4) 推理(Reasoning):邏輯與推論模式;(5) 執行(Execution):如何使用工具;(6) 學習(Learning):如何整合經驗;(7) 溝通(Communication):代理之間的資訊交換。這 7 個軸的組合決定了代理的「認知輪廓」。
記憶的三層結構
In-context · 外部 · 情景
記憶軸以三個層級實作。(1) 脈絡內(In-context):直接保留在 LLM 的脈絡視窗中——速度快但容量有限。(2) 外部:向量資料庫、圖資料庫、KV 儲存——容量大但檢索有延遲。(3) 情景式(Episodic):保存過往任務歷史與成敗模式——支援長期學習。GraphBit 把這三層全部實作,消除了長時任務中的脈絡遺失。
ReAct 模式
推理與行動交替
ReAct 是經過最充分驗證的推理模式:循環執行思考(Thought)→行動(Action)→觀察(Observation)。優點:中間推理過程透明、便於除錯。缺點:步數越多,成本與延遲線性上升。Plan-and-Execute 則先擬定完整計畫再執行——利於並行化,但計畫修訂的彈性較低。
6 個執行拓撲軸
代理如何連接
代理系統的執行結構沿 6 個軸分類:(1) 單/多代理;(2) 集中式/分散式控制;(3) 同步/非同步執行;(4) 固定/動態角色分配;(5) 串行/並行任務執行;(6) 信任/驗證的升級路徑。這 6 個軸的組合決定了代理的「拓撲」,而 7×6 矩陣生成 27 種獨有模式。
監督者-工作者模式
採用最廣的拓撲
採用最廣泛的多代理拓撲。監督者(協調者)拆解任務並分派給工作者(Worker)代理,每個工作者擁有專屬的工具與脈絡。優點:角色分離、並行執行、故障隔離。缺點:監督者構成單點故障,以及工作者之間共享脈絡的開銷。LangGraph 的預設結構就是這一模式。
open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-productionDAG 執行引擎
GraphBit 的核心創新
GraphBit(arXiv:2605.13848)將任務執行圖表示為 DAG(有向無環圖),並用 Rust 引擎執行。DAG 結構的優點:基於依賴的並行執行、確定性的執行路徑、失敗後可局部重跑。Rust 引擎:記憶體安全+高效能。結果:GAIA 67.6%(+14.7pp),幻覺率 0%。相較於既有的 Python 代理框架,其執行可靠性在結構上截然不同。
GAIA 67.6%
+14.7pp · 幻覺率 0%
GAIA(General AI Assistant)是一項在真實世界任務上評估 AI 代理的基準,涵蓋網頁搜尋、檔案操作、程式碼執行與多步推理。GraphBit 的 67.6% 相較先前 SOTA 提升 14.7pp,而幻覺率 0% 源於 DAG 結構切斷了不確定的推理路徑。現實意義:GAIA 等級的任務完成率,正成為生產級代理的可靠性標桿。
5 條經驗法則
選擇模式的標準
arXiv:2605.13850 歸納的模式選擇 5 條經驗法則:(1) 時間預算——逾時視窗短就用簡單模式;(2) 權限——高權限任務必須配置驗證升級;(3) 失敗成本——不可逆操作需人在迴路(human-in-the-loop);(4) 吞吐量——高吞吐需求採用並行拓撲;(5) 不確定性——高不確定性採用迭代精練模式。這些法則代表一次典範轉移:不再問「GPT-4 能不能做」,而是問「哪種結構匹配這一風險輪廓」。
人在迴路
當失敗成本很高時
這是 5 條法則中「失敗成本」法則的落地:不可逆操作(寄送郵件、付款、部署程式碼、刪除檔案)不由代理自主執行,而是請求人工確認。實作模式:偵測到低於信任閾值的決策 → 連同脈絡呈現給人工 → 獲准後再繼續。缺少這一模式的代理,根本無法部署到生產環境。
框架選型指南
LangGraph · CrewAI · Anthropic SDK
把分類法套到實際選型上:(1) 基於狀態機的複雜工作流 → LangGraph;(2) 基於角色的多代理 → CrewAI;(3) 單代理工具呼叫 → 直接用 Anthropic Tool Use API;(4) 基於 DAG 的高可靠生產 → 參考 GraphBit 架構;(5) 快速原型 → LangChain Agents。框架選型應當是拓撲選型的結果——絕不能本末倒置。
open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production代理 AI 工程師
新興職位需求
理解 27 種模式與 5 條選擇法則的工程師,是 2026 年最搶手的 AI 專精方向。聊天機器人實作者與代理系統工程師的區別:前者呼叫模型,後者設計可靠完成任務的結構。工具設計品質 > 提示詞品質——代理所用工具的 schema,決定了代理的表現。