2026年5月15日 12 個節點 #LLMAgents#AgentDesignPatterns#AgenticAI#MultiAgent#Orchestration#GraphBit#GAIA

LLM 代理設計模式

arXiv:2605.13850 從 7 個認知軸 × 6 個執行拓撲體系化出 27 種代理設計模式，並給出 5 條選擇經驗法則。GraphBit（arXiv:2605.13848）用 DAG＋Rust 引擎方案在 GAIA 上達到 67.6%——提升 14.7pp 且幻覺率 0%。

完整簡報

arXiv:2605.13850 將 LLM 代理設計體系化為「7 個認知功能軸 × 6 個執行拓撲軸」的矩陣，歸納出 27 種命名模式。此分類法首次提出「何時該用哪種模式」的 5 條經驗法則。同期發表的 arXiv:2605.13848（GraphBit）把這套框架落實到真實系統，在 GAIA 基準上達到 67.6%。

7 個認知功能軸

代理認知的維度

此框架把代理的認知能力拆解為 7 個軸：(1) 感知（Perception）：如何處理輸入；(2) 記憶（Memory）：維持脈絡的策略；(3) 規劃（Planning）：如何拆解任務；(4) 推理（Reasoning）：邏輯與推論模式；(5) 執行（Execution）：如何使用工具；(6) 學習（Learning）：如何整合經驗；(7) 溝通（Communication）：代理之間的資訊交換。這 7 個軸的組合決定了代理的「認知輪廓」。

記憶的三層結構

In-context · 外部 · 情景

記憶軸以三個層級實作。(1) 脈絡內（In-context）：直接保留在 LLM 的脈絡視窗中——速度快但容量有限。(2) 外部：向量資料庫、圖資料庫、KV 儲存——容量大但檢索有延遲。(3) 情景式（Episodic）：保存過往任務歷史與成敗模式——支援長期學習。GraphBit 把這三層全部實作，消除了長時任務中的脈絡遺失。

ReAct 模式

推理與行動交替

ReAct 是經過最充分驗證的推理模式：循環執行思考（Thought）→行動（Action）→觀察（Observation）。優點：中間推理過程透明、便於除錯。缺點：步數越多，成本與延遲線性上升。Plan-and-Execute 則先擬定完整計畫再執行——利於並行化，但計畫修訂的彈性較低。

6 個執行拓撲軸

代理如何連接

代理系統的執行結構沿 6 個軸分類：(1) 單/多代理；(2) 集中式/分散式控制；(3) 同步/非同步執行；(4) 固定/動態角色分配；(5) 串行/並行任務執行；(6) 信任/驗證的升級路徑。這 6 個軸的組合決定了代理的「拓撲」，而 7×6 矩陣生成 27 種獨有模式。

監督者-工作者模式

採用最廣的拓撲

採用最廣泛的多代理拓撲。監督者（協調者）拆解任務並分派給工作者（Worker）代理，每個工作者擁有專屬的工具與脈絡。優點：角色分離、並行執行、故障隔離。缺點：監督者構成單點故障，以及工作者之間共享脈絡的開銷。LangGraph 的預設結構就是這一模式。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

DAG 執行引擎

GraphBit 的核心創新

GraphBit（arXiv:2605.13848）將任務執行圖表示為 DAG（有向無環圖），並用 Rust 引擎執行。DAG 結構的優點：基於依賴的並行執行、確定性的執行路徑、失敗後可局部重跑。Rust 引擎：記憶體安全＋高效能。結果：GAIA 67.6%（+14.7pp），幻覺率 0%。相較於既有的 Python 代理框架，其執行可靠性在結構上截然不同。

GAIA 67.6%

+14.7pp · 幻覺率 0%

GAIA（General AI Assistant）是一項在真實世界任務上評估 AI 代理的基準，涵蓋網頁搜尋、檔案操作、程式碼執行與多步推理。GraphBit 的 67.6% 相較先前 SOTA 提升 14.7pp，而幻覺率 0% 源於 DAG 結構切斷了不確定的推理路徑。現實意義：GAIA 等級的任務完成率，正成為生產級代理的可靠性標桿。

5 條經驗法則

選擇模式的標準

arXiv:2605.13850 歸納的模式選擇 5 條經驗法則：(1) 時間預算——逾時視窗短就用簡單模式；(2) 權限——高權限任務必須配置驗證升級；(3) 失敗成本——不可逆操作需人在迴路（human-in-the-loop）；(4) 吞吐量——高吞吐需求採用並行拓撲；(5) 不確定性——高不確定性採用迭代精練模式。這些法則代表一次典範轉移：不再問「GPT-4 能不能做」，而是問「哪種結構匹配這一風險輪廓」。

人在迴路

當失敗成本很高時

這是 5 條法則中「失敗成本」法則的落地：不可逆操作（寄送郵件、付款、部署程式碼、刪除檔案）不由代理自主執行，而是請求人工確認。實作模式：偵測到低於信任閾值的決策 → 連同脈絡呈現給人工 → 獲准後再繼續。缺少這一模式的代理，根本無法部署到生產環境。

框架選型指南

LangGraph · CrewAI · Anthropic SDK

把分類法套到實際選型上：(1) 基於狀態機的複雜工作流 → LangGraph；(2) 基於角色的多代理 → CrewAI；(3) 單代理工具呼叫 → 直接用 Anthropic Tool Use API；(4) 基於 DAG 的高可靠生產 → 參考 GraphBit 架構；(5) 快速原型 → LangChain Agents。框架選型應當是拓撲選型的結果——絕不能本末倒置。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

代理 AI 工程師

新興職位需求

理解 27 種模式與 5 條選擇法則的工程師，是 2026 年最搶手的 AI 專精方向。聊天機器人實作者與代理系統工程師的區別：前者呼叫模型，後者設計可靠完成任務的結構。工具設計品質＞提示詞品質——代理所用工具的 schema，決定了代理的表現。

LLM 代理設計模式

完整簡報

🧠7 個認知功能軸

🗂️記憶的三層結構

🔍ReAct 模式

🌐6 個執行拓撲軸

👥監督者-工作者模式

🔄DAG 執行引擎

📊GAIA 67.6%

⚖️5 條經驗法則

🛡️人在迴路

🔧框架選型指南

📐代理 AI 工程師

來源與相關