2026年5月15日 12 個節點 #LLMAgents#AgentDesignPatterns#AgenticAI#MultiAgent#Orchestration#GraphBit#GAIA

LLM 代理設計模式

arXiv:2605.13850 從 7 個認知軸 × 6 個執行拓撲體系化出 27 種代理設計模式,並給出 5 條選擇經驗法則。GraphBit(arXiv:2605.13848)用 DAG+Rust 引擎方案在 GAIA 上達到 67.6%——提升 14.7pp 且幻覺率 0%。

完整簡報

arXiv:2605.13850 將 LLM 代理設計體系化為「7 個認知功能軸 × 6 個執行拓撲軸」的矩陣,歸納出 27 種命名模式。此分類法首次提出「何時該用哪種模式」的 5 條經驗法則。同期發表的 arXiv:2605.13848(GraphBit)把這套框架落實到真實系統,在 GAIA 基準上達到 67.6%。

7 個認知功能軸

代理認知的維度

此框架把代理的認知能力拆解為 7 個軸:(1) 感知(Perception):如何處理輸入;(2) 記憶(Memory):維持脈絡的策略;(3) 規劃(Planning):如何拆解任務;(4) 推理(Reasoning):邏輯與推論模式;(5) 執行(Execution):如何使用工具;(6) 學習(Learning):如何整合經驗;(7) 溝通(Communication):代理之間的資訊交換。這 7 個軸的組合決定了代理的「認知輪廓」。

記憶的三層結構

In-context · 外部 · 情景

記憶軸以三個層級實作。(1) 脈絡內(In-context):直接保留在 LLM 的脈絡視窗中——速度快但容量有限。(2) 外部:向量資料庫、圖資料庫、KV 儲存——容量大但檢索有延遲。(3) 情景式(Episodic):保存過往任務歷史與成敗模式——支援長期學習。GraphBit 把這三層全部實作,消除了長時任務中的脈絡遺失。

ReAct 模式

推理與行動交替

ReAct 是經過最充分驗證的推理模式:循環執行思考(Thought)→行動(Action)→觀察(Observation)。優點:中間推理過程透明、便於除錯。缺點:步數越多,成本與延遲線性上升。Plan-and-Execute 則先擬定完整計畫再執行——利於並行化,但計畫修訂的彈性較低。

6 個執行拓撲軸

代理如何連接

代理系統的執行結構沿 6 個軸分類:(1) 單/多代理;(2) 集中式/分散式控制;(3) 同步/非同步執行;(4) 固定/動態角色分配;(5) 串行/並行任務執行;(6) 信任/驗證的升級路徑。這 6 個軸的組合決定了代理的「拓撲」,而 7×6 矩陣生成 27 種獨有模式。

監督者-工作者模式

採用最廣的拓撲

採用最廣泛的多代理拓撲。監督者(協調者)拆解任務並分派給工作者(Worker)代理,每個工作者擁有專屬的工具與脈絡。優點:角色分離、並行執行、故障隔離。缺點:監督者構成單點故障,以及工作者之間共享脈絡的開銷。LangGraph 的預設結構就是這一模式。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

DAG 執行引擎

GraphBit 的核心創新

GraphBit(arXiv:2605.13848)將任務執行圖表示為 DAG(有向無環圖),並用 Rust 引擎執行。DAG 結構的優點:基於依賴的並行執行、確定性的執行路徑、失敗後可局部重跑。Rust 引擎:記憶體安全+高效能。結果:GAIA 67.6%(+14.7pp),幻覺率 0%。相較於既有的 Python 代理框架,其執行可靠性在結構上截然不同。

GAIA 67.6%

+14.7pp · 幻覺率 0%

GAIA(General AI Assistant)是一項在真實世界任務上評估 AI 代理的基準,涵蓋網頁搜尋、檔案操作、程式碼執行與多步推理。GraphBit 的 67.6% 相較先前 SOTA 提升 14.7pp,而幻覺率 0% 源於 DAG 結構切斷了不確定的推理路徑。現實意義:GAIA 等級的任務完成率,正成為生產級代理的可靠性標桿。

5 條經驗法則

選擇模式的標準

arXiv:2605.13850 歸納的模式選擇 5 條經驗法則:(1) 時間預算——逾時視窗短就用簡單模式;(2) 權限——高權限任務必須配置驗證升級;(3) 失敗成本——不可逆操作需人在迴路(human-in-the-loop);(4) 吞吐量——高吞吐需求採用並行拓撲;(5) 不確定性——高不確定性採用迭代精練模式。這些法則代表一次典範轉移:不再問「GPT-4 能不能做」,而是問「哪種結構匹配這一風險輪廓」。

人在迴路

當失敗成本很高時

這是 5 條法則中「失敗成本」法則的落地:不可逆操作(寄送郵件、付款、部署程式碼、刪除檔案)不由代理自主執行,而是請求人工確認。實作模式:偵測到低於信任閾值的決策 → 連同脈絡呈現給人工 → 獲准後再繼續。缺少這一模式的代理,根本無法部署到生產環境。

框架選型指南

LangGraph · CrewAI · Anthropic SDK

把分類法套到實際選型上:(1) 基於狀態機的複雜工作流 → LangGraph;(2) 基於角色的多代理 → CrewAI;(3) 單代理工具呼叫 → 直接用 Anthropic Tool Use API;(4) 基於 DAG 的高可靠生產 → 參考 GraphBit 架構;(5) 快速原型 → LangChain Agents。框架選型應當是拓撲選型的結果——絕不能本末倒置。

open_in_new startupxo.com/ko/news/2026/05/llm-agent-design-patterns-production

代理 AI 工程師

新興職位需求

理解 27 種模式與 5 條選擇法則的工程師,是 2026 年最搶手的 AI 專精方向。聊天機器人實作者與代理系統工程師的區別:前者呼叫模型,後者設計可靠完成任務的結構。工具設計品質 > 提示詞品質——代理所用工具的 schema,決定了代理的表現。

來源與相關