剖析 GPT :第七篇|AI 代理人的操作系統:LLM × SLM × MCP × atomic agents,如何組成一間「AI 公司」?
第七篇|AI 代理人的操作系統:LLM × SLM × MCP × atomic-agents,如何組成一間「AI 公司」?
前言:AI 的真正革命,不是更大的模型,而是「組織能力」的出現
當人們談論 AI 的未來,多半仍停留在:
-
GPT-5 會多聰明?
-
LLM 會不會成為通用智慧?
-
小模型會不會取代大模型?
這些問題,背後其實都隱含一個假設:
AI 是一顆單一、巨大的大腦。
但現實正在悄悄改變。
AI 不再是一顆腦,而是一個組織。
是一間有分工、有流程、有工具、有失敗處理的「公司」。
而這個轉變,對工程師來說,比任何模型升級都重要。
一、為什麼需要 AI Agent?從「會說話」到「會做事」
想像一個真實場景:
你是一家連鎖零售的營運長,每天需要處理:
-
上千門市的庫存
-
物流延遲
-
促銷節奏
-
供應商回應
-
例外事件(缺貨、塞港)
如果你把這一切交給單一 LLM:
它可以寫出一份完美的分析報告,
但它無法登入 ERP、不能發信、不能下單、不能更新系統。
這正是 Agentic AI 的核心價值所在:
AI 不只是提供建議,而是能替你完成任務。
而一個真正成熟的 AI 代理系統,必須具備:
-
自動抓資料
-
自動呼叫系統
-
自動執行流程
-
自動回報狀態
-
必要時請人類介入
這已經不是「模型能力」的問題,而是系統架構的問題。
二、AI 公司的組織結構:為什麼一定要拆成多層?
1️⃣ 腦部結構:LLM × SLM(決策層 vs 執行層)
LLM(CEO / Orchestrator)
-
負責抽象推理與策略規劃
-
拆解任務、產生執行計畫(plan)
-
與人類溝通、處理模糊需求
它不應該:
-
直接呼叫外部 API
-
執行大量重複任務
-
管理長時間狀態
SLM(部門主管 / Worker Agents)
-
負責單一、明確、可重複的小任務
-
反應快、成本低、可大量並行
-
適合查資料、轉換格式、驗證條件
工程上的意義很簡單:
把「思考」與「執行」拆開,
系統才有可測試性、可擴展性與可維護性。
三、atomic-agents:Agent 的「內功」——讓行為變成工程
在實作 Agent 時,很多人會遇到同一個痛點:
Prompt 能跑,但行為不穩定,debug 幾乎不可能。
atomic-agents 的定位很清楚:
它不是聊天框架,而是 Agent Engineering Framework。
它提供的是:
-
單一職責的 Agent 設計
-
結構化輸入輸出(Pydantic / Instructor)
-
可驗證、可重試、可測試的 Agent 行為
在這個架構中,atomic-agents 適合放在哪?
-
LLM Orchestrator(產生 plan)
-
SLM Worker Agents(執行小任務)
-
本地邏輯處理、資料清洗、格式轉換
你可以把它理解為:
Agent 的內功心法:不炫技,但極度扎實。
四、MCP:不是魔法,是 AI 世界的「USB 介面」
MCP(Model Context Protocol)解決的不是推理問題,而是連接問題。
在沒有 MCP 之前:
-
每個工具都要寫一次整合程式碼
-
Agent 與工具高度耦合
-
無法共用、無法替換
MCP 的工程定位非常明確:
-
標準化工具介面
-
工具發現(Tool Discovery)
-
結構化輸入輸出
-
與模型、框架解耦
就像 USB 一樣:
不管你接的是滑鼠、硬碟還是鍵盤,
只要符合規格,系統就能用。
atomic-agents vs MCP,不是競爭,而是分工
-
atomic-agents:怎麼思考、怎麼決策
-
MCP:怎麼連接外部世界
五、n8n:AI 的行動工廠與狀態機
當任務開始具備以下特性:
-
跨多個系統
-
需要等待
-
需要人類批准
-
需要補償與回退
它就不再適合由 Agent 自己處理。
這時,n8n 扮演的角色是:
-
長流程引擎
-
自動化工作流
-
人類介入(Human-in-the-loop)的承載平台
一個標準模式會是:
-
Agent 決策「該做什麼」
-
n8n 負責「怎麼一步步做完」
-
關鍵節點請人類批准
這不是限制 AI,而是讓 AI 在可控範圍內行動。
六、整合視角:一間「AI 公司」如何實際運作?
當這些角色組合起來,你會得到:
-
LLM(CEO):負責思考與規劃
-
SLM(主管 / 工人):負責執行與產出
-
atomic-agents:確保行為可預測、可工程化
-
MCP:連接資料庫、API、工具
-
n8n:處理長流程與人類介入
這不再是聊天機器人。
這是一個:
-
能被拆 ticket
-
能被 code review
-
能被 debug
-
能換模型
-
能持續演進
的 Agentic System。
七、給工程師與 LLM 的共同規則(非常重要)
這套架構能運作的前提只有一個:
每一層都守好自己的邊界。
-
LLM 只做決策,不直接動手
-
SLM 只做單一任務,不做全局判斷
-
外部工具一律經由 MCP
-
長流程一律交給 n8n
-
高風險行為必須有人類介入
這些規則,既是工程準則,
也是未來讓 LLM「知道自己該怎麼行動」的 operating manual。
結語:從模型,到組織,到可維護的系統
當你走到這一步,會發現一件事:
AI 的競爭,不再是誰的模型最大,
而是誰的系統最能被長期維護與演進。
這篇文章提供的不是唯一答案,
而是一套可被工程師與 AI 同時理解的結構範式。
接下來,你可以:
-
把它交給工程團隊畫架構圖
-
把它交給 LLM 規劃系統
-
把它當作 Agentic AI 的設計基準線
實務上, 你可以把這篇文章丟給你喜歡的LLM, GPT,Claude, Gemini,Codex , 問它能不能理解這篇文章, 用它來規劃系統架構, 有那些東西不懂, 不足需要補強的. 它應該就會回答了..
附錄一: 我找了 Grok 來讀這篇文章的回應. 每個AI的回答應該都會有些不同.
Agent System Design Specification(代理系統設計規格)
1. 系統概述
目的
建置一個可被工程師維護的 AI 代理系統,模擬一間「AI 公司」的組織結構。系統不僅能處理複雜任務(如零售營運管理),還具備自動化執行、錯誤處理、人類介入和可擴展性。核心原則:AI 不再是單一大腦,而是有分工的組織。
關鍵假設
- AI 的競爭在於系統的可維護性和演進性,而非模型大小。
- 每一層元件守好邊界:決策層不直接執行,執行層不做全局判斷。
- 支援模組化替換(如換模型或工具),確保工程可測試性。
適用場景
- 零售營運:庫存管理、物流追蹤、促銷調整。
- 其他:財務分析、客戶服務自動化、供應鏈優化。
2. 系統架構圖(高層視圖)
(這裡可以用文字描述架構;如果需要視覺化,我建議用 Mermaid 產生圖表。以下是文字版:)
- 輸入層:用戶需求(模糊或明確任務)。
- 決策層 (LLM CEO/Orchestrator) → 產生計劃 → 分派任務。
- 連接:MCP(工具介面)。
- 執行層 (SLM Worker Agents) → 處理單一任務 → 回饋結果。
- 內核:atomic-agents(行為工程化)。
- 工作流層 (n8n) → 管理長流程、等待、人類介入、補償。
- 輸出層:任務完成報告、狀態更新。
- 外部連接:資料庫、API、ERP 系統(經 MCP 標準化)。
流程示例:
- 用戶輸入 → LLM 拆解計劃。
- 計劃分派給 SLM Agents(經 atomic-agents 執行)。
- 若需長流程 → n8n 接手(包含人類批准)。
- 結果彙整 → 回報用戶。
3. 元件細節與分工
3.1 腦部結構:LLM × SLM
- LLM (Large Language Model) - CEO/Orchestrator
- 角色:抽象推理、策略規劃、任務拆解、產生執行計劃(Plan)。
- 輸入:用戶需求、模糊查詢。
- 輸出:結構化計劃(e.g., JSON 格式的任務清單)。
- 限制:不直接呼叫 API、不管理狀態、不執行重複任務。
- 推薦模型:如 GPT-4 或類似大模型。
- 工程考量:使用 atomic-agents 包裝,確保輸出可驗證(Pydantic 結構化)。
- SLM (Small Language Model) - 部門主管/Worker Agents
- 角色:執行單一、可重複任務(如資料查詢、格式轉換、條件驗證)。
- 輸入:LLM 提供的子任務。
- 輸出:具體結果(e.g., 查詢結果、驗證報告)。
- 優勢:反應快、成本低、可並行。
- 限制:不處理全局決策,只專注單一職責。
- 推薦模型:如 Llama-3 小型變體。
- 工程考量:多個 SLM Agents 可並行運行,使用 atomic-agents 確保行為穩定、可重試。
3.2 atomic-agents:Agent 行為工程框架
- 定位:Agent 的「內功」,確保單一職責、可測試性。
- 整合位置:
- 在 LLM Orchestrator:用於產生計劃的結構化輸出。
- 在 SLM Worker Agents:處理小任務的邏輯、資料清洗。
- 不適合:全局狀態管理(交給 n8n)。
- 關鍵功能:
- 結構化輸入/輸出(使用 Pydantic/Instructor)。
- 可驗證、重試、測試行為。
- 為什麼使用:解決 Prompt 不穩定的痛點,讓 Agent 行為變成可工程化的模組。
3.3 MCP (Model Context Protocol):工具連接標準
- 定位:AI 世界的「USB 介面」,解決連接耦合問題。
- 整合位置:
- 連接外部工具、API、資料源(e.g., ERP、資料庫)。
- 工具發現與標準化輸入/輸出。
- 關鍵功能:
- 解耦模型與工具:任何模型都能用同一介面。
- 支援工具替換、無需重寫程式碼。
- 與 atomic-agents 分工:atomic-agents 管「怎麼思考」,MCP 管「怎麼連接」。
3.4 n8n:工作流引擎與狀態機
- 定位:處理長流程、等待、補償、人類介入。
- 整合位置:
- 當任務跨多系統或需批准時,從 Agent 轉交 n8n。
- 示例:LLM 產生計劃 → n8n 執行步驟(e.g., 查庫存 → 發信 → 等待回應 → 更新系統)。
- 關鍵功能:
- 自動化工作流(400+ 整合)。
- Human-in-the-loop:關鍵節點通知人類。
- 錯誤處理:回退、補償機制。
- 為什麼使用:Agent 不適合長時間狀態,n8n 提供可控的行動工廠。
4. 運作流程(Standard Operating Procedure)
- 任務接收:用戶輸入 → LLM 分析並產生計劃(使用 atomic-agents 結構化)。
- 任務分派:計劃拆成子任務 → 分派給 SLM Agents(經 MCP 呼叫工具)。
- 執行與連接:SLM 處理子任務,若需外部 → 經 MCP。
- 長流程管理:若任務複雜 → n8n 接管(包含等待/批准)。
- 回報與迭代:結果彙整 → LLM 驗證 → 若需調整,重複步驟。
- 例外處理:高風險行為強制人類介入;錯誤時重試或回退。
5. 工程規則與邊界(非常重要)
- 邊界守則:
- LLM 只決策,不動手。
- SLM 只單一任務,不全局判斷。
- 所有外部工具經 MCP。
- 長流程交 n8n。
- 高風險(e.g., 下單、刪除資料)需人類批准。
- 可維護性設計:
- 模組化:每個元件可獨立測試/替換。
- 監控:記錄每個層的輸入/輸出(用於 debug)。
- 擴展:支援添加新 SLM Agents 或工具。
- 成本優化:SLM 處理重複任務,LLM 只高階。
- 測試策略:
- 單元測試:atomic-agents 的行為。
- 整合測試:MCP 工具連接。
- 端到端測試:n8n 工作流。
6. 實施建議
- 技術堆疊:
- 語言:Python(atomic-agents 和 MCP 相容)。
- 模型:OpenAI/Groq for LLM,Hugging Face for SLM。
- 部署:自託管 n8n,雲端 MCP 整合。
- 下一步:
- 產生 POC(Proof of Concept):用簡單零售場景實作。
- 安全考量:MCP 的安全風險(e.g., 權限控制)。
- 演進:擴展到多代理系統(e.g., 第八篇的主題)。
7. 風險與限制
- 風險:模型幻覺(用 atomic-agents 緩解)、連接安全(MCP 需加密)。
- 限制:初期需工程師調校 Prompt/計劃產生。
- 授權:基於文章的 CC BY-NC-ND 4.0,禁止商業改作。
========
本著作由大力士的AI天地創造 製作,以創用CC 姓名標示–非商業性– 禁止改作 4.0 國際授權條款釋出

留言
張貼留言