剖析 GPT :第七篇|AI 代理人的操作系統:LLM × SLM × MCP × atomic agents,如何組成一間「AI 公司」?

第七篇|AI 代理人的操作系統:LLM × SLM × MCP × atomic-agents,如何組成一間「AI 公司」?

前言:AI 的真正革命,不是更大的模型,而是「組織能力」的出現



當人們談論 AI 的未來,多半仍停留在:

  • GPT-5 會多聰明?

  • LLM 會不會成為通用智慧?

  • 小模型會不會取代大模型?

這些問題,背後其實都隱含一個假設:

AI 是一顆單一、巨大的大腦。

但現實正在悄悄改變。

AI 不再是一顆腦,而是一個組織
是一間有分工、有流程、有工具、有失敗處理的「公司」。

而這個轉變,對工程師來說,比任何模型升級都重要。


一、為什麼需要 AI Agent?從「會說話」到「會做事」

想像一個真實場景:

你是一家連鎖零售的營運長,每天需要處理:

  • 上千門市的庫存

  • 物流延遲

  • 促銷節奏

  • 供應商回應

  • 例外事件(缺貨、塞港)

如果你把這一切交給單一 LLM:

它可以寫出一份完美的分析報告,
但它無法登入 ERP、不能發信、不能下單、不能更新系統

這正是 Agentic AI 的核心價值所在:

AI 不只是提供建議,而是能替你完成任務。

而一個真正成熟的 AI 代理系統,必須具備:

  • 自動抓資料

  • 自動呼叫系統

  • 自動執行流程

  • 自動回報狀態

  • 必要時請人類介入

這已經不是「模型能力」的問題,而是系統架構的問題。


二、AI 公司的組織結構:為什麼一定要拆成多層?

1️⃣ 腦部結構:LLM × SLM(決策層 vs 執行層)

LLM(CEO / Orchestrator)

  • 負責抽象推理與策略規劃

  • 拆解任務、產生執行計畫(plan)

  • 與人類溝通、處理模糊需求

它不應該:

  • 直接呼叫外部 API

  • 執行大量重複任務

  • 管理長時間狀態


SLM(部門主管 / Worker Agents)

  • 負責單一、明確、可重複的小任務

  • 反應快、成本低、可大量並行

  • 適合查資料、轉換格式、驗證條件

工程上的意義很簡單:

把「思考」與「執行」拆開,
系統才有可測試性、可擴展性與可維護性。


三、atomic-agents:Agent 的「內功」——讓行為變成工程

在實作 Agent 時,很多人會遇到同一個痛點:

Prompt 能跑,但行為不穩定,debug 幾乎不可能。

atomic-agents 的定位很清楚:

它不是聊天框架,而是 Agent Engineering Framework。

它提供的是:

  • 單一職責的 Agent 設計

  • 結構化輸入輸出(Pydantic / Instructor)

  • 可驗證、可重試、可測試的 Agent 行為

在這個架構中,atomic-agents 適合放在哪?

  • LLM Orchestrator(產生 plan)

  • SLM Worker Agents(執行小任務)

  • 本地邏輯處理、資料清洗、格式轉換

你可以把它理解為:

Agent 的內功心法:不炫技,但極度扎實。


四、MCP:不是魔法,是 AI 世界的「USB 介面」

MCP(Model Context Protocol)解決的不是推理問題,而是連接問題

在沒有 MCP 之前:

  • 每個工具都要寫一次整合程式碼

  • Agent 與工具高度耦合

  • 無法共用、無法替換

MCP 的工程定位非常明確:

  • 標準化工具介面

  • 工具發現(Tool Discovery)

  • 結構化輸入輸出

  • 與模型、框架解耦

就像 USB 一樣:

不管你接的是滑鼠、硬碟還是鍵盤,
只要符合規格,系統就能用。

atomic-agents vs MCP,不是競爭,而是分工

  • atomic-agents:怎麼思考、怎麼決策

  • MCP:怎麼連接外部世界


五、n8n:AI 的行動工廠與狀態機

當任務開始具備以下特性:

  • 跨多個系統

  • 需要等待

  • 需要人類批准

  • 需要補償與回退

它就不再適合由 Agent 自己處理。

這時,n8n 扮演的角色是:

  • 長流程引擎

  • 自動化工作流

  • 人類介入(Human-in-the-loop)的承載平台

一個標準模式會是:

  • Agent 決策「該做什麼」

  • n8n 負責「怎麼一步步做完」

  • 關鍵節點請人類批准

這不是限制 AI,而是讓 AI 在可控範圍內行動


六、整合視角:一間「AI 公司」如何實際運作?

當這些角色組合起來,你會得到:

  • LLM(CEO):負責思考與規劃

  • SLM(主管 / 工人):負責執行與產出

  • atomic-agents:確保行為可預測、可工程化

  • MCP:連接資料庫、API、工具

  • n8n:處理長流程與人類介入

這不再是聊天機器人。

這是一個:

  • 能被拆 ticket

  • 能被 code review

  • 能被 debug

  • 能換模型

  • 能持續演進

Agentic System


七、給工程師與 LLM 的共同規則(非常重要)

這套架構能運作的前提只有一個:

每一層都守好自己的邊界。

  • LLM 只做決策,不直接動手

  • SLM 只做單一任務,不做全局判斷

  • 外部工具一律經由 MCP

  • 長流程一律交給 n8n

  • 高風險行為必須有人類介入

這些規則,既是工程準則,
也是未來讓 LLM「知道自己該怎麼行動」的 operating manual。


結語:從模型,到組織,到可維護的系統

當你走到這一步,會發現一件事:

AI 的競爭,不再是誰的模型最大,
而是誰的系統最能被長期維護與演進。

這篇文章提供的不是唯一答案,
而是一套可被工程師與 AI 同時理解的結構範式

接下來,你可以:

  • 把它交給工程團隊畫架構圖

  • 把它交給 LLM 規劃系統

  • 把它當作 Agentic AI 的設計基準線




實務上, 你可以把這篇文章丟給你喜歡的LLM, GPT,Claude, Gemini,Codex , 問它能不能理解這篇文章, 用它來規劃系統架構, 有那些東西不懂, 不足需要補強的. 它應該就會回答了..


附錄一: 我找了 Grok 來讀這篇文章的回應. 每個AI的回答應該都會有些不同.

Agent System Design Specification(代理系統設計規格)

1. 系統概述

目的

建置一個可被工程師維護的 AI 代理系統,模擬一間「AI 公司」的組織結構。系統不僅能處理複雜任務(如零售營運管理),還具備自動化執行、錯誤處理、人類介入和可擴展性。核心原則:AI 不再是單一大腦,而是有分工的組織。

關鍵假設

  • AI 的競爭在於系統的可維護性和演進性,而非模型大小。
  • 每一層元件守好邊界:決策層不直接執行,執行層不做全局判斷。
  • 支援模組化替換(如換模型或工具),確保工程可測試性。

適用場景

  • 零售營運:庫存管理、物流追蹤、促銷調整。
  • 其他:財務分析、客戶服務自動化、供應鏈優化。

2. 系統架構圖(高層視圖)

(這裡可以用文字描述架構;如果需要視覺化,我建議用 Mermaid 產生圖表。以下是文字版:)

  • 輸入層:用戶需求(模糊或明確任務)。
  • 決策層 (LLM CEO/Orchestrator) → 產生計劃 → 分派任務。
    • 連接:MCP(工具介面)。
  • 執行層 (SLM Worker Agents) → 處理單一任務 → 回饋結果。
    • 內核:atomic-agents(行為工程化)。
  • 工作流層 (n8n) → 管理長流程、等待、人類介入、補償。
  • 輸出層:任務完成報告、狀態更新。
  • 外部連接:資料庫、API、ERP 系統(經 MCP 標準化)。

流程示例:

  1. 用戶輸入 → LLM 拆解計劃。
  2. 計劃分派給 SLM Agents(經 atomic-agents 執行)。
  3. 若需長流程 → n8n 接手(包含人類批准)。
  4. 結果彙整 → 回報用戶。

3. 元件細節與分工

3.1 腦部結構:LLM × SLM

  • LLM (Large Language Model) - CEO/Orchestrator
    • 角色:抽象推理、策略規劃、任務拆解、產生執行計劃(Plan)。
    • 輸入:用戶需求、模糊查詢。
    • 輸出:結構化計劃(e.g., JSON 格式的任務清單)。
    • 限制:不直接呼叫 API、不管理狀態、不執行重複任務。
    • 推薦模型:如 GPT-4 或類似大模型。
    • 工程考量:使用 atomic-agents 包裝,確保輸出可驗證(Pydantic 結構化)。
  • SLM (Small Language Model) - 部門主管/Worker Agents
    • 角色:執行單一、可重複任務(如資料查詢、格式轉換、條件驗證)。
    • 輸入:LLM 提供的子任務。
    • 輸出:具體結果(e.g., 查詢結果、驗證報告)。
    • 優勢:反應快、成本低、可並行。
    • 限制:不處理全局決策,只專注單一職責。
    • 推薦模型:如 Llama-3 小型變體。
    • 工程考量:多個 SLM Agents 可並行運行,使用 atomic-agents 確保行為穩定、可重試。

3.2 atomic-agents:Agent 行為工程框架

  • 定位:Agent 的「內功」,確保單一職責、可測試性。
  • 整合位置:
    • 在 LLM Orchestrator:用於產生計劃的結構化輸出。
    • 在 SLM Worker Agents:處理小任務的邏輯、資料清洗。
    • 不適合:全局狀態管理(交給 n8n)。
  • 關鍵功能:
    • 結構化輸入/輸出(使用 Pydantic/Instructor)。
    • 可驗證、重試、測試行為。
  • 為什麼使用:解決 Prompt 不穩定的痛點,讓 Agent 行為變成可工程化的模組。

3.3 MCP (Model Context Protocol):工具連接標準

  • 定位:AI 世界的「USB 介面」,解決連接耦合問題。
  • 整合位置:
    • 連接外部工具、API、資料源(e.g., ERP、資料庫)。
    • 工具發現與標準化輸入/輸出。
  • 關鍵功能:
    • 解耦模型與工具:任何模型都能用同一介面。
    • 支援工具替換、無需重寫程式碼。
  • 與 atomic-agents 分工:atomic-agents 管「怎麼思考」,MCP 管「怎麼連接」。

3.4 n8n:工作流引擎與狀態機

  • 定位:處理長流程、等待、補償、人類介入。
  • 整合位置:
    • 當任務跨多系統或需批准時,從 Agent 轉交 n8n。
    • 示例:LLM 產生計劃 → n8n 執行步驟(e.g., 查庫存 → 發信 → 等待回應 → 更新系統)。
  • 關鍵功能:
    • 自動化工作流(400+ 整合)。
    • Human-in-the-loop:關鍵節點通知人類。
    • 錯誤處理:回退、補償機制。
  • 為什麼使用:Agent 不適合長時間狀態,n8n 提供可控的行動工廠。

4. 運作流程(Standard Operating Procedure)

  1. 任務接收:用戶輸入 → LLM 分析並產生計劃(使用 atomic-agents 結構化)。
  2. 任務分派:計劃拆成子任務 → 分派給 SLM Agents(經 MCP 呼叫工具)。
  3. 執行與連接:SLM 處理子任務,若需外部 → 經 MCP。
  4. 長流程管理:若任務複雜 → n8n 接管(包含等待/批准)。
  5. 回報與迭代:結果彙整 → LLM 驗證 → 若需調整,重複步驟。
  6. 例外處理:高風險行為強制人類介入;錯誤時重試或回退。

5. 工程規則與邊界(非常重要)

  • 邊界守則
    • LLM 只決策,不動手。
    • SLM 只單一任務,不全局判斷。
    • 所有外部工具經 MCP。
    • 長流程交 n8n。
    • 高風險(e.g., 下單、刪除資料)需人類批准。
  • 可維護性設計
    • 模組化:每個元件可獨立測試/替換。
    • 監控:記錄每個層的輸入/輸出(用於 debug)。
    • 擴展:支援添加新 SLM Agents 或工具。
    • 成本優化:SLM 處理重複任務,LLM 只高階。
  • 測試策略
    • 單元測試:atomic-agents 的行為。
    • 整合測試:MCP 工具連接。
    • 端到端測試:n8n 工作流。

6. 實施建議

  • 技術堆疊
    • 語言:Python(atomic-agents 和 MCP 相容)。
    • 模型:OpenAI/Groq for LLM,Hugging Face for SLM。
    • 部署:自託管 n8n,雲端 MCP 整合。

  • 下一步
    • 產生 POC(Proof of Concept):用簡單零售場景實作。
    • 安全考量:MCP 的安全風險(e.g., 權限控制)。
    • 演進:擴展到多代理系統(e.g., 第八篇的主題)。

7. 風險與限制

留言

這個網誌中的熱門文章

不要再學 Prompt : 第 1 篇:新手完全不懂 Prompt,也能讓 AI 幫你生出專業 Prompt(超簡單)

蜀漢多代理智能架構 *AI 不是一個人工作,而是一個國家在運作。*

不要再學 Prompt: 第 2 篇:LLM 如何把人的意圖翻譯成高品質 Prompt?