最近因為工作的關係,需要對 AI 代理人(AI Agent)進行評估,也順便做了 Agentic AI(代理式 AI)的比較。如果你也在評估或導入 AI 代理相關技術,這兩者看起來相似卻不太一樣。
自主運行
如果是從 ChatGPT 被大眾所知開始就關注 LLM(Large Language Model,大型語言模型)以及後續發展,肯定會發現 AI 能夠在沒有人類提示的狀況下,自主運行更長的時間。
這確實也是「人工智慧(AI)」理想上要抵達的方向,有一天我們可以讓 AI 幫我們做很多事情,生活越來越輕鬆,雖然現在的方向似乎不是這樣,但自主運行的時間確實變長。
之所以能夠增加自主運行的時間,主要是語言模型的改進,以及 Reasoning Model(推理式模型)的出現,讓語言模型在預測要生成的內容更加穩定,透過中間步驟的推理,能夠做到類似於思考(Thinking)和調度(Orchestration)的任務,中間需要人類提示調整方向的比例就開始下降。
那麼,Agentic AI 的實現就變得更加可行。
Agentic AI
Agent 和 Agentic AI 的差異,主要在於「自主運行」的能力上,如果是 Agent 的狀況,大多只能處理單一的任務,而 Agentic AI 則會自己判斷並且調度其他 Agent 來達成任務。
舉例來說,初期的 Coding Agent 大多需要描述完整的修改、編輯流程,還有相對詳細的 Codebase 背景資訊,才可以順利完成修改。雖然需要花時間撰寫指示,但也比人工修改程式碼的速度快上不少,重點在於 Prompting Engineering(提示詞工程)的品質。
後續模型開始有推理能力,並且 Context Window(上下文窗口)增加,關注的重點就不單純是單一提示,而是整個運行過程中 Context 的內容,以及語言模型在多少 Token 數量下還能維持預期的能力。也因為 Context Window 的增加,逐漸可以提高運行時間,但也需要更好地管理 Context 的內容,進入到 Context Engineering(上下文工程)的階段。
大約 2025 年底,在經歷大型語言模型快速成長後,大部分情境所需的 Context Window 已經足夠,推理模型的能力也已經達到大部分情境不會有太多錯誤,對工具的使用、呼叫也都進不到相當穩定的狀況。因此開始轉向 Agentic AI 的階段,也就是「能不能長時間自己運行,而不需要人類介入」的階段。
Harness Engineering
最後,我認為今年上半年 Harness Engineering 可能會變成 Context Engineering 後下一個被關注的議題,Harness 有「馬具」的意思,蠻可能被翻譯成「駕馭工程」之類的。
實際上 Harness 已經不算太新的概念,像是 Anthropic 在去年就已經有 Effective harnesses for long-running agents 的文章發表,近期 OpenAI 也有 Symphony 專案的展示,都是在測試 Harness 的能力。
若要說 Agentic AI 最具代表性的產品,那應該就是我們目前在使用的 Claude Code 只要輸入開發目標(規格)先不論品質,都能自己探索、規劃然後完成實作。
而 Harness Engineering 的體現,我認為是目前還很難用的 Claude Code Agent Team 功能,如何讓多個 Agent 協作並且長時間運行完成任務,就會是一個相當程度的挑戰。
另一方面,前陣子非常熱門的 OpenClaw(通稱龍蝦)我也認為是一種 Harness 的嘗試,利用 Heartbeat(心跳機制)等機制,讓 Agentic AI 維持運作,而且有分配好的任務可以持續的進行,而不需要依賴人類觸發。
Autonoe 是我去年參考 Anthropic 文章的嘗試,最近受到 Paperclip.ai 的啟發,終於想好如何修改 Autonoe 移除 Agent SDK 的依賴,大概也會變得更接近 Harness Engineering 實踐的一種類型。
在 AI 時代發展非常快速,至少現在大家不用再耗費太多力氣在「實作」上,而是更專注在「工程」問題,思考怎樣的設計跟架構才能解決問題。
從 Agent 到 Agentic AI 雖然不像是往 GAI(通用人工智慧)的方向前進的樣子,但也變得更加自主自動。
喜歡這篇文章?請我喝杯奶茶 🧋