Agent Skills 需要多少內容?
之前寫過該有自己的 Agent Skills 嗎?來說明我認為每個人都該維護自己的技能,然而另一個現象是很多「厲害的技能組合」真的有這麼神奇嗎?
就我自己的經驗,即使不用這麼多內容也一樣運作得非常好,放這麼多可能更浪費 Token 還有機會影響表現。
之前寫過該有自己的 Agent Skills 嗎?來說明我認為每個人都該維護自己的技能,然而另一個現象是很多「厲害的技能組合」真的有這麼神奇嗎?
就我自己的經驗,即使不用這麼多內容也一樣運作得非常好,放這麼多可能更浪費 Token 還有機會影響表現。
最近因為工作的關係,需要對 AI 代理人(AI Agent)進行評估,也順便做了 Agentic AI(代理式 AI)的比較。如果你也在評估或導入 AI 代理相關技術,這兩者看起來相似卻不太一樣。
我經常看到「某某工具超強」的討論,但實際用了別人的 Agent Skill 後,往往發現不太順手,效果也跟預期有落差。更何況讓任意的人提供你 Agent Skill 從安全角度來看也非常危險,因為我們會授權給 Agent 做很多事情,遠比工具軟體危險更多。
除了安全以外,還有很多理由應該要有一套自己的 Agent Skill 會更好。
在 2025 年,我們經歷了 LLM(大型語言模型)快速進步的一年,以 AI Agent 形式的工具越來越多,用於開發軟體的 Coding Agent 也逐漸成熟到變成標準配備,而不是用來快速修改檔案的手段之一。
然而,對於軟體工程師來說,我認為 2026 年最值得投資的並不是學會 Coding Agent 這類工具的使用,而是更根本的能力。
你是否看到 Claude Code 的 Sub-Agent 功能就想設計一堆來用?Backend Agent、Frontend Agent 等等,感覺得到更強的工具,但真的需要嗎?
WebConf 2025 期間跟朋友聊到這個話題,才發現大家對 Sub-Agent 的使用時機還是相對陌生。今年有兩場演講提供了不錯的切入點:ihower 大大的 AI Agents 開發 以及 91APP 首席架構師安德魯大大的 從 Service 到 Agent。
因為 LLM 的不確定性,再加上大多數服務都會採取呼叫 API 的方式來使用,我們很難在測試中直接呼叫,比較好的做法是將 LLM 呼叫使用 Mock 方式處理。
如果要測試 LLM 的表現,則會使用 Evaluation(評估)的方式,並不在這系列討論的範圍中
上週五跟 Stan 也是台灣第一位 Ruby Committer(核心貢獻者)和幾位 Ruby Taiwan 核心社群成員在酒吧討論明年社群活動(RubyJam)的規劃,這就需要面對這幾年大部分社群都有實體活動衰退的問題,以及我們都認同的觀點——社群活動不是以學習知識為目的,而是以知識交流前提建立連結。
如果直接使用 Vitest 來撰寫測試,我們需要模擬大量的 API 請求和回應的檢查,這會造成單一測試非常不好閱讀,在維護新的功能時也需要反覆的產生大量重複的程式碼。
我們可以模仿 BDD(Behavior-Driven Development)風格的方式,設定「步驟」的概念,來讓測試案例變得容易理解,也能讓 AI 擴充測試時更加穩定。
前面的內容我們都注重在功能的實現,然而使用 AI 開發使用測試來確保功能的穩定也是非常重要的,至少我們不會因為產生的程式碼有一些預期外的改動,而破壞整個功能的完整性。
使用 AI 工具可以讓我們在初期很快地進行開發,大部分物件也不太需要對依賴注入的問題進行管理。然而在測試階段,能夠透過統一的介面切換測試用的物件,對於後續開發還是非常有幫助的。
我們接下來會使用 AI 協助我們一開始設定的 tsyringe 套件,正式導入到專案中。