AI Agentic Workflow:引領人工智慧的下一步
2024 年 8 月 29 日
隨著 Chatbot、GPT 等技術成熟,人們開始思考如何讓 AI 更進步,不侷限於一個指令一個動作,或說,讓 AI 不要把第一個回答當作最終的答覆,讓 AI 有機會自我檢視生成的內容,反覆修飾,盡可能排除任何錯誤,提供一個最高品質的回答。
甚至,人們開始期望 AI 與 AI 之間可以進行溝通、制衡、互助合作,彷彿打造一個 AI 團隊,自動化執行複雜的任務,解決複雜的問題,讓 AI 生成的成品可以更細緻,進而達成我們的目標,於是有了 AI Agentic Workflow 的誕生,是近來技術領域中的熱門話題之一。
更講究、更智慧的 AI
在使用 ChatGPT、Gemini 這類文本生成工具,或是各類線上圖像生成工具的經驗裡,目前我們對於一些難度較高、較複雜的提問,都不會太期待 AI 的第一次回答即臻於完美。等 AI 第一次回覆後,我們會再給予回饋,讓 AI 的回答更符合我們希望的模樣。
雖然這與提示的品質有關,因為提示越明確、清楚,AI 就越能理解我們的需求,但修改常常是無法避免的事。
舉例來說:當我們要求 AI 生成一篇有關未來科技的文章時,第一次生成的內容可能缺乏深度或沒有觸及關鍵點。這時,我們可以告訴 AI 哪些部分需要更詳細的解釋,或者哪些觀點需要重新闡述。隨著這些反饋的提供,AI 會逐步修正並生成更符合我們預期的內容。
什麼是 AI Agent?
在深入探討 AI Agentic Workflow 之前,我們先來定義一下什麼是 AI Agent。從字面上的意思來看,AI Agent 可以被理解為「人類的代理」,藉由模擬人類的思維和行為,在我們給它的目標範疇中,進行決策,甚至與其他 AI 進行溝通與合作,最終以反覆修改過、最高品質的成果完成任務。
AI 百大影響力人物吳恩達 (Andrew Ng) 在一場講座中分享 AI Agentic Workflow 的四個設計模式1:
- 反思 (Reflection)
- 工具使用 (Tool Use)
- 規劃 (Planning)
- 多 Agent 的協作 (Multiagent Collaboration)
吳恩達更進一步提到,運用 Agent Workflow 的 GPT-3 的表現甚至勝過還沒使用 Agent Workflow 的 GPT-4,足見 Agent Workflow 對於 AI 的實際成效。
反思 Reflection:反覆自我審視,優化產出
反思 (Reflection) 是 AI Agentic Workflow 中最廣泛應用的一種設計模式。它讓 AI 在生成輸出後,自行審視並修正自己的結果。如同上方的例子,當我們要求 AI 生成一篇有關未來科技的文章,具備「反思」這一項設計模式的 AI 將會反覆檢查自己的產出,不急於把第一次生成的內容提供給我們,會先逐步修正,透過多次迭代達到更理想的結果,生成更符合我們預期的內容。
這種自我審視的過程大大提高了 AI 的準確性與可靠性,目前已成為許多 AI 應用中的標配。
工具使用 Tool Use:擴展 AI 的功能
如果沒有外部資源與工具,像 GPT 這個類型的 AI 無法直接搜尋網路、執行程式碼或處理圖像。所以開發者將 AI 加入可以「使用工具」的模式,允許 AI 執行核心能力「以外」的任務。例如:如果要求 AI 提供特定主題的最新資訊,它可以使用網路搜尋工具即時查詢。
工具使用 (Tool Use) 使 AI 更加通用,例如:大型語言模型 (Large Language Models, LLMs) 不再侷限於基本文字生成的任務,而是可以執行各種操作,使其能力不斷擴展,讓 AI 能夠在更廣泛的場景中發揮作用。
規劃 Planning:為複雜任務拆解步驟,一步步執行
規劃 (Planning) 是另一種重要的設計模式,它讓 AI Agent 能夠分解複雜的任務,並按步驟執行。這種方法特別適合需要多步驟操作的情境。
以「AI 無人機運送包裹」的例子來說,想像一台 AI 自主無人機需要穿越複雜的環境 (如森林),將包裹運送到特定位置。這項任務可能涉及多個步驟,需要無人機在遇到各種挑戰時,即時做出正確的決策。以下是這項任務整體可能的規劃:路線規劃、避障規劃、電量控管、壞天氣對策、包裹交付規劃。
首先,AI 無人機需要先規劃起點到終點的最佳路線,確保無人機的安全與運送效率。
還要事先規劃避障措施,如果遇到臨時出現的障礙物,它的應對策略會是什麼,也許是換一條路線,或是拉高飛行高度避開障礙物。
避免因為意外致使尚未抵達目的地之前就沒有了電量,所以對於電量需要實時偵測,且事先規劃電量低到一個程度的相應措施,例如:在電量即將不足之前,判斷此刻距離最近、安全、平坦的地面在哪裡。
運送包裹最無法掌控的非「突如其來的壞天氣」莫屬,在運送的規劃中,AI 無人機也需要將這個變因納入考量,需要會判斷壞天氣的條件,以及在什麼情況下需要迫降於安全平坦的地面,什麼天氣條件下可以再重新飛行。
最後是包裹交付的規劃,要將包裹以什麼高度放置於哪個平台,還是需要有什麼人員去接應才能交付…等等,以上這些都是 AI Agent 可以自己規劃並自主執行、判斷,甚至修正、調整的步驟。
雖然「規劃」的 AI Agentic Workflow 仍在發展中,但它的效果在部分使用情境中已有令人驚豔的效果。
多 Agent 協作:面面俱到,提升任務完成效率
多 Agent 協作 (Multiagent Collaboration) 讓多個 AI Agent 扮演不同角色,彼此合作完成任務,就像一個 AI 小團隊。
在吳恩達創辦的 AI 教育機構 DeepLearning.AI 每週在 The Batch 分享的 AI 最新資訊中,有一個運用多 Agent 協作且非常有趣的應用—翻譯文學作品2。
前面提到的大型語言模型 (Large Language Models, LLMs) 主要用於處理文字相關的任務,如生成文字、翻譯文件等。然而,目前 LLM 的翻譯能力尚未達到精確翻譯文學作品的標準,尤其語言隨時在變化,許多語言間的轉換,如英中或中英翻譯,不能僅僅依靠詞句的對應來完成。
因此,有開發者以「多 Agent 協作」的概念,組建一個 AI 翻譯小組。這個小組包括 CEO、編輯助理、資深編輯、翻譯人員、校稿人員和潤稿人員等,大家共同合作,通過層層審稿、潤稿,最終完成一個既忠於原文、又能準確傳達翻譯語言之意的作品。
儘管目前這種方法的穩定性還需進一步優化,但多 Agent 的潛力已經顯現。特別是在模擬真實工作環境的情境下,多 Agent 協作模式能夠再現不同專業人士共同努力的場景,進一步提升 AI 的效能。
AI Agentic Workflow 的未來展望
隨著 AI Agentic Workflow 的持續進化,這四種設計模式將在未來的 AI 發展中扮演更加重要的角色。吳恩達提醒,由於運用 Agentic Workflow 模式的 AI 會花比較多的時間在修飾它的回覆或執行它的任務,所以在使用 Agentic Workflow 時,我們需要學習等待,給予 AI Agent 更多時間來完成任務,就像師傅需要耐心等待學徒用心打磨成品,也如同主管需要耐心等待下屬來回修正執行自己的任務。
AI Agentic Workflow 不僅是現今技術發展的自然延伸,更為未來的 AI 發展奠定了新的基礎。這個概念的出現,也展現了我們將從單一 AI 系統的運作,邁向多 AI 系統協作的時代。
[資料來源]
1 Sequoia Capital. “What’s Next for AI Agentic Workflows Featuring Andrew Ng of AI Fund.” YouTube, 27 March 2024, https://youtu.be/sal78ACtGTc?si=qEhK464ViQCBuXiM.
2 “Machine Translation Goes Agentic.” The Batch, DeepLearning. AI, 15 August 2024, www.deeplearning.ai/the-batch/transagents-a-system-that-boosts-literary-translation-with-a-multi-agent-workflow/.