AI Agentic Workflow:引領人工智慧的下一步

2024 年 8 月 29 日

隨著 Chatbot、GPT 等技術成熟,人們開始思考如何讓 AI 更進步,不侷限於一個指令一個動作,或說,讓 AI 不要把第一個回答當作最終的答覆,讓 AI 有機會自我檢視生成的內容,反覆修飾,盡可能排除任何錯誤,提供一個最高品質的回答。

甚至,人們開始期望 AI 與 AI 之間可以進行溝通、制衡、互助合作,彷彿打造一個 AI 團隊,自動化執行複雜的任務,解決複雜的問題,讓 AI 生成的成品可以更細緻,進而達成我們的目標,於是有了 AI Agentic Workflow 的誕生,是近來技術領域中的熱門話題之一。

更講究、更智慧的 AI

在使用 ChatGPT、Gemini 這類文本生成工具,或是各類線上圖像生成工具的經驗裡,目前我們對於一些難度較高、較複雜的提問,都不會太期待 AI 的第一次回答即臻於完美。等 AI 第一次回覆後,我們會再給予回饋,讓 AI 的回答更符合我們希望的模樣。

雖然這與提示的品質有關,因為提示越明確、清楚,AI 就越能理解我們的需求,但修改常常是無法避免的事。

舉例來說:當我們要求 AI 生成一篇有關未來科技的文章時,第一次生成的內容可能缺乏深度或沒有觸及關鍵點。這時,我們可以告訴 AI 哪些部分需要更詳細的解釋,或者哪些觀點需要重新闡述。隨著這些反饋的提供,AI 會逐步修正並生成更符合我們預期的內容。

什麼是 AI Agent?

在深入探討 AI Agentic Workflow 之前,我們先來定義一下什麼是 AI Agent。從字面上的意思來看,AI Agent 可以被理解為「人類的代理」,藉由模擬人類的思維和行為,在我們給它的目標範疇中,進行決策,甚至與其他 AI 進行溝通與合作,最終以反覆修改過、最高品質的成果完成任務

AI 百大影響力人物吳恩達 (Andrew Ng) 在一場講座中分享 AI Agentic Workflow 的四個設計模式1

  1. 反思 (Reflection)
  2. 工具使用 (Tool Use)
  3. 規劃 (Planning)
  4. 多 Agent 的協作 (Multiagent Collaboration)

吳恩達更進一步提到,運用 Agent Workflow 的 GPT-3 的表現甚至勝過還沒使用 Agent Workflow 的 GPT-4,足見 Agent Workflow 對於 AI 的實際成效。

反思 Reflection:反覆自我審視,優化產出

反思 (Reflection) 是 AI Agentic Workflow 中最廣泛應用的一種設計模式。它讓 AI 在生成輸出後,自行審視並修正自己的結果。如同上方的例子,當我們要求 AI 生成一篇有關未來科技的文章,具備「反思」這一項設計模式的 AI 將會反覆檢查自己的產出,不急於把第一次生成的內容提供給我們,會先逐步修正,透過多次迭代達到更理想的結果,生成更符合我們預期的內容

這種自我審視的過程大大提高了 AI 的準確性與可靠性,目前已成為許多 AI 應用中的標配。

(照片來源:Kelly Sikkema on Unsplash)

工具使用 Tool Use:擴展 AI 的功能

如果沒有外部資源與工具,像 GPT 這個類型的 AI 無法直接搜尋網路、執行程式碼或處理圖像。所以開發者將 AI 加入可以「使用工具」的模式,允許 AI 執行核心能力「以外」的任務。例如:如果要求 AI 提供特定主題的最新資訊,它可以使用網路搜尋工具即時查詢。

工具使用 (Tool Use) 使 AI 更加通用,例如:大型語言模型 (Large Language Models, LLMs) 不再侷限於基本文字生成的任務,而是可以執行各種操作,使其能力不斷擴展,讓 AI 能夠在更廣泛的場景中發揮作用。

(照片來源:Chris Ried on Unsplash)

規劃 Planning:為複雜任務拆解步驟,一步步執行

規劃 (Planning) 是另一種重要的設計模式,它讓 AI Agent 能夠分解複雜的任務,並按步驟執行。這種方法特別適合需要多步驟操作的情境。

以「AI 無人機運送包裹」的例子來說,想像一台 AI 自主無人機需要穿越複雜的環境 (如森林),將包裹運送到特定位置。這項任務可能涉及多個步驟,需要無人機在遇到各種挑戰時,即時做出正確的決策。以下是這項任務整體可能的規劃:路線規劃、避障規劃、電量控管、壞天氣對策、包裹交付規劃。

首先,AI 無人機需要先規劃起點到終點的最佳路線,確保無人機的安全與運送效率。

還要事先規劃避障措施,如果遇到臨時出現的障礙物,它的應對策略會是什麼,也許是換一條路線,或是拉高飛行高度避開障礙物。

避免因為意外致使尚未抵達目的地之前就沒有了電量,所以對於電量需要實時偵測,且事先規劃電量低到一個程度的相應措施,例如:在電量即將不足之前,判斷此刻距離最近、安全、平坦的地面在哪裡。

運送包裹最無法掌控的非「突如其來的壞天氣」莫屬,在運送的規劃中,AI 無人機也需要將這個變因納入考量,需要會判斷壞天氣的條件,以及在什麼情況下需要迫降於安全平坦的地面,什麼天氣條件下可以再重新飛行。

最後是包裹交付的規劃,要將包裹以什麼高度放置於哪個平台,還是需要有什麼人員去接應才能交付…等等,以上這些都是 AI Agent 可以自己規劃並自主執行、判斷,甚至修正、調整的步驟。

雖然「規劃」的 AI Agentic Workflow 仍在發展中,但它的效果在部分使用情境中已有令人驚豔的效果。

(照片來源:Glenn Carstens-Peters on Unsplash)

多 Agent 協作:面面俱到,提升任務完成效率

多 Agent 協作 (Multiagent Collaboration) 讓多個 AI Agent 扮演不同角色,彼此合作完成任務,就像一個 AI 小團隊

在吳恩達創辦的 AI 教育機構 DeepLearning.AI 每週在 The Batch 分享的 AI 最新資訊中,有一個運用多 Agent 協作且非常有趣的應用—翻譯文學作品2

前面提到的大型語言模型 (Large Language Models, LLMs) 主要用於處理文字相關的任務,如生成文字、翻譯文件等。然而,目前 LLM 的翻譯能力尚未達到精確翻譯文學作品的標準,尤其語言隨時在變化,許多語言間的轉換,如英中或中英翻譯,不能僅僅依靠詞句的對應來完成。

因此,有開發者以「多 Agent 協作」的概念,組建一個 AI 翻譯小組。這個小組包括 CEO、編輯助理、資深編輯、翻譯人員、校稿人員和潤稿人員等,大家共同合作,通過層層審稿、潤稿,最終完成一個既忠於原文、又能準確傳達翻譯語言之意的作品。

儘管目前這種方法的穩定性還需進一步優化,但多 Agent 的潛力已經顯現。特別是在模擬真實工作環境的情境下,多 Agent 協作模式能夠再現不同專業人士共同努力的場景,進一步提升 AI 的效能。

(圖片來源:DeepLearning.AI 的 The Batch 電子週刊,文章:Machine Translation Goes Agentic)

AI Agentic Workflow 的未來展望

隨著 AI Agentic Workflow 的持續進化,這四種設計模式將在未來的 AI 發展中扮演更加重要的角色。吳恩達提醒,由於運用 Agentic Workflow 模式的 AI 會花比較多的時間在修飾它的回覆或執行它的任務,所以在使用 Agentic Workflow 時,我們需要學習等待,給予 AI Agent 更多時間來完成任務,就像師傅需要耐心等待學徒用心打磨成品,也如同主管需要耐心等待下屬來回修正執行自己的任務。

AI Agentic Workflow 不僅是現今技術發展的自然延伸,更為未來的 AI 發展奠定了新的基礎。這個概念的出現,也展現了我們將從單一 AI 系統的運作,邁向多 AI 系統協作的時代。

[資料來源]
1 Sequoia Capital. “What’s Next for AI Agentic Workflows Featuring Andrew Ng of AI Fund.” YouTube, 27 March 2024, https://youtu.be/sal78ACtGTc?si=qEhK464ViQCBuXiM.
2 “Machine Translation Goes Agentic.” The Batch, DeepLearning. AI, 15 August 2024, www.deeplearning.ai/the-batch/transagents-a-system-that-boosts-literary-translation-with-a-multi-agent-workflow/.