
AI Agentic Workflow:人工知能の次の一歩を導く
Chatbot や GPT などの技術が成熟する中で、人々は AI をより進化させる方法について考え始めています。単一の指示に対して単一の動作を行うだけでなく、AI が最初の回答を最終的な答えとせず、生成した内容を自ら振り返り、何度も修正し、可能な限り誤りを排除して、最高品質の回答を提供できるようにするのです。
さらに、人々は AI 同士がコミュニケーションを取り、牽制し合い、協力できることを期待するようになりました。まるで AI チームを構築し、複雑なタスクを自動で実行し、複雑な問題を解決し、AI が生成する成果物をより精緻にして目標達成につなげる──それが AI Agentic Workflow の誕生につながり、近年の技術領域で注目されるテーマのひとつとなっています。
より洗練され、より賢い AI
ChatGPT や Gemini などのテキスト生成ツール、あるいは各種オンライン画像生成ツールを使用した経験から、現時点では難易度が高く複雑な質問に対して、AI の最初の回答が完璧であるとはあまり期待していません。AI が最初の回答を生成した後に、私たちはフィードバックを与え、AI の回答をより希望に沿った形に整えます。
これはプロンプトの質にも関係しています。プロンプトが明確で具体的であるほど、AI は私たちのニーズを理解しやすくなりますが、修正は避けられないことが多いのです。
例えば、AI に未来のテクノロジーに関する記事を生成させる場合、最初の生成では深みが不足していたり、重要なポイントに触れていないことがあります。この場合、どの部分をより詳しく説明すべきか、あるいはどの観点を再度表現すべきかを AI に指示します。こうしたフィードバックを与えることで、AI は徐々に修正し、私たちの期待に沿った内容を生成できるようになります。
AI エージェントとは?
AI Agentic Workflow を深く理解する前に、AI エージェントとは何かを定義しておきましょう。文字通りに解釈すれば、AI エージェントは「人間の代理」と見なせます。人間の思考や行動を模倣し、与えられた目標範囲内で意思決定を行い、他の AI とコミュニケーションや協力を行い、最終的に繰り返し修正された最高品質の成果物でタスクを完了させます。
AI 分野で影響力のある人物であるアンドリュー・ング(Andrew Ng)は、講演で AI Agentic Workflow の4つの設計パターンを紹介しています 1:
- 反省(Reflection)
- ツール使用(Tool Use)
- 計画(Planning)
- マルチエージェント協力(Multiagent Collaboration)
さらにアンドリュー・ングは、Agent Workflow を活用した GPT-3 のパフォーマンスは、Agent Workflow を使用していない GPT-4 よりも優れていたことを示し、Agent Workflow が AI に与える実際的な効果の大きさを強調しています。
反省 Reflection:自ら振り返り、出力を最適化
反省(Reflection)は AI Agentic Workflow の中で最も広く応用される設計パターンです。AI は出力を生成した後、自ら結果を見直し修正します。先ほどの例のように、未来のテクノロジーに関する記事を生成する際、「反省」を備えた AI は、最初に生成した内容を急いで提示せず、何度も修正を重ね、複数回の反復を通して理想的な結果を導き出し、私たちの期待に沿った内容を生成します。
この自ら振り返るプロセスにより、AI の正確性と信頼性が大幅に向上し、現在では多くの AI 応用で標準装備となっています。
ツール使用 Tool Use:AI の機能を拡張
外部リソースやツールがなければ、GPT のような AI はネット検索、コード実行、画像処理などを直接行うことはできません。そこで開発者は、AI に「ツール使用」モードを追加し、AI がコア能力以外のタスクを実行できるようにしました。例えば、特定のテーマに関する最新情報を提供するよう求められた場合、AI はインターネット検索ツールを使ってリアルタイムに調査できます。
ツール使用(Tool Use)により AI はより汎用的になります。大型言語モデル(LLMs)は、基本的なテキスト生成タスクにとどまらず、さまざまな操作を実行できるようになり、その能力を拡張し、より幅広いシーンで活躍できるようになります。
計画 Planning:複雑なタスクをステップに分解し段階的に実行
計画(Planning)はもう一つの重要な設計パターンで、AI エージェントが複雑なタスクを分解し、段階的に実行できるようにします。この方法は、複数ステップを必要とするシナリオに特に適しています。
例えば「AI ドローンでの荷物配送」を考えます。AI 自律ドローンが複雑な環境(森など)を通過し、荷物を特定の場所へ届ける必要がある場合、このタスクには複数のステップが含まれ、ドローンは遭遇するさまざまな挑戦に即座に正しい判断を下さなければなりません。タスク全体の計画例としては、ルート計画、障害回避計画、電力管理、悪天候対策、荷物配送計画などがあります。
まず、AI ドローンは出発点から目的地までの最適ルートを計画し、安全性と配送効率を確保します。
次に障害物回避策を事前に計画します。突発的に障害物が出現した場合、迂回ルートに変更するのか、高度を上げて障害物を避けるのか、といった対応策を決定します。
また、目的地に到達する前に電力が不足しないよう、電力をリアルタイムで監視し、残量が一定以下になった際の対応策を事前に計画します。例えば、電力が不足する前に、安全で平坦な地面までの距離を判断するなどです。
配送において最も予測困難なのは「突発的な悪天候」です。AI ドローンは天候条件を判断し、必要に応じて安全な平坦地に緊急着陸するか、条件が整えば再飛行するかを計画に組み込みます。
最後に荷物の受け渡し計画です。荷物をどの高さでどのプラットフォームに置くか、人員が受け取る必要があるかなど、AI エージェントは自ら計画し、実行、判断、修正、調整できます。
「計画」型の AI Agentic Workflow はまだ発展途上ですが、一部の使用シナリオでは驚くべき成果を上げています。
マルチエージェント協力:全方位でタスク効率を向上
マルチエージェント協力(Multiagent Collaboration)では、複数の AI エージェントが異なる役割を担い、互いに協力してタスクを完了します。まるで AI の小チームのようです。
アンドリュー・ングが設立した AI 教育機関 DeepLearning.AI が毎週 The Batch で共有する最新 AI 情報の中に、マルチエージェント協力を応用した非常に興味深い例があります――文学作品の翻訳です 2。
先述の大型言語モデル(LLMs)は主に文字関連タスク、生成や翻訳などに用いられます。しかし、現時点では LLM の翻訳能力は文学作品の正確な翻訳には十分ではなく、特に言語は常に変化するため、英⇄中などの翻訳では単なる語句対応だけでは不十分です。
そこで開発者は「マルチエージェント協力」の概念を用いて、AI 翻訳チームを構築しました。このチームには CEO、編集アシスタント、上級編集者、翻訳者、校正者、推敲者などが含まれ、層ごとのレビューと推敲を経て、原文に忠実で翻訳言語の意図を正確に伝える作品を完成させます。
現時点では安定性にさらなる改善の余地がありますが、マルチエージェントの潜在力はすでに明らかです。特に、実際の作業環境を模したシナリオでは、異なる専門家が協力する状況を再現し、AI のパフォーマンスをさらに向上させます。

AI Agentic Workflow の将来展望
AI Agentic Workflow が進化し続ける中で、これら4つの設計パターンは、今後の AI 発展においてますます重要な役割を果たすでしょう。アンドリュー・ングは、Agentic Workflow モードを用いる AI は、回答やタスクの仕上げに時間をかけるため、使用時には待つことを学び、AI エージェントに十分な時間を与える必要があると述べています。まるで師匠が弟子の作品をじっくり仕上げるのを待つように、また上司が部下の修正や実行を辛抱強く見守るようにです。
AI Agentic Workflow は、現代の技術進化の自然な延長であるだけでなく、未来の AI 発展の新たな基盤を築く概念でもあります。この概念は、単一 AI システムの運用から、多 AI システムの協力時代への移行を示しています。
(本記事は ChatGPT により日本語へ翻訳されました。)
(本記事のカバー画像は Shutterstock より取得したイメージを使用しています。)
[出典]
1 Sequoia Capital. “What’s Next for AI Agentic Workflows Featuring Andrew Ng of AI Fund.” YouTube, 27 March 2024, https://youtu.be/sal78ACtGTc?si=qEhK464ViQCBuXiM.
2 “Machine Translation Goes Agentic.” The Batch, DeepLearning. AI, 15 August 2024, www.deeplearning.ai/the-batch/transagents-a-system-that-boosts-literary-translation-with-a-multi-agent-workflow/.