ClawTeam、複数AIを協調させるフレームワークを公開

複数のAIが協調して働く新しいアプローチ
Google Colabで動く実装が登場
仕組みの中心にある3つのシステム
実際の動作は6つのフェーズで進む
フリーランスにとっての実用性
試すかどうかの判断基準
まとめ

複数のAIが協調して働く新しいアプローチ

AIツールを使っていると、一つのAIに全部やらせるのは難しいと感じることがあります。例えば、市場調査をしながら競合分析もして、さらに戦略を立てるといった複雑な作業です。ClawTeamは、この問題に対して「AIをチームとして働かせる」というアプローチを提案しています。

香港大学のデータサイエンス研究グループHKUDSが開発したこのフレームワークは、リーダー役のAIと複数の専門ワーカーAIを組み合わせます。リーダーが大きな目標を小さなタスクに分解し、それぞれの専門性を持ったワーカーが自律的に作業を進める仕組みです。人間のチームと同じように、タスクボードで進捗を共有し、メッセージで情報をやり取りします。

Google Colabで動く実装が登場

従来のClawTeamは、tmuxというターミナル管理ツールやgitのワークツリー、ファイルシステムを使ったメッセージキューなど、かなり複雑なローカル環境が必要でした。プログラマーでも構築に時間がかかる内容です。

今回公開されたチュートリアルでは、OpenAIのFunction Calling APIとPythonだけでClawTeamの中核機能を再現しています。Google Colabで動くため、ブラウザとOpenAIのAPIキーさえあれば試せます。専用のサーバーを用意する必要はありません。

使用するモデルはgpt-4o-miniがデフォルトです。これは複数のAIエージェントを同時に動かすため、コストを抑える選択だと考えられます。複数のAIが並行して動くと、API呼び出しの回数が増えるためです。

仕組みの中心にある3つのシステム

ClawTeamの実装には、3つの中核システムがあります。一つ目はTaskBoardで、これは人間が使うカンバンボードのようなタスク管理システムです。各タスクにはステータスがあり、依存関係も自動で解決します。例えば、タスクAが完了しないとタスクBが始められない場合、タスクAが終わると自動的にタスクBがペンディング状態に移行します。

二つ目はInboxSystemで、エージェント間のメッセージングを担当します。特定のエージェントに直接送るメッセージと、全員に送るブロードキャストの両方に対応しています。タスクの進捗報告や、他のエージェントへの質問などに使われます。

三つ目はTeamRegistryで、各エージェントの役割、現在のステータス、完了したタスクの数を追跡します。これにより、どのエージェントが何をしているかを把握できます。

これら3つのシステムはすべて、複数のエージェントが同時にアクセスしても問題ないように、スレッドセーフなロック機構を備えています。人間のチームでも、同じホワイトボードに複数人が同時に書き込むと混乱するのと同じ理由です。

実際の動作は6つのフェーズで進む

ClawTeamは、目標を入力すると6つのフェーズで処理を進めます。最初のフェーズでは、リーダーエージェントが目標を分析し、必要なタスクに分解します。例えば「AI関連の投資機会を調査する」という目標なら、市場動向の調査、競合分析、財務データの収集といったタスクに分けます。

次に、TaskBoard、InboxSystem、TeamRegistryを初期化し、必要な数のワーカーエージェントを起動します。各ワーカーは専門性を持っており、例えば市場調査担当、財務分析担当といった役割が割り当てられます。

その後、複数のラウンドにわたってタスクを実行します。ワーカーは自分が担当できるタスクをTaskBoardから取り出し、実行し、結果を報告します。他のワーカーが完了するのを待つ必要があるタスクは、依存関係が自動的に解決されるまでブロック状態のままです。

すべてのタスクが完了すると、リーダーが各ワーカーの結果を集めて最終レポートにまとめます。最後に、Richというライブラリを使って、タスクボードとエージェントの状態を視覚的に表示します。

フリーランスにとっての実用性

現時点では、このフレームワークは開発者や研究者向けの実験的なツールです。実際に仕事で使うには、プログラミングの知識が必要です。チュートリアルのコードを読んで、自分の用途に合わせてカスタマイズする作業が発生します。

ただ、マルチエージェントの仕組みそのものは、今後フリーランスの仕事に影響を与える可能性があります。例えば、ライティングの仕事で複数のAIを使い分ける場合、一つのAIにリサーチを任せ、別のAIに執筆を任せ、さらに別のAIに校正を任せるといった分業が、将来的に自動化されるかもしれません。

チュートリアルには、AIヘッジファンド、リサーチスウォーム、エンジニアリングチームといった具体例が含まれています。これらは専門的な用途ですが、考え方は他の分野にも応用できます。例えば、マーケティングリサーチで複数のAIに異なる視点からデータを分析させたり、コンテンツ制作で複数のAIに異なる切り口で下書きを作らせたりすることが考えられます。

コストの面では、複数のAIを同時に動かすため、単一のAIを使うよりもAPI呼び出しが増えます。gpt-4o-miniを使うことで費用を抑えていますが、それでも複数のエージェントが並行して動くと、それなりの料金が発生します。実験的に試すのは良いですが、本格的に導入する前にコストの見積もりは必要です。

試すかどうかの判断基準

ClawTeamを試す価値があるのは、Pythonのコードを読める人で、複数のAIを組み合わせた自動化に興味がある人です。Google Colabで動くため、環境構築のハードルは低くなりました。GitHubに完全なNotebookが公開されているので、それを開いて実行すれば動作を確認できます。

一方、プログラミングに不慣れな人や、すぐに仕事で使えるツールを探している人には向いていません。これはフレームワークであり、自分で用途に合わせてカスタマイズする必要があります。

今後、このようなマルチエージェントの仕組みを組み込んだノーコードツールが登場する可能性はあります。その時に備えて、どういう仕組みで動いているのかを知っておくのは悪くない選択です。特に、AIを使った業務フローの設計に関心がある人にとっては、参考になる内容です。

まとめ

ClawTeamは、複数のAIをチームのように協調させる実験的なフレームワークです。今回公開されたチュートリアルで、Google Colabでも動くようになりました。すぐに仕事で使えるツールではありませんが、将来的にマルチエージェントの仕組みがノーコードツールに組み込まれる可能性を考えると、概念を理解しておくのは有益です。プログラミングができる人は、GitHubのNotebookを試してみると良いでしょう。

参考リンク:
ClawTeam GitHub: https://github.com/HKUDS/ClawTeam
完全なNotebook: https://github.com/Marktechpost/AI-Tutorial-Codes-Included/blob/main/AI%20Tutorial%20Codes/ClawTeam_Agent_Swarm_Intelligence_OpenAI_Marktechpost.ipynb