GoogleのRAG精度が34%向上、複数文書をまたぐ検索が進化

社内の情報を横断的に検索するシステムを作ったことがある方なら、一度は「なんでこの質問、うまく答えられないんだろう」と感じたことがあるのではないでしょうか。RAG（Retrieval-Augmented Generation）と呼ばれる手法は、AIが外部文書を参照しながら回答を生成できる仕組みとして広く使われてきましたが、複数のデータソースをまたいだり、段階的な推論が必要な質問には弱さがありました。Google Cloudが今回公開した「Agentic RAG」は、その弱点を正面から解決しようとするアプローチです。

従来のRAGとAgentic RAGの違い
複数エージェントが連携して動く仕組み
APIはどう使うのか
現時点での注意点
フリーランスへの影響
まとめ

従来のRAGとAgentic RAGの違い

これまでの一般的なRAGは、「質問を受け取る→関連文書を検索する→回答を生成する」という一方向の流れで動いていました。一度の検索で十分な情報が得られれば問題ありませんが、たとえば「A製品の売上傾向と、その背景にある市場動向を合わせて教えて」といった複合的な質問になると、一発検索ではどうしても情報が不足しがちです。

Agentic RAGでは、この流れが「反復型」に変わります。検索して得た情報を評価し、まだ足りない部分があれば何が不足しているかを分析してから再検索する、というループを繰り返す仕組みです。Google Researchによれば、この方式によって標準的なRAGと比べて最大34%の精度向上を達成したとのことです。

複数エージェントが連携して動く仕組み

Agentic RAGの内部では、複数の専門エージェントが役割を分担しています。全体の流れをまとめるオーケストレーター、検索の計画を立てるプランニングエージェント、実際に文書を取りに行く検索エージェント、取得した情報をもとに推論を行う推論エージェント、そして「今ある情報で回答できるか」を判定するSufficient Context Agentと呼ばれる検証役が組み合わさっています。

なかでもSufficient Context Agentの役割が特徴的です。このエージェントは、取得されたスニペットや途中で生成された下書き、そして「まだ足りていない情報」を照らし合わせ、回答の品質が十分でないと判断した場合は中途半端な回答を返さずに追加検索の指示を出します。これにより、「情報が揃っていないのに自信ありげな回答を生成してしまう」という従来のAIによくある問題を抑えることができます。

また、クロスコーパス（複数のデータソースをまたぐ）検索の精度は90.1%を達成しており、その際のレイテンシーの増加は3%以下とされています。複数ソースを横断しているにもかかわらず、応答速度への影響がほとんどないという点は、実務利用を考えるうえで気になるポイントを一つクリアしています。

APIはどう使うのか

開発者向けには、AskContextsとAsyncRetrieveContextsという2つのAPIが案内されています。AskContextsは同期的に回答を取得する際に使い、AsyncRetrieveContextsは非同期処理が必要な場面向けの機能です。これらはGemini Enterprise Agent Platform上で動作するため、すでに同プラットフォームを利用しているGoogle Cloud環境であれば組み込みやすい設計になっています。

具体的な活用イメージとしては、たとえば複数の社内Wikiや契約書データベース、過去のプロジェクト資料を横断して「この案件の類似事例を探して、そのときの対応策も含めて教えて」といった問い合わせに答えるシステムの構築が挙げられます。従来であれば複数の検索クエリを手動で組み合わせて調べていた作業を、エージェントが自律的に繰り返す形で代替できる可能性があります。

現時点での注意点

現在は「公開プレビュー」段階であり、正式リリース（GA）ではありません。料金体系や具体的な提供条件はまだ公表されていないため、本番環境への組み込みを検討する場合は今後の続報を待つ必要があります。日本語対応や利用可能地域についても現時点では明確な情報がなく、国内プロジェクトへの適用を考えている方は別途確認が必要です。

フリーランスへの影響

この機能は主にエンタープライズ向けの開発基盤として位置づけられており、AIエンジニアやクラウドアーキテクトが直接の対象ユーザーです。フリーランスとして企業のAI導入支援や社内検索システムの構築を請け負っている方にとっては、提案の選択肢として頭に入れておく価値があります。特に、複数部門の文書を横断した質問応答システムや、根拠を明示しながら回答するRAG基盤の構築案件では、差別化の材料になり得ます。

一方、個人レベルで自分の作業に使えるツールというよりは、システム開発を通じてクライアントに提供するソリューションとしての位置づけが現実的です。プロジェクト単価や提案力の面で強みになる可能性はあるものの、現段階はプレビューのため、実際の案件に使うにはもう少し時間がかかりそうです。技術的な関心がある方は今のうちに仕組みを理解しておき、正式リリース後に動けるよう準備しておくのが得策かもしれません。

まとめ

GoogleのAgentic RAGは、複数データソースをまたいだ複雑な検索・回答に対応する仕組みとして注目の発表です。現段階は公開プレビューであり、料金や仕様も未確定なため、企業向けAI開発に携わるフリーランスの方はまず動向を追いつつ、正式リリースのタイミングで検討するのがよいと思います。詳細はGoogle Cloudの公式ドキュメントからご確認ください。

参考：Google Gemini Enterprise Agent Platform 公式ページ