Chroma新検索AI、GPT-5並み精度を25分の1コストで実現

検索に特化したAIという新しいアプローチ
複雑な質問を自動で分解して並列処理
1. 不要な情報を自分で削除する「セルフエディティング」
コストは25分の1、速度は最大10倍
オープンソースのデータ生成ツールも公開
フリーランスへの影響
まとめ

検索に特化したAIという新しいアプローチ

AI開発プラットフォームのChroma社が、Context-1という検索専用のAIモデルをリリースしました。従来のChatGPTやClaudeのような汎用AIとは異なり、「複雑な検索タスク」だけに特化して設計されているのが特徴です。

一般的なRAG（検索拡張生成）システムでは、まず外部のデータベースから情報を取得し、その後にAIが回答を生成するという二段構えの仕組みでした。Context-1はこの考え方を根本から変えて、検索自体をAIモデルの責任範囲に含めています。つまり、モデル自身が「どの情報が必要か」「どの情報が不要か」を判断しながら検索を進めるのです。

技術的には、gpt-oss-20BというMixture of Experts(MoE)アーキテクチャをベースに、教師あり学習と強化学習を組み合わせたCISPOという手法で訓練されています。パラメータ数は20億と、GPT-5やClaude 4.6などの大規模モデルと比べるとはるかに小さいのですが、検索タスクにおいては同等以上の性能を発揮します。

複雑な質問を自動で分解して並列処理

Context-1の最大の強みは、マルチホップクエリと呼ばれる複雑な質問への対応力です。たとえば「2023年に上場したテック企業のうち、特許出願数が前年比で増加した企業の財務状況を比較したい」というような、複数のステップを踏まないと答えられない質問があったとします。

Context-1はこうした質問を受け取ると、自動的に目的別のサブクエリに分解します。「2023年上場のテック企業リスト」「各社の特許出願データ」「財務データの取得」といった具合です。そして、これらのサブクエリを並列に実行します。平均して1ターンあたり2.56回のツール呼び出しを行い、効率的に情報を収集していくのです。

利用できるツールは3種類用意されています。search_corpusはハイブリッド検索(BM25+密検索)、grep_corpusは正規表現による検索、read_documentは文書の読み取りです。これらを組み合わせて使うことで、Web検索、SEC提出書類、特許文書、メールアーカイブなど、さまざまなデータソースから必要な情報を引き出せます。

不要な情報を自分で削除する「セルフエディティング」

もうひとつの重要な機能が、セルフエディティングコンテキストです。一般的なAIは、一度取得した情報をすべてコンテキストに詰め込んでしまい、結果として関連性の低い情報がノイズになる「コンテキスト腐敗」という問題を抱えています。

Context-1は検索の途中で、prune_chunksというコマンドを使って不要なドキュメントを自ら削除します。プルーニング精度は0.94と高く、32,000トークンのコンテキストウィンドウ内に本当に必要な情報だけを残します。この仕組みにより、大規模なコンテキストを無駄に使わずに済むため、コストと速度の両面で大きなメリットがあるのです。

コストは25分の1、速度は最大10倍

性能面での数字も注目に値します。同じ検索タスクを実行した場合、GPT-5.4などのフロンティアモデルと比べて約25分の1のコストで済みます。推論速度も最大10倍高速です。20億パラメータという小型モデルならではの軽快さが、実用面で大きな差を生んでいます。

興味深いのは「Pareto戦略」と呼ばれる使い方です。4つのContext-1エージェントを並列で動かし、それぞれの結果を相互ランク融合という手法でマージすると、GPT-5.4単一実行と同等の精度を実現できます。つまり、複数の小型モデルを組み合わせることで、巨大モデル1つに匹敵する結果が得られるわけです。コストと精度のバランスを自分で調整できる柔軟性があります。

ベンチマークではBrowseComp-Plus、SealQA、FRAMES、HotpotQAなどの評価データセットが使われ、gpt-oss-120b、gpt-5.2、gpt-5.4、Sonnet/Opus 4.5および4.6といった大規模モデルと比較されています。検索精度では遜色なく、ホップカウント(推論ステップ数)が増えても信頼性が維持されることが確認されています。

オープンソースのデータ生成ツールも公開

Chroma社は技術の透明性を重視しており、GitHubにcontext-1-data-genというリポジトリを公開しています。これはマルチホップタスクの訓練データを生成するためのパイプラインで、Explore(探索)→Verify(検証)→Distract(妨害)→Index(索引)というパターンで動作します。

特徴的なのは「トピック的ディストラクター」を意図的に含めている点です。キーワードは関連しているけれど論理的には無関係な情報をデータセットに混ぜることで、モデルがキーワードマッチだけに頼らず、真に必要な情報を見極める力を養います。対象ドメインはWeb、SEC文書(10-K、20-F)、USPTO特許、メールアーカイブ(EpsteinファイルやEnronコーパス)など多岐にわたります。

このツールを使えば、自社データでカスタマイズした検索エージェントを訓練することも理論上は可能です。ただし実際に訓練を行うには相応の技術的知識とリソースが必要になるため、現時点ではAI開発者や研究者向けの情報と考えたほうがよいでしょう。

フリーランスへの影響

Context-1が実用化されれば、リサーチ業務の多いフリーランスにとって大きな変化が訪れる可能性があります。ライター、マーケター、コンサルタント、法務関係など、大量の資料を読み込んで情報を整理する仕事では、作業時間が大幅に短縮されるでしょう。

たとえば企業の財務分析レポートを作成する場合、従来なら複数のSEC文書を手作業で開いて該当箇所を探し、比較表を作る作業に数時間かかっていました。Context-1のような検索エージェントを使えば、質問を投げるだけで必要なデータが数分で揃います。その分、分析や執筆といった付加価値の高い作業に時間を使えるようになります。

コスト面でも恩恵があります。現在GPT-5やClaude Opusを使って大量の検索タスクを処理している場合、API料金が積み上がっていくのが悩みどころです。Context-1は同等の精度を約25分の1のコストで実現できるため、月間のAI利用コストを大きく削減できる可能性があります。特に外注やアシスタントを雇う余裕のない個人事業主にとっては、実質的な収益改善につながります。

ただし注意点もあります。現時点ではChroma社のリリース情報が技術詳細中心で、一般ユーザー向けのサービス形態や料金体系は明示されていません。開発者向けのAPIとして提供される可能性が高く、すぐに誰でも使えるわけではないでしょう。また、日本語対応についても不明です。英語の資料を扱う機会が多い人ほど恩恵を受けやすいと言えます。

まとめ

Context-1は検索に特化することで、大規模汎用モデルと同等の精度を低コスト・高速で実現した興味深い技術です。リサーチ業務の多いフリーランスにとっては、実用化されれば作業時間とコストの両面でメリットがあります。ただし現時点では技術情報が中心で、具体的なサービス提供形態は不明です。まずはChroma社の公式サイトや技術ドキュメントをチェックして、自分の業務に適用できそうか見極めるとよいでしょう。英語資料を日常的に扱う人は、今後の展開を追っておく価値があります。

参考リンク:
技術詳細: https://www.trychroma.com/research/context-1
GitHubリポジトリ: https://github.com/chroma-core/context-1-data-gen