Liquid AIが多言語検索モデル2種を発表

Liquid AIが検索特化モデルを2種類同時リリース

AI研究スタートアップのLiquid AIが、テキスト検索に特化した2つのモデルを2026年6月19日に発表しました。「LFM2.5-Embedding-350M」と「LFM2.5-ColBERT-350M」という2種類で、どちらも350Mパラメータという比較的コンパクトなサイズながら、英語・日本語・韓国語・アラビア語・ドイツ語・スペイン語・フランス語・イタリア語・ノルウェー語・ポルトガル語・スウェーデン語の計11言語に対応しています。

Liquid AIはこれまで、いわゆる「Transformer」とは異なるアーキテクチャを採用した独自モデル(LFMシリーズ)を開発してきた企業です。今回の発表は、その技術基盤を検索領域に本格展開する動きとして注目されています。

2つのモデルの違いと使い分け

今回リリースされた2つのモデルは、用途に応じて使い分けることを前提に設計されています。

まず「LFM2.5-Embedding-350M」は、いわゆる密なバイエンコーダ(dense bi-encoder)と呼ばれる構造を採用しています。文書や質問文をそれぞれ1つのベクトル(数値の塊)に変換し、そのベクトル同士の距離で関連性を判定します。仕組みがシンプルなぶん処理が速く、大量の文書を素早くスキャンしたい場面に向いています。たとえば、社内ドキュメントを横断的に検索するシステムや、RAG(検索拡張生成)における最初の絞り込みステップなどが典型的な用途です。

一方「LFM2.5-ColBERT-350M」は、「late interaction」と呼ばれる方式を使います。これは文書と質問の各トークン(単語レベルの細かな単位)を個別に照合していく手法で、より細かいニュアンスの一致を捉えられます。精度が重要な場面、たとえば法律文書の検索や専門用語が多い技術文書の照合などで力を発揮します。処理コストはEmbeddingモデルより高くなりますが、その分、検索品質は上がります。

Liquid AIは企業向けスタックにおいて、エンドツーエンドの検索レイテンシを最小1.5msと説明しています。これはミリ秒単位の話なので、ユーザーがほぼ遅延を感じないレベルの速度感です。実際のシステムではネットワーク遅延なども加わるため、単純にその数字が保証されるわけではありませんが、設計上の目標値としては参考になる指標です。

多言語・クロスリンガル検索への対応

このモデルが特に意識しているのが、多言語環境での検索です。「クロスリンガル検索」とは、たとえば日本語で入力した質問に対して、英語やフランス語で書かれた文書を正確に引き出す、という使い方を指します。グローバルなプロジェクトや、複数言語が混在するドキュメント環境では、従来はかなり難しかった検索スタイルです。

LFM2.5シリーズは日本語も11言語のうちの1つとして含まれており、日本語と英語を行き来するような検索ニーズにも対応しています。たとえば、日本語で書かれた仕様書と英語の技術ドキュメントを同じ検索インフラで扱いたい、という場面では試す価値がありそうです。

料金と利用条件について

現時点では、料金体系や一般公開の範囲について詳細が明示されていません。Liquid AIの公式ページや元記事でも具体的な価格は確認できませんでした。エンタープライズ向けの製品として位置づけられている点を考えると、個人やスモールチームが気軽に試せる無料枠があるかどうかは、現時点では不明です。興味がある方は、公式サイトで問い合わせや追加情報を確認されることをおすすめします。

フリーランスへの影響

このモデルが最も直接的に関係してくるのは、検索システムや社内ツールの開発を受注しているフリーランスエンジニアや、RAGを使ったAIアプリを構築している方です。クライアントから「複数言語の文書を横断的に検索できる仕組みを作ってほしい」という依頼を受けた場合、LFM2.5シリーズはソリューションの選択肢として検討できる存在になります。

特に、これまで多言語検索を実装しようとすると、言語ごとに個別のモデルを用意したり、翻訳APIを組み合わせたりと、構成が複雑になりがちでした。今回のモデルが11言語をネイティブに扱えるなら、その複雑さをある程度解消できる可能性があります。ただし、実際にどの程度の精度が出るかは、自分の扱うデータで試してみないと判断しにくいところです。

一方、プログラミングをあまりしないフリーランスのライターやデザイナーにとっては、今すぐ実務に直結する話ではありません。「こういう検索インフラが登場しつつある」という業界トレンドとして、頭の片隅に置いておく程度で十分でしょう。

まとめ

Liquid AIの今回の発表は、多言語検索やRAG開発に関わるエンジニアにとって注目しておきたいニュースです。日本語対応も含まれているため、国内のプロジェクトへの応用も視野に入ります。料金や提供条件がまだ不透明なため、まずは公式サイトで続報を確認しつつ、情報が揃い次第で試してみるのがよさそうです。

参考リンク:元記事(MarkTechPost)

コメント

タイトルとURLをコピーしました