JetBrainsがMellum2公開、軽量MoEでAI開発を高速化

JetBrainsといえば、IntelliJやPyCharmなどの統合開発環境(IDE)で知られる開発ツールの老舗です。そのJetBrainsが今回発表したMellum2は、単なるコード補完ツールの延長ではなく、複数のAIモデルを組み合わせた「マルチモデルAIパイプライン」の中で特定の役割を担うことを想定した、かなり目的意識の強いモデルです。

Mellum2とは何か、どんな設計になっているか

Mellum2はMixture-of-Experts(MoE)と呼ばれるアーキテクチャを採用しています。MoEとは、モデル全体の中から必要な部分だけを選んで動かす仕組みのことで、全体のパラメータ数は12Bあっても、1トークンを処理するたびに実際に使うのは2.5B分のみという動き方をします。これにより、大きなモデルに近い精度を保ちながら、推論速度は同規模のモデルと比べて2倍以上という報告も出ています。

技術的な詳細を少し補足すると、64個のエキスパートモジュールで構成され、コンテキスト長は128Kトークンに対応。Grouped-Query AttentionやMulti-Token Prediction、FP8ハイブリッド精度といった最新技術も組み込まれています。設計の隅々に「とにかく速く、軽く動かす」という意図が見えます。

どんな場面で使えるのか

Mellum2が得意とするのは、AIワークフローの「中継役」です。たとえば、複数のAIツールを連携させるパイプラインを作るとき、入ってきたリクエストをどのモデルに振り分けるかを判断する「ルーティング」の処理は、高精度の大型モデルを使うほどのことでもありません。でもここにMellum2のような軽量・高速なモデルを配置することで、全体のレスポンスを速めながらコストも抑えられるわけです。

RAG(検索拡張生成)パイプラインでも活躍できます。検索結果を要約したり、コンテキストを圧縮して後段のモデルに渡したりする処理は、遅延に敏感なタスクです。ここでMellum2を使えば、メインのLLMへの入力を整えながら全体の速度を落とさずに済みます。また、エージェント型のワークフローでサブエージェントとして組み込み、計画立案や検証、コンテキストの準備といった中間処理を任せる使い方も想定されています。

コード生成やコード編集にも対応しており、自然言語とコードの両方を扱えます。前身のMellumがコード補完専用の4Bモデルだったことを考えると、対応範囲がかなり広がっていることがわかります。

オープンソースで自前環境にも導入しやすい

Mellum2はApache 2.0ライセンスで公開されており、商用利用も自由です。Hugging Faceからモデルを取得でき、ローカルで動かすことも、自前のサーバーにホストすることも、特定のタスク向けにファインチューニングすることも可能です。クラウドAPIに依存せず、データを社外に出したくないチームや、コストを自分でコントロールしたい開発者にとっては、選択肢として検討しやすいモデルといえます。

注意点として、Mellum2はマルチモーダル(画像や音声への対応)には対応していません。汎用的に何でもこなすフロンティアモデルではなく、特定の用途に絞って使う「フォーカルモデル」として設計されています。何でもできる万能ツールを探している場合は、ちょっと方向性が違うかもしれません。

フリーランス・個人開発者への影響

Mellum2が直接的に役立つのは、AIを使った開発やツール構築を自分でやっている方です。たとえば、複数のAPIを組み合わせたワークフローを作っているフリーランスのエンジニアが、ルーティングや要約の処理を外部APIに頼っているなら、Mellum2をローカルに立てることでそのコストを削減できる可能性があります。

また、クライアントから「AIシステムを社内に閉じた環境で動かしたい」という要件をもらうことが増えている方にとっても、オープンソースで自己ホスト可能な軽量モデルの選択肢が増えたことは実務的な意味があります。自分のポートフォリオや提案の幅が広がる材料として使えるかもしれません。

一方、AIツールを使って文章を書いたりデザインを作ったりという用途には直接関係しません。Mellum2はあくまでも開発者向けのモデルで、ノーコードツールやチャット型UIから使うものではないためです。「コードは書かないけどAIは活用したい」という方には、今回の発表はあまり関係がないといって差し支えないでしょう。

まとめ

Mellum2はAI開発のパイプラインを組んでいる方、またはこれから取り組みたい方に向けた、軽量で使いやすいオープンソースモデルです。Hugging Faceで無料で入手できるので、開発環境がある方はまず試してみるのが一番わかりやすいでしょう。コードを書かない方は、今回は様子見で問題ありません。

参考リンク:元記事(英語)

コメント

タイトルとURLをコピーしました