Poolside AI、コーディング特化モデル2種を公開

2つのモデルが同時リリース
ローカル実行できる理由
独自の訓練手法を採用
エージェント型コーディングとは
1. 従来のChatGPTやCopilotとの違い
実際の性能はどうなのか
フリーランスへの影響
まとめ

2つのモデルが同時リリース

Poolside AIが発表したのは、コーディング作業に特化した2つのモデルです。1つ目の「Laguna M.1」は総パラメータ数225Bの大規模モデルで、SWE-bench Verifiedというコーディングベンチマークで72.5%のスコアを記録しました。これは既存のAIコーディングツールと比較しても高い水準です。

2つ目の「Laguna XS.2」は総パラメータ数33Bの軽量版で、こちらが個人開発者やフリーランスにとって使いやすい設計になっています。36GBのRAMを搭載したMacがあれば、Ollamaという無料ツールを経由して自分のパソコン上で動かせます。クラウドサービスに依存しないため、月額料金を気にせず使える点が大きな違いです。

ローカル実行できる理由

XS.2が軽量なのは、Mixture-of-Experts（MoE）という技術を採用しているためです。これは256個の専門家モジュールを用意しておき、必要なタイミングで必要なモジュールだけを呼び出す仕組みです。結果として、トークンあたり実際に動くのは3Bパラメータ分だけで済みます。

さらにコンテキストウィンドウが131,072トークンと長いため、大規模なコードベース全体を一度に読み込んで解析することも可能です。たとえば、WordPressプラグインのコード全体を渡して「このバグを修正して」と指示すれば、ファイル間の依存関係も考慮した修正案を提示してくれます。

独自の訓練手法を採用

Poolside AIは既存のオープンソースモデルをベースにせず、すべてゼロから訓練しています。その過程で「AutoMixer」という独自手法を使い、約60個の小規模モデルを異なるデータ配分で訓練して、最適なデータミックスを探索しました。結果として30T（30兆）トークン以上のデータで訓練されており、コード、数学、STEM分野の知識がバランスよく含まれています。

興味深いのは、あえて中・低品質のデータも一部残している点です。高品質データだけで訓練すると特定分野に偏りが生じるため、多様性を保つために約2倍の量のユニークなトークンを確保したとのことです。また、合成データも活用しており、XS.2の訓練データの約13%は人工的に生成されたコードやテキストです。

エージェント型コーディングとは

Lagunaシリーズは単なるコード補完ツールではなく、「エージェント型コーディング」を想定して設計されています。これは、ユーザーが大まかな指示を出すと、AIが自律的にファイルを作成・編集・テストまで実行する働き方です。

実際にPoolside AIは「pool」という軽量のターミナルベースのコーディングエージェントも同時に公開しました。これはLagunaモデルと組み合わせて使うツールで、ターミナル上でAIとやり取りしながらコードを生成できます。たとえば「この機能を追加して」と指示すれば、必要なファイルを自動で作成し、既存コードとの整合性も確認してくれます。

従来のChatGPTやCopilotとの違い

GitHub CopilotやChatGPTのコード生成機能は、主に「1つの関数」や「1つのファイル」単位での補完に強みがあります。一方、Lagunaはプロジェクト全体を俯瞰した作業を想定しており、複数ファイルにまたがる変更や、長期的なリファクタリング作業に向いています。

また、XS.2はローカル実行できるため、クライアントの機密情報を含むコードを扱う場合でも安心です。クラウド型のAIサービスでは、入力したコードがサーバーに送信されるリスクがありますが、ローカル実行ならその心配はありません。

実際の性能はどうなのか

SWE-bench Verifiedというベンチマークでは、実際のGitHubリポジトリから抽出されたバグ修正タスクを解けるかどうかが測定されます。XS.2は68.2%のスコアを記録しており、これは「フリーランスエンジニアが1時間かけて解決するようなバグの約7割をAIが自動で修正できる」レベルです。

ただし、これはベンチマーク上の数字であり、実務では想定外のエラーや環境依存の問題も発生します。現時点では「作業の下書きを作ってくれるアシスタント」と考えた方が現実的です。

フリーランスへの影響

まず、受託開発やWordPressカスタマイズを手掛けているフリーランスにとっては、作業時間の短縮につながる可能性があります。たとえば、クライアントから「この機能を追加してほしい」と依頼された際、Lagunaに既存コードを渡して修正案を出してもらえば、実装の方向性を素早く確認できます。

また、ノーコードツールを使っている人にとっても、カスタムコードが必要になった場面で役立ちます。MakeやZapierで自動化を組んでいて、「ここだけPythonスクリプトが必要」という場合、XS.2に要件を伝えれば数分でコードを生成してくれます。

一方で、完全に作業を代替できるわけではありません。生成されたコードは必ずレビューが必要ですし、セキュリティ上の問題がないかチェックする知識も求められます。AIが書いたコードをそのまま納品してトラブルになった場合、責任を負うのはあなた自身です。

収益面では、同じ作業量をより短時間でこなせるようになれば、時給換算での収入は上がります。ただし、クライアント側も「AIを使えば安く早くできるはず」と値下げ交渉してくる可能性もあるため、単価維持のためには付加価値の提案が重要になります。

まとめ

Laguna XS.2は無料で試せるため、まずはOllamaをインストールして動かしてみるのが良いでしょう。HuggingFaceからモデルをダウンロードして、自分が普段書いているコードを渡してみてください。実際に使ってみて「これは使える」と感じたら、日常の開発フローに組み込む価値はあります。ただし、過度な期待は禁物です。現時点では「優秀なアシスタント」であり、「完全な代替」ではありません。

詳細な技術情報はPoolside AIの公式ブログで公開されています。モデルウェイトはHuggingFaceから入手可能です。