AIエージェント訓練を90%低コスト化、OSGymフレームワーク発表

AIエージェント訓練を90%低コスト化、OSGymフレームワーク発表 AIニュース・トレンド

コンピュータを使うAIの訓練が、予算の壁で止まっていた

最近、ClaudeやOpenAIのOperatorのように、画面を見てマウスを動かし、キーボードで文字を入力するAIが話題です。こうした「コンピュータ使用エージェント」は、人間と同じようにアプリを操作できるため、事務作業の自動化に大きな可能性を秘めています。

ただ、こうしたAIを訓練するには、大量の仮想マシンが必要でした。AIに何千回も操作を繰り返させて学習させるには、並列で動く仮想環境が欠かせません。従来の方法では、1台の仮想マシンに約24GBのディスク容量と専用のCPU、メモリが必要で、数百台を同時稼働させるとアカデミックな研究予算では到底まかなえないコストになっていました。

OSGymは、この問題を解決するために設計された新しいフレームワークです。仮想マシンの密度を最適化し、ディスク使用量を88%削減することで、研究者が限られた予算でも大規模な実験を実行できるようにしました。

1レプリカあたりのコストを10分の1に削減

OSGymの最大の特徴は、ハードウェアリソースの使い方を徹底的に見直した点にあります。従来は1台の仮想マシンに約2.10ドル/日かかっていたところ、OSGymでは0.234ドル/日まで圧縮しました。これは、サーバーのRAM容量に応じてレプリカ数を最適化し、無駄なリソース割り当てを排除した結果です。

さらに、KVM仮想化とCopy-on-Writeという技術を組み合わせて、ディスク使用量を3.1TBから366GBまで削減しました。これにより、物理ディスクの消費が88%減り、仮想マシンの起動時間も30秒から0.8秒へと37倍高速化しています。大量の仮想環境を短時間で立ち上げられるため、実験のサイクルが劇的に速くなります。

実際の運用では、1,024台の仮想マシンを並列稼働させて、LibreOffice、Chrome、Thunderbird、VLCなど10種類のアプリケーションでAIに操作を学習させました。約1,420トラジェクトリ/分という速度でデータを収集し、すべての訓練データセット生成にかかったコストはわずか43ドルでした。

実用レベルの成功率を達成したモデル

OSGymを使って訓練されたQwen2.5-VL 32Bというモデルは、OSWorld-Verifiedベンチマークで56.3%の成功率を記録しました。これは、AIが画面を見ながら指示通りにアプリを操作できる確率が5割を超えたことを意味します。

訓練には教師あり学習と強化学習を組み合わせており、200ステップ、バッチサイズ64、学習率1e-6という設定で実施されました。このレベルの訓練を従来の環境で行おうとすれば、数千ドルから数万ドルのコストがかかる可能性がありましたが、OSGymでは数十ドルで実現しています。

堅牢性を支える設計

OSGymは、単にコストを下げるだけでなく、安定性にも配慮しています。各仮想マシンに専用の状態マネージャーを配置し、単一障害点を排除しました。ホストメモリが10%以下または8GB以下になると、新しい仮想マシンの作成をブロックして、システム全体のクラッシュを防ぎます。

また、ステップレベルで最大10回の再試行、タスクレベルではランナー障害時に自動的に新しいランナーに再割り当てする仕組みを備えています。これにより、長時間の訓練中に一部の仮想マシンがクラッシュしても、全体の実験が止まることはありません。

フリーランスにとっての意味

このフレームワーク自体は、研究者やAI開発チーム向けのインフラです。フリーランスが直接使う機会は少ないかもしれません。ただ、OSGymのようなコスト効率の高い訓練環境が普及すれば、コンピュータ使用エージェントの性能が加速度的に向上する可能性があります。

将来的には、より高精度で安価なAIアシスタントが登場し、フリーランスの事務作業やクリエイティブワークのサポートが強化されるでしょう。たとえば、スプレッドシートの集計、メールの下書き、プレゼン資料の作成といった定型業務を、AIが画面を見ながら自動でこなしてくれる日が近づいています。

また、AIツールの開発コストが下がることで、個人開発者やスタートアップが独自のエージェントを訓練しやすくなります。特定の業務に特化したAIを、少ない予算で作れるようになれば、ニッチな市場での自動化ソリューションが増えるはずです。

まとめ

OSGymは、AIエージェント訓練の民主化を進める重要な一歩です。研究者だけでなく、将来的には個人開発者やフリーランスにも恩恵が広がるでしょう。今すぐ使う必要はありませんが、こうした技術がどう進化するか、定期的にチェックしておくと良いかもしれません。

詳細は元記事を参照してください。

コメント

タイトルとURLをコピーしました