Google DeepMind「UL」発表、画像生成の学習コスト大幅削減

Google DeepMind「UL」発表、画像生成の学習コスト大幅削減 AIニュース・トレンド

画像生成AIの「学習効率」を改善する新技術

画像生成AIは、膨大なデータと計算リソースを使って学習します。その過程で「潜在表現」と呼ばれる、画像の特徴を圧縮した中間データを作るのですが、この圧縮の仕方が学習効率に大きく影響します。

Google DeepMindが発表したUnified Latents(UL)は、この潜在表現の作り方を数学的に厳密に制御する仕組みです。従来の手法では、情報をどれだけ圧縮するかの調整が曖昧で、試行錯誤が必要でした。ULはこの調整を自動化し、エンコーダー(画像を圧縮する部分)とデコーダー(圧縮データから画像を復元する部分)、そしてディフュージョンプライヤー(ノイズ除去の学習をサポートする部分)を同時に訓練します。

具体的には、エンコーダーが出力したデータに一定量のノイズを加え、そのノイズ量を「log-SNR λ(0)=5」という固定値で管理します。これにより、潜在表現に含まれる情報量の上限が明確になり、無駄な計算を減らせるようになりました。

2段階の訓練プロセス

ULの訓練は2段階に分かれています。第1段階では、オートエンコーダー(エンコーダーとデコーダーのセット)とディフュージョンプライヤーを一緒に訓練します。第2段階では、第1段階で学習したエンコーダーとデコーダーを固定し、大規模なベースモデルの訓練に集中します。

この方法により、訓練の各段階で最適化すべき部分が明確になり、全体の学習効率が向上します。従来のLatent Diffusion Models(LDM)では、情報の圧縮率と生成品質のバランス調整が難しく、何度も試行錯誤が必要でしたが、ULではその手間が大幅に減ります。

どれくらいの性能が出ているのか

Google DeepMindの実験では、ImageNet-512(512×512ピクセルの画像データセット)でFID(生成画像の品質指標)1.4、Kinetics-600(動画データセット)でFVD(動画品質指標)1.3を記録しました。これらは現時点で最高水準の数値です。

さらに重要なのは、Stable Diffusionをベースにした従来手法よりも少ない計算量(FLOPs)でこの性能を達成した点です。たとえば同じ品質の画像を生成する場合、ULは訓練にかかる計算コストを2〜3割削減できる可能性があります。

また、ULは「Prior-Alignment」と「Reweighted Decoder ELBO」という技術を使い、低周波(画像の大まかな構造)と高周波(細かいディテール)の両方を効率的に学習します。これにより、ぼやけた画像や不自然なノイズが減り、より自然な生成結果が得られます。

実務での活用イメージ

現時点ではまだ研究段階ですが、将来的には以下のような使い方が考えられます。

たとえば、自社ブランドの商品画像を大量生成したいEコマース事業者が、独自の画像生成モデルを訓練する場合、ULを使えば学習にかかるGPUコストを削減できるかもしれません。また、動画生成AIの開発者にとっては、高解像度動画の学習効率が上がることで、より短期間でモデルを改善できる可能性があります。

ただし、これらはあくまで技術的な可能性であり、現時点で一般のフリーランスや個人事業主が直接使えるツールやAPIは提供されていません。

フリーランスへの影響

この技術は、画像生成AIの「裏側」を改善するものなので、すぐに日常業務に影響するわけではありません。ただし、将来的にはStable DiffusionやMidjourneyのようなツールがこの技術を採用すれば、生成速度の向上や料金の低下につながる可能性があります。

特に恩恵を受けそうなのは、AI開発に関わるエンジニアや、独自モデルを訓練したい企業です。学習コストが下がれば、中小規模のプロジェクトでも高品質な画像生成モデルを作りやすくなります。

一方、デザイナーやライターなど、既存の画像生成ツールを使う側の立場では、今すぐ行動を変える必要はありません。ただし、今後数ヶ月から1年以内に、この技術を組み込んだ新しいツールが登場する可能性はあるので、業界動向を追っておくと良いでしょう。

まとめ

Unified Latentsは、画像生成AIの学習効率を改善する研究成果です。現時点では一般利用できるツールではありませんが、将来的に既存サービスの性能向上やコスト削減につながる可能性があります。AI開発に関わる方は情報をフォローしておく価値がありますが、ツール利用者としては「様子見」で問題ありません。詳細はGoogle DeepMindの発表やMarkTechPostの記事をご確認ください。

コメント

タイトルとURLをコピーしました