動画編集の「物理的な矛盾」を解決
動画から不要なオブジェクトを削除する作業は、フリーランスの動画編集者にとって日常的なタスクです。しかし、従来のツールには大きな問題がありました。オブジェクトを消しても、そのオブジェクトが他の物体に与えていた影響は残ってしまうのです。
具体的な例を挙げると、人物がテーブルに手を置いているシーンで、その人物だけを削除した場合を想像してください。従来のツールでは、人物は消えても手が触れていた部分のテーブルの影や、手の重みによるテーブルクロスのしわは残ったままになります。これらを手作業で修正するには、フレームごとに細かい調整が必要でした。
VOIDはこの問題を根本から解決します。削除されたオブジェクトによる物理的な影響を理解し、それに応じてシーン全体を再構成する能力を持っています。人物が支えていた物体があれば、削除後にその物体が落下する動きまで生成できます。
Quadmask技術による精密な制御
VOIDの核心技術は「Quadmask」と呼ばれる仕組みです。従来の動画編集AIは、削除する部分としない部分を白黒の2値で指定していました。VOIDは4つの値を使い分けることで、より複雑な指示が可能になっています。
この4値は、削除対象、削除対象と影響範囲の重複部分、相互作用で変化する領域、そして背景という役割を持ちます。たとえば、ボールを蹴る人物を削除する場合、人物本体だけでなく、ボールが受ける影響範囲も指定できます。結果として、人物が消えた後、ボールは地面に転がり落ちる自然な動きを見せます。
この技術により、ハリウッドのVFXチームが数週間かけて修正していた問題を、自動的に処理できるようになりました。フリーランスの編集者にとって、これは大きな競争力になります。
2段階の処理で高品質を実現
VOIDは2つのパスを使って動画を処理します。第1パスでは基本的な削除と背景の補完を行います。ほとんどの動画はこの段階で十分な品質になります。第2パスでは、オブジェクトの形状の歪みを修正し、フレーム間での動きを滑らかにします。
この2段階処理により、複雑なシーンでも破綻の少ない結果が得られます。従来のツールでは、フレームごとに微妙な違いが生じ、再生すると不自然なちらつきが発生することがありました。VOIDはこの問題を光学フローという技術を使って解決しています。
技術的な裏側
VOIDはAlibabaが開発したCogVideoX-Fun-V1.5-5b-InPというモデルをベースにしています。50億のパラメータを持つ3D Transformer構造で、最大197フレームまで処理できます。解像度は384×672がデフォルトですが、用途に応じて調整可能です。
興味深いのは訓練データの作り方です。実際の動画で「オブジェクトがある状態」と「ない状態」の両方を大量に集めるのは現実的ではありません。そこで研究チームは、Blenderという3DCGソフトを使って合成データを作成しました。人間がオブジェクトを持っているシーンをレンダリングした後、その人間をシミュレーションから削除して物理演算を再実行することで、物理的に正確な「削除後」の動画を生成したのです。
既存の動画編集AIと比較した実験では、VOIDはProPainterやRunway、MiniMaxなどの競合ツールを上回る結果を示しました。特にオブジェクト削除後のシーンの自然さで優位性が確認されています。
フリーランスへの影響
動画編集を仕事にしているフリーランスにとって、この技術は作業時間に直接影響します。従来は1つのシーンの修正に数時間かかっていた作業が、数分で完了する可能性があります。特にYouTube動画の編集やショートムービーの制作では、クライアントから「この部分を消してほしい」という要望が頻繁にあります。
ただし、現時点では論文とモデルが公開されている段階で、一般的な編集ソフトに統合された使いやすいツールとしては提供されていません。技術的な知識がある人であれば、公開されているリポジトリから試すことは可能です。
収益面での影響は、使い方次第です。作業時間が短縮できれば、同じ時間でより多くの案件をこなせます。一方で、この技術が広く普及すれば、動画編集の単価が下がる可能性もあります。今のうちに使いこなせるようになっておくことで、他の編集者との差別化につながるでしょう。
特に恩恵を受けるのは、商品紹介動画や不動産のプロモーション映像を扱う編集者です。撮影後に「この看板を消したい」「この通行人を削除してほしい」といった依頼に、迅速に対応できるようになります。
まとめ
VOIDは動画編集の可能性を広げる技術ですが、現時点では一般的なツールとしてすぐに使える状態ではありません。技術に詳しい方は公開されているモデルを試してみる価値がありますが、多くのフリーランスにとっては、この技術を組み込んだ編集ソフトが登場するまで様子見が現実的です。ただし、この分野の進化は早いため、定期的に情報をチェックしておくことをおすすめします。動画編集を専門にしている方は、将来的な導入を見据えて、物理的な相互作用を理解した編集がどのようなものか、概念を把握しておくとよいでしょう。


コメント