Pose2Sim：動画から3D動作解析ができる無料ツール

マーカー不要の3D動作解析とは
Google Colabで動かせる手軽さ
1. パイプラインの流れ
実務での使いどころ
1. 設定の調整ポイント
注意しておきたい制限
フリーランスへの影響
まとめ

マーカー不要の3D動作解析とは

従来、人の動きを3Dで記録するには、身体に専用マーカーを貼り付けて高価なモーションキャプチャシステムで撮影する必要がありました。Pose2Simは、この「マーカー」が不要です。普通のカメラで複数の角度から撮影した動画があれば、AIが自動的に関節の位置を認識し、3D座標に変換してくれます。

たとえば、スポーツ選手のフォーム分析を依頼されたとき、これまでなら専用スタジオに案内するか、高額な機材を購入する必要がありました。Pose2Simを使えば、スマートフォンを数台配置して撮影するだけで、膝の角度や腰の動きを数値化できます。

Google Colabで動かせる手軽さ

今回公開されたチュートリアルの最大の特徴は、Google Colab上で動作する点です。Google Colabは、ブラウザ上でPythonコードを実行できる無料サービスで、GPUも利用できます。つまり、自分のパソコンにソフトウェアをインストールする必要がなく、ブラウザさえあればすぐに試せます。

セットアップは比較的シンプルです。Pose2Sim本体とRTMPose（姿勢推定AI）、OpenSimのPythonバインディングをインストールするだけで準備完了です。GPU（T4）が利用可能かどうかも自動でチェックしてくれるため、処理速度の見込みも立てやすくなっています。

パイプラインの流れ

Pose2Simは、動画から最終的な関節角度データまで、いくつかのステップを順番に実行していきます。

まず、カメラのキャリブレーション（較正）を行います。複数のカメラがどの位置・角度で設置されているかを計算する工程で、Qualisys、Vicon、OpenCap、AniPoseといった既存のキャリブレーション形式や、チェッカーボード画像からの自動計算にも対応しています。

次に、各カメラの動画から2D姿勢推定を実行します。ここではRTMPoseという姿勢推定AIが使われ、各フレームで人の関節位置を平面上の座標として検出します。検出モードはバランス、軽量、パフォーマンスの3種類から選べ、処理速度と精度のバランスを調整できます。

複数カメラの映像を時間的に同期させる工程も自動化されています。垂直方向のキーポイント（たとえば頭や足首）の速度相関を計算し、各カメラのフレームタイミングのずれを補正してくれます。手動での同期調整は不要です。

その後、複数カメラの2D座標を組み合わせて3D座標に変換する「三角測量」が実行されます。信頼度スコアで加重計算を行い、再投影誤差が大きいカメラは自動的に除外されるため、精度が保たれます。欠損した座標は、立方補間やベジェ曲線などの手法で内挿され、OpenSim互換の.trcファイルとして出力されます。

3D座標データにはノイズが含まれるため、フィルタリングも行われます。バターワースフィルタがデフォルトですが、カルマンフィルタやガウシアン、LOESS、中央値フィルタなど、用途に応じて選択できます。

さらに、スタンフォード大学で訓練されたLSTMモデルを使った「マーカー拡張」機能もあります。三角測量で得られたキーポイントから、47個の仮想マーカーを予測し、より詳細な身体モデルを構築できます。ただし、この機能は必ずしも精度が向上するわけではなく、約半分のケースで有効とされています。

最後に、OpenSimを使った逆運動学計算で、3D座標から関節角度を算出します。モデルの自動スケーリングも行われ、個人の体格に合わせた骨格モデルと関節角度の時系列データ（.motファイル）が出力されます。

実務での使いどころ

このツールが特に役立つのは、動作の数値分析が必要な案件です。たとえば、パーソナルトレーナーがクライアントのスクワットフォームを改善したいとき、膝の角度や重心移動を数値で示せれば説得力が増します。

リハビリ指導者なら、患者の歩行パターンを定期的に記録し、回復の進捗を客観的に追跡できます。動画を撮るだけで、股関節や膝関節の可動域を時系列で比較できるため、紙のレポートよりも説得力のあるデータを提供できます。

eスポーツのコーチや、ダンス・ヨガインストラクターにとっても有用です。選手やクライアントの動きを3Dで可視化し、改善点を具体的に伝えられます。

設定の調整ポイント

Pose2Simは、Config.tomlという設定ファイルで、パイプライン全体のパラメータを一括管理します。たとえば、再投影誤差の閾値（reproj_error_threshold_triangulation）を調整すれば、精度と処理速度のバランスを変更できます。最小カメラ台数（min_cameras_for_triangulation）を設定すれば、3台のカメラで十分か、4台必要かを指定できます。

尤度閾値（likelihood_threshold）を変更すると、検出された姿勢の信頼度フィルタリングが厳しくなったり緩くなったりします。検出頻度（det_frequency）を50に設定すれば、毎フレーム処理するのではなく、50フレームごとに検出して処理負荷を減らすことも可能です。

注意しておきたい制限

Pose2Simは強力ですが、万能ではありません。OpenSimの一部機能は、Google Colab環境では動作しないことがあります。その場合、ローカルのconda環境での実行が推奨されます。つまり、すべてをブラウザだけで完結できるとは限りません。

また、マーカー拡張機能は結果が約半分のケースでしか改善しないと明記されています。使ってみて効果がなければ、無効にしたほうが処理時間の節約になります。

単一人物モードと複数人物モードがあり、デモデータは単一人物用です。複数人を同時に分析したい場合は、別途Demo_MultiPersonプロジェクトを参照する必要があります。

カメラの台数や配置、撮影環境によって精度は大きく変わります。照明が不十分だったり、背景が複雑だったりすると、姿勢推定の精度が落ちます。試しに撮影してみて、どの程度の品質が出るか確認してから本格導入を検討するのが無難です。

フリーランスへの影響

これまで、動作解析を提供するには高額な機材投資が必要でした。Pose2Simが実用レベルで動けば、初期コストをほぼゼロに抑えられます。スマートフォンや安価なアクションカメラを数台用意するだけで、数値化されたレポートを納品できるようになります。

ただし、このツールはあくまでオープンソースのプロジェクトで、サポートは公式ドキュメントやDiscordコミュニティ頼みです。トラブルが起きたとき、自分で調べて解決する必要があります。クライアントワークで使うなら、事前に十分テストし、納品スケジュールに余裕を持たせるべきです。

また、データの可視化や分析結果の説明スキルも求められます。.trcファイルや.motファイルを出力できても、それをクライアントにわかりやすく伝えられなければ価値は半減します。グラフ作成や動画編集と組み合わせて、視覚的にわかりやすいレポートを作る工夫が必要です。

競合が少ない分野なので、早めに習得すれば差別化ポイントになります。スポーツ科学やリハビリ分野でのフリーランス案件は、まだまだ開拓の余地があります。

まとめ

Pose2Simは、マーカーレスで3D動作解析ができる無料ツールです。Google Colab上で動作するため、環境構築のハードルは低めですが、実務で使うには精度検証とデータ活用スキルが必要です。スポーツ、リハビリ、動作指導系のフリーランスなら、試してみる価値はあります。まずはデモデータで動かしてみて、自分の案件に使えそうか判断してください。

参考リンク：
GitHub – Pose2Sim
公式ドキュメント
 チュートリアルコード