Physical Intelligence、未訓練タスクも実行可能なロボットAI「π0.7」発表

ロボットが「応用力」を身につけた
大規模言語モデルとの共通点
現時点での制限事項
実用化への距離
フリーランスへの影響
まとめ

ロボットが「応用力」を身につけた

これまでのロボット訓練は、かなり面倒なプロセスでした。コーヒーを淹れるタスクを教えたければ、コーヒーメーカーを使うデータを大量に集めて、専用のモデルを訓練する。次に洗濯物を畳むタスクを教えたければ、また一からデータを集めて、別のモデルを訓練する。この繰り返しです。

Physical Intelligenceが発表したπ0.7は、この常識を覆そうとしています。このモデルは「合成一般化」と呼ばれる能力を持っています。簡単に言えば、別々の場面で学んだスキルを組み合わせて、まったく新しい問題を解く力です。

具体的な例を見てみましょう。研究チームがπ0.7にエアフライヤーの操作を試させたとき、モデルはエアフライヤーを直接扱った経験がほとんどありませんでした。訓練データ全体でわずか2つの事例しかなかったのです。1つは別のロボットがエアフライヤーのフタを閉じた場面、もう1つはオープンソースのデータセットで別のロボットが指示に従ってプラスチックボトルを置いた場面です。

驚くべきことに、π0.7はこれらの断片的な知識を組み合わせて、エアフライヤーの使い方を理解しました。研究者のLucy Shi氏は「ギアセットを無作為に買って、ロボットに『このギアを回せますか?』と尋ねたら、ただ機能した」と語っています。

大規模言語モデルとの共通点

この「応用力」は、ChatGPTのような大規模言語モデルが示してきた特性と似ています。共同創業者のSergey Levine氏は、GPT-2が「アンデス山脈のユニコーン」についての文章を生成した例を引き合いに出しました。GPT-2は「ペルー」と「ユニコーン」を別々に学んだだけなのに、両者を組み合わせて新しい文章を作れたのです。

π0.7も同じような現象を示しています。データ量が一定のラインを超えると、単に訓練されたタスクをこなすだけでなく、学んだ知識を新しい方法で組み合わせ始めるのです。Levine氏は「データ量に対する能力が線形以上の割合で向上している。これは言語やビジョンなど他の分野で見られた特性と同じだ」と説明しています。

実際、研究者のAshwin Balakrishna氏は「データをよく知っていれば、モデルが何をできるか推測できる。滅多に驚かない。でも過去数ヶ月は初めての経験だ。本当に驚いている」とコメントしています。

現時点での制限事項

ただし、π0.7にも限界があります。「トーストを作って」と一言で指示しても、まだ実行できません。代わりに「トースターのこの部分を開いて、このボタンを押して」と段階的に指示する必要があります。

興味深いのは、プロンプトエンジニアリングの影響です。エアフライヤータスクは当初5%の成功率でしたが、約30分かけて指示の出し方を調整したところ、成功率が95%まで向上しました。Shi氏は「時々、失敗の原因はロボットにもモデルにもない。私たちのプロンプトエンジニアリングが下手なだけ」と認めています。

また、モデルがどこから知識を得ているのか、なぜ成功または失敗するのかを追跡することが非常に難しいという課題もあります。ロボティクス分野には標準化されたベンチマークがまだ存在しないため、Physical Intelligenceは自社の既存専門モデルを基準として性能を測定しています。

実用化への距離

π0.7はコーヒーメーカーの操作、洗濯物の折りたたみ、箱の組み立てなど、複数の複雑なタスクで既存の専門モデルと同等のパフォーマンスを示しています。さらに、ロボットを新しい環境に配置した後、追加のデータ収集やモデルの再訓練なしに、リアルタイムで改善できる可能性も示しています。

Physical Intelligenceは設立から2年で、すでに10億ドル以上の資金を調達し、企業評価額は56億ドルに達しています。報道によれば、新たな資金調達ラウンドで評価額を約110億ドルにほぼ倍増させる交渉中とのことです。共同創業者のLachy Groom氏は、Figma、Notion、Rampなどへの投資実績を持つシリコンバレーの著名エンジェル投資家で、この実績が投資家の信頼を集めています。

ただし、Levine氏は商用化の時期について「悲観的である理由はないが、数年前に予想していたより速く進んでいる。でもその質問に答えるのは非常に難しい」と慎重な姿勢を示しています。研究論文も「初期の兆候」「初期段階での実演」という表現を使っており、これはあくまで研究結果であって、すぐに使える製品ではないことを強調しています。

フリーランスへの影響

この技術が直接フリーランスの仕事に影響するのは、まだ先の話です。現時点でπ0.7は研究段階であり、価格やリリース時期も明らかになっていません。ロボットハードウェアのコストも考えると、個人事業主が気軽に導入できるものではないでしょう。

それでも、この研究が示す方向性は注目に値します。AIが「応用力」を身につけ始めているという点です。ChatGPTやClaudeのような言語モデルがライティングやマーケティング業務で応用されているように、ロボットAIも将来的には物理的な作業を柔軟にこなせるようになるかもしれません。

特に倉庫管理、配送、製造など物理的な作業が多い分野では、数年後に大きな変化が起きる可能性があります。直接的にフリーランスの業務を代替するわけではありませんが、クライアント企業の業務フローが変わることで、間接的に影響を受けるかもしれません。

現時点で個人事業主が取るべきアクションは特にありません。ただ、AIの応用範囲がデジタル領域から物理的な作業へと広がりつつあることは、頭の片隅に置いておいて損はないでしょう。

まとめ

Physical Intelligenceのπ0.7は、ロボットが未訓練のタスクにも対応できることを示した興味深い研究成果です。ただし商用化には時間がかかりそうですし、フリーランスの日常業務に直接影響する段階ではありません。今は様子見で十分です。AIの進化が気になる方は、研究の続報をチェックしてみてください。

参考リンク：TechCrunch（元記事）