ビッグテック最前線.com / 編集部

Submarine LLC

Editor Team

AIが人間の仕事を奪うという見出しを、ここ数年で何度も目にしてきたのではないでしょうか。ところが、ロボットが現実世界で家事や組立といった身体作業をこなすPhysical AI(物理AI)の最前線では、まったく逆の現象が起きています。ロボットを賢くするには、人間が実際に手を動かす一人称視点の映像、いわゆるエゴセントリックデータが数十億時間分も必要で、しかもそれはインターネット上のどこにも存在しないのです。

この需要に目をつけたのが、米シリコンバレー発のスタートアップHuman Archiveです。同社はインドのギグワーカー(単発・短期の仕事を請け負う労働者)にカメラを装着させ、日常作業の映像を収集する事業で約820万ドル(約12.3億円)を調達しました(出典: https://techcrunch.com/2026/05/26/human-archive-taps-into-indias-services-startups-to-collect-data-for-physical-ai/)。労働者に支払われる報酬は時給わずか1ドル(約150円)。AIデータ経済の最前線で、いま何が起きているのでしょうか。

ロボットが求める人間の手の動き

Physical AIの現場で起きていることは、通説とはむしろ正反対です。ロボットに身体作業を教えるには、人間が実際に手を動かす一人称視点のデータが、文字どおり数十億時間分も必要になります。そしてこのデータは、インターネット上のどこにも落ちていません。

スクレイピングできないデータ

Stellaris Venture Partnersの報告によれば、世界の主要なロボティクス研究所は今後2〜3年で1億から10億時間のエゴセントリックデータを必要としています。動画共有サイトに料理や掃除の映像は山ほどありますが、それらは三人称視点、つまり外側から撮影された映像であり、ロボットが自分の手をどう動かせばグラスを棚に置けるのかを学ぶのには使えません。Humyn AIの共同創業者であるIshank Gupta氏は、数十億時間のデータはスクレイピング(Web上から自動収集すること)では集められず、世界中を探してもそのようなデータの保管庫は存在しないと断言します。

単一の作業、たとえばグラスを掴んで棚に置くだけでも10万〜100万時間のデータが必要だといいます。ロボットに複数の作業を覚えさせ、異なる環境に適応させようとすれば、必要な量は桁違いに跳ね上がります。

量と質の二重方程式

とはいえ、ただ量を積めばよいわけではありません。FPV Labsの共同創業者であるAbhishek Anand氏は、GoogleのRT-2研究を引き合いに出し、データのわずか1%が25%のタスク成功率向上をもたらす、量よりも質が重要だと指摘します。ここに切り込んでいるのが、シリコンバレー拠点のHuman Archiveです。同社はカメラ付きキャップだけでなく、触覚グローブ、全身モーションキャプチャスーツ、手首カメラを組み合わせ、RGB-D(色情報と深度情報)、力覚フィードバック、全身の動きをリアルタイムで同期させたマルチモーダルデータを収集します。Wing VCのZach DeWitt氏は、世界で他に誰一人として、これだけ複数のセンサーから得たデータをスケールで同期収集できていないと評価します。

時給150円のデータ経済

Human Archiveのモデル

UC BerkeleyとStanfordの研究者4人が創業したHuman Archiveは、約820万ドル(約12.3億円)を調達しました。投資家にはWing VC、NVP Capital、Y Combinatorに加え、OpenAI、Nvidia、Google、Metaに所属するエンジェル投資家が名を連ねます。同社はインドの家庭サービス企業と提携し、ギグワーカーにカメラを装着させて、日常作業の一人称映像を記録しています。

注目すべきは報酬構造です。Human Archiveの基本報酬は時給1ドル(約150円)。インド国内の競合であるObjectwaysが時給250〜400ルピー(約2.63〜4.20ドル、約395〜630円)を支払うのに対し、半額以下の水準です。CEOのRaj Patel氏は、インドに現地拠点があるからコストを抑えられると説明しますが、Objectwaysの社長Ravi Shankar氏は250〜400ルピーでも人材確保は難しいと述べており、報酬には上昇圧力が存在します。

消費者の側にも独自の仕掛けがあります。ギグワーカーが家庭に到着すると、アプリを通じて、データ収集に同意すれば割引価格、拒否すれば通常価格という選択肢が提示されるのです。Patel氏によれば、サービス品質をめぐるトラブルの解決に映像が役立つこともあり、消費者は割引のほうを選ぶケースが多いといいます。

競合が映す市場の輪郭

インド国内では複数のスタートアップがこの領域に参入しています。Humyn AIは18か国でデータ収集ネットワークを展開し、製造業や家庭作業(洗い物や洗濯物たたみなど)のデータを集めています。ブラジルが家庭向けの主力拠点です。ObjectwaysはもともとLLM(大規模言語モデル)向けのデータ収集企業でしたが、2025年半ばからエゴセントリックデータやRGB-Dデータに参入し、1日あたり1,000時間のペースでデータを生成しています。FPV Labsは8か月で1万時間以上のデータを集めましたが、データそのものを販売するのではなく、人間の状態や行動の表現をロボットへ転送するための基盤づくりに投資するという、独自の路線を歩んでいます。

ただし、この市場の構造的な脆さを指摘する声もあります。ベンガルールのある投資家は、ペタバイト規模のデータ収集には数週間かかり、完了する前に求められる要件が変わってしまうことが多いと語ります。データ要件の変化の速さそのものが、ビジネスモデルの前提を揺るがしかねないのです。

データ主権という新しい戦線

プラットフォームの拒絶と政府の介入

Human Archiveのモデルは、インド国内で激しい反発にも直面しています。インド最大級の家庭サービスプラットフォームであるUrban CompanyのCEO、Abhiraj Singh Bhal氏は、X上で協業を拒否することを公表しました。これに対しHuman ArchiveのRaj Patel氏は、Urban Companyはすぐに再考を迫られるか、顧客離れによって地位を失うだろうと応じています。共同創業者のRushil Agarwal氏は、Pronto創業者のAnjali Sardana氏に面談でstupid(愚かだ)と呼ばれたと投稿しました(Pronto側はこの発言を否定しています)。

より重要なのは、インド電子情報技術省(MeitY)が、エゴセントリックデータ収集スタートアップの同意の取り方とデータ収集の実態について調査に乗り出したことです。Human ArchiveはDPDP法(インドのデジタル個人データ保護法)への準拠を主張し、プライバシーポリシーの表示、同意の取得、顔のぼかし処理を実施していると説明します。しかし、労働者が自分のデータが最終的にどのロボティクス研究所でどう使われるのかまで理解しているかは、依然として不透明なままです。

規制が変えるコスト構造

EUでは2024年に発効したAI法(AI Act)が、訓練データの透明性の義務化に動き始めています。インドのDPDP法が同じ方向に進み、AIデータの原産地証明のようなものが求められるようになれば、安価な同意取得に依存するビジネスモデルのコスト構造は、根底から変わります。データの供給網(サプライチェーン)における法令順守を先に整備した企業が、長期的にはAI研究所との取引で優位に立つ可能性が高いといえるでしょう。

この先に何が見えるか

Physical AIのデータ市場は、量の確保から、質の差別化と調達の正当性という2つの軸へと移行しつつあります。時給1ドルのモデルは、規制コストの上昇、人材争奪の激化、大手プラットフォームの拒否という三方向からの圧力に同時にさらされています。

日本の製造業やサービス業にとっても、この動きは決して他人事ではありません。自社の従業員が毎日行っている作業、たとえば組立、検品、清掃、調理といった動作のデータは、AI企業にとって価値ある資産になりうるからです。問題は、その価値をいち早く認識し、提携の条件を自ら主体的に設計できるかどうかにあります。データをコストとしてではなく資産として捉える発想の転換が、AIデータ経済の次の段階で問われることになるでしょう。

まとめ

Physical AIの進化は、皮肉にも膨大な人間の肉体労働データを必要としており、ロボットが仕事を奪うという通説とは裏腹に、いまは人間の手の動きこそが最も希少な資源になっています。第一に、ロボットの訓練には数十億時間規模のエゴセントリックデータが欠かせず、それはスクレイピングでは得られず人の手で作り出すしかありません。第二に、Human Archiveに象徴される時給1ドルのモデルは安さで先行したものの、報酬の上昇圧力、プライバシー規制、大手プラットフォームの拒否という複数の逆風を同時に受けています。第三に、競争の軸はすでに量の確保から、質の高さとデータ調達の正当性へと移りつつあります。

日本の読者にとって大切なのは、これを遠い国の出来事として眺めるのではなく、自社の現場で日々生み出される作業データが、将来の交渉材料になりうると捉え直す視点です。データを単なる副産物ではなく戦略資産として扱えるかどうかが、AIデータ経済の次の局面で企業の立ち位置を分けることになるでしょう。

参考情報