※TECHBLITZでは、人型ロボット分野の国内外のスタートアップを独自に調査。記事後半では、中でも注目の5社を紹介します。
人間の体に似た形状のロボット。人型のデザインは、人間が使用する道具や環境に適合させるという機能面の目的が一般的。近年はスタートアップを中心に開発競争が進み、手足の動作が滑らかなロボットも数多く登場。まずは倉庫や工場での活用、ゆくゆくは高齢者介護の現場などでも活躍できる可能性があり、深刻な労働力不足の解消につながることが期待されている。
<目次>
・生成AIは人型ロボット開発をどう変えた?
・生成AI技術がロボット制御に与える革新的影響
・NVIDIAが人型ロボット開発で果たす役割
・人型ロボットが「人型」をしている理由
・TECHBLITZが選ぶ、人型ロボット関連スタートアップ5選
生成AIは人型ロボット開発をどう変えた?
生成AI登場以前の開発状況(2022年以前)
生成AIが広く普及する以前の人型ロボット開発は、多くの制約を抱えていた。従来の産業用ロボットは、技術者が事前にプログラムした動作しか実行できず、柔軟性に欠けていたからだ。これらのロボットの操作には高度なプログラミングスキルや専門知識が必要であり、現場の変化に迅速に対応することが困難だった。
開発プロセスも非常に時間がかかるものだった。新しい動作の実装には、専門家によるコーディングと詳細な調整が必要で、製品サイクルの短期化や多品種少量生産の時代には適応が困難だった。
生成AI時代のブレイクスルー(2023年以降)
生成AIの登場は、「ChatGPT級の転機」として人型ロボット開発に劇的な変化をもたらしている。大規模言語モデル(LLM)をはじめとする生成AI技術の統合により、開発の質とスピードが飛躍的に向上しているからだ。
具体的な進化としては、以下の点が挙げられる:
✅言語理解と動作変換の進化:生成AIの統合により、ロボットは自然言語での指示を理解し、それを具体的な動作に変換できるようになった。例えば「このごみを片付けて」といった単純な命令だけで、ロボットが自律的に作業を実行できるようになっている。
✅開発期間の大幅短縮:Sanctuary AIの第7世代ロボットは、新たな作業を習得するスピードが「数週間」から「24時間以内」へと短縮され、作業自動化のスピードが約50倍に向上したという。
✅対話能力の飛躍的向上:Figure AIのロボットは、人間との自然な会話能力や物体認識能力を獲得し、「テーブルの真ん中の皿の上に赤いリンゴと乾燥ラックの上に皿とコップが見えます」といった環境認識と言語化が可能になった。
✅動作の速度と精度の向上:生成AIと強化学習の組み合わせにより、Figure 01は人間の17%の速度でしか動けなかったのに対し、Figure 02は7倍の速度を実現し、時速約4.3km/hで移動可能になった。

人の指示に従って、Figureの人型ロボット2台がキッチンで協力しながら作業する(Figure公式Youtube動画のスクリーンショット)
生成AI技術がロボット制御に与える革新的影響
大規模言語モデル(LLM)の統合
LLMの統合は、人型ロボットの指示理解能力と意思決定プロセスを根本的に変革した。Agility Roboticsの「Digit」は、LLMを活用してユーザーからの指示をリアルタイムで解釈し、適切な行動を実行することが可能。この技術により、ロボットは複雑な指示を理解し、環境に応じて適応的に行動する能力を獲得した。
マルチモーダル認識能力の発展
生成AIの進化において重要なのは、テキストだけでなく視覚情報も処理できるマルチモーダルな認識能力です。LLMにネットから広範囲に取り込んだ映像による学習を加えることで、「言語+視覚モデル」が実現し、ロボットは周囲の環境を理解して言語化できるようになった。
これにより、Figure AIのロボットは環境内の物体を認識し、例えば「なぜリンゴを選んだのか」という質問に対して「テーブルの上で食べられるものはリンゴだけだからです」とロジカルに応答できるようになった。
強化学習と生成AIの融合
強化学習はロボットの運動制御において重要な役割を果たしているが、生成AIとの融合によりその効果が大幅に向上しています。千葉工業大学の未来ロボット技術研究センターでは、4,096台のロボットを同時にシミュレートし、「約2万世代」にわたる訓練を行うことで、実際のロボットに自動的に学習成果を実装しています。
基盤モデルの構築とその効果
ロボティクス分野では、言語モデルのGPTに相当する基盤モデルの構築が進んでいる。Googleのロボット研究者たちが一斉に退職して新たに立ち上げたPhysical Intelligenceでは、「ロボットが動作する1万時間以上の画像などで構築した基盤モデル」を活用することで、「ゼロから構築するよりもはるかに少ない労力でロボットのアプリケーション(動作)をつくり出せる」としている。
また、NVIDIAも2024年3月に開発者会議「GTC 2024」でヒューマノイドロボット用の基盤モデル「Project GR00T」を公開。ロボット業界にChatGPTのような基盤技術を提供する取り組みを加速させている。
NVIDIAが人型ロボット開発で果たす役割
NVIDIAによるシミュレーション革命
NVIDIAのロボティクス開発への貢献の中心となっているのが、「アイザックシム(Isaac Sim)」と仮想空間上にデジタルツインを構築する「オムニバース(Omniverse)」プラットフォームだ。アイザックシムとは、オムニバースを基盤とするロボティクスシミュレーションアプリケーション。現実世界を再現した仮想空間にロボットモデルをインポートして、高精度なシミュレーションを実現している。
このシステムの特徴は以下の通り。これらの技術により、実機を使わずに膨大な量のトレーニングデータを生成し、ロボットの開発期間を大幅に短縮している:
✅高精度な物理シミュレーション:PhysXによる高度な物理シミュレーションにより、現実世界に近い動作検証が可能
✅フォトリアリスティックな映像:RTX GPUによるリアルタイムレイトレーシングとパストレーシングにより、視覚的に正確なシミュレーションを実現
✅実物ベースのレンダリング:MDLマテリアル定義による実物ベースのレンダリングで、センサーデータの精度を向上
Project GR00T:ヒューマノイド用基盤モデルの提供
2024年3月にNVIDIAが公開した「Project GR00T」は、ヒューマノイドロボット開発の基盤モデルとして注目を集めている。これは、ChatGPTがテキスト生成の基盤モデルであるのに対し、GR00Tは人型ロボットに関する基盤モデルとなるもの。GR00Tはシミュレーション環境と実社会で学習し、短時間でスキルを習得する能力を持ち、仮想社会で階段やでこぼこ道での歩行訓練など、様々なスキルを学習する。
AI開発ツールとクラウドサービスの提供
NVIDIAは2024年7月、ヒューマノイド開発を加速するための新しいサービスやモデルを発表。これらのツールにより、ロボット開発の展開と開発のサイクルを「数か月から1週間未満に短縮」することが可能になった:
「MimicGen NIM」:Apple Vision Proなどから記録された遠隔操作データに基づいて合成モーションデータを生成
「Robocasa NIM」:OpenUSDでロボットタスクとシミュレーション対応環境を生成
「NVIDIA OSMO」:複雑なロボット開発ワークフローをオーケストレーションする、クラウドネイティブなマネージドサービス
ハードウェアの提供
NVIDIAは人型ロボット用コンピューター「Jetson Thor」も提供しており、このデバイスには「Blackwell」ベースの次世代GPUが搭載されている。これにより、高度なAI処理をロボット本体で実行することが可能になり、リアルタイムの意思決定を実現している。
人型ロボットが「人型」をしている理由
Amazonは2023年10月、物流拠点に人型ロボット「Digit」を試験導入すると明らかにした。ロボットは、同社が投資するスタートアップのAgility Roboticsが開発したもの。二足歩行し、両腕を使って物を持ち上げたり、移動させたりすることができる。
物流拠点や工場ではロボットアームが導入されるケースが多い。Amazonは人型ロボットを試験する理由について、「サイズと形状が人間向けに設計された建物によく適している」「作業員との協業型ロボットであるDigitのようなソリューションを拡張する大きなチャンスがある」と説明している。
このように、人型ロボットが「人型」をしている理由は、人間が働いている場所での協業や代用を想定しているケースが最も一般的。2023年3月にステルスモードから脱したスタートアップのFigureの自律型汎用ロボット「Figure 01」や、Apptronikの二足歩行ロボット「Apollo」などもその例だ。別のケースとしては、Engineered Artsが開発する人型ロボット「Ameca」に代表される娯楽目的のロボットのように、用途が人との交流である場合が挙げられる。

「Ameca」は表情豊かで、OpenAIのGPT-3を利用して会話内容を生成する(Engineered Arts提供)
TECHBLITZが選ぶ、人型ロボット関連スタートアップ5選
人型ロボット開発は各種作業を想定した汎用型ロボットを筆頭に、物の移動により特化したもの、病院での業務支援ができるものなどさまざま。また、サブ技術ではあるがロボットのグリッパーに「触覚」を与えるような技術を開発するスタートアップもある。TECHBLITZ編集部が選ぶ、人型ロボット関連のスタートアップ5社はこちら。
1. 1X

設立年 | 2014年 |
---|---|
所在地 | ノルウェー モス |
2. Agility Robotics

設立年 | 2015年 |
---|---|
所在地 | 米国オレゴン州コーバリス |
3. Sanctuary Cognitive Systems Corporation (Sanctuary AI)

設立年 | 2018年 |
---|---|
所在地 | カナダ ブリティシュコロンビア州バンクーバー |
4. Diligent Robotics

設立年 | 2016年 |
---|---|
所在地 | 米国テキサス州オースティン |
5. PowerON

設立年 | 2019年 |
---|---|
所在地 | ニュージーランド オークランド |
- TECHトレンド
- ハードウェア
- 機械学習
- ロボティクス
- 3D技術
- AI
- 製造・ものづくり
- IT・セキュリティ・通信
- 業務効率化ツール
- 広告・マーケ・コンシューマー・その他
- シリコンバレー
- イギリス
- スタートアップ5選
- 海外スタートアップ