image: Rumka vodki / Shutterstock
長らくSF世界の住人だったが、いま確実に人型ロボットの足音が現実世界に近づいている。2022年のChatGPTの登場以降、生成AIは人型ロボット開発に革命をもたらしており、「生成AI前」と「生成AI後」では開発スピードが格段に上がっている。また、ここにきて中心的な役割を果たしつつあるのがNVIDIAだ。

※TECHBLITZでは、人型ロボット分野の国内外のスタートアップを独自に調査。記事後半では、中でも注目の5社を紹介します。

人型ロボット(ヒューマノイドロボット)とは:
人間の体に似た形状のロボット。人型のデザインは、人間が使用する道具や環境に適合させるという機能面の目的が一般的。近年はスタートアップを中心に開発競争が進み、手足の動作が滑らかなロボットも数多く登場。まずは倉庫や工場での活用、ゆくゆくは高齢者介護の現場などでも活躍できる可能性があり、深刻な労働力不足の解消につながることが期待されている。

<目次>
生成AIは人型ロボット開発をどう変えた?
生成AI技術がロボット制御に与える革新的影響
NVIDIAが人型ロボット開発で果たす役割
人型ロボットが「人型」をしている理由
TECHBLITZが選ぶ、人型ロボット関連スタートアップ5選

\紹介企業5社の詳細はこちら/

世界の最新技術・サービス・事業アイデアの初期調査に|BLITZ Research Package
「人型ロボット」のキーワードで絞ったスタートアップをBLITZ Portalで検索できる!
検索結果はこちら
検索結果はこちら

生成AIは人型ロボット開発をどう変えた?

生成AI登場以前の開発状況(2022年以前)
 生成AIが広く普及する以前の人型ロボット開発は、多くの制約を抱えていた。従来の産業用ロボットは、技術者が事前にプログラムした動作しか実行できず、柔軟性に欠けていたからだ。これらのロボットの操作には高度なプログラミングスキルや専門知識が必要であり、現場の変化に迅速に対応することが困難だった。

 開発プロセスも非常に時間がかかるものだった。新しい動作の実装には、専門家によるコーディングと詳細な調整が必要で、製品サイクルの短期化や多品種少量生産の時代には適応が困難だった。

生成AI時代のブレイクスルー(2023年以降)
 生成AIの登場は、「ChatGPT級の転機」として人型ロボット開発に劇的な変化をもたらしている。大規模言語モデル(LLM)をはじめとする生成AI技術の統合により、開発の質とスピードが飛躍的に向上しているからだ。

 具体的な進化としては、以下の点が挙げられる:

言語理解と動作変換の進化:生成AIの統合により、ロボットは自然言語での指示を理解し、それを具体的な動作に変換できるようになった。例えば「このごみを片付けて」といった単純な命令だけで、ロボットが自律的に作業を実行できるようになっている。

開発期間の大幅短縮:Sanctuary AIの第7世代ロボットは、新たな作業を習得するスピードが「数週間」から「24時間以内」へと短縮され、作業自動化のスピードが約50倍に向上したという。

対話能力の飛躍的向上:Figure AIのロボットは、人間との自然な会話能力や物体認識能力を獲得し、「テーブルの真ん中の皿の上に赤いリンゴと乾燥ラックの上に皿とコップが見えます」といった環境認識と言語化が可能になった。

動作の速度と精度の向上:生成AIと強化学習の組み合わせにより、Figure 01は人間の17%の速度でしか動けなかったのに対し、Figure 02は7倍の速度を実現し、時速約4.3km/hで移動可能になった。

人の指示に従って、Figureの人型ロボット2台がキッチンで協力しながら作業する(Figure公式Youtube動画のスクリーンショット)

生成AI技術がロボット制御に与える革新的影響

大規模言語モデル(LLM)の統合
 LLMの統合は、人型ロボットの指示理解能力と意思決定プロセスを根本的に変革した。Agility Roboticsの「Digit」は、LLMを活用してユーザーからの指示をリアルタイムで解釈し、適切な行動を実行することが可能。この技術により、ロボットは複雑な指示を理解し、環境に応じて適応的に行動する能力を獲得した。

マルチモーダル認識能力の発展
 生成AIの進化において重要なのは、テキストだけでなく視覚情報も処理できるマルチモーダルな認識能力です。LLMにネットから広範囲に取り込んだ映像による学習を加えることで、「言語+視覚モデル」が実現し、ロボットは周囲の環境を理解して言語化できるようになった。

 これにより、Figure AIのロボットは環境内の物体を認識し、例えば「なぜリンゴを選んだのか」という質問に対して「テーブルの上で食べられるものはリンゴだけだからです」とロジカルに応答できるようになった。

強化学習と生成AIの融合
 強化学習はロボットの運動制御において重要な役割を果たしているが、生成AIとの融合によりその効果が大幅に向上しています。千葉工業大学の未来ロボット技術研究センターでは、4,096台のロボットを同時にシミュレートし、「約2万世代」にわたる訓練を行うことで、実際のロボットに自動的に学習成果を実装しています。

基盤モデルの構築とその効果
 ロボティクス分野では、言語モデルのGPTに相当する基盤モデルの構築が進んでいる。Googleのロボット研究者たちが一斉に退職して新たに立ち上げたPhysical Intelligenceでは、「ロボットが動作する1万時間以上の画像などで構築した基盤モデル」を活用することで、「ゼロから構築するよりもはるかに少ない労力でロボットのアプリケーション(動作)をつくり出せる」としている。

 また、NVIDIAも2024年3月に開発者会議「GTC 2024」でヒューマノイドロボット用の基盤モデル「Project GR00T」を公開。ロボット業界にChatGPTのような基盤技術を提供する取り組みを加速させている。

NVIDIAが人型ロボット開発で果たす役割

NVIDIAによるシミュレーション革命
 NVIDIAのロボティクス開発への貢献の中心となっているのが、「アイザックシム(Isaac Sim)」と仮想空間上にデジタルツインを構築する「オムニバース(Omniverse)」プラットフォームだ。アイザックシムとは、オムニバースを基盤とするロボティクスシミュレーションアプリケーション。現実世界を再現した仮想空間にロボットモデルをインポートして、高精度なシミュレーションを実現している。

 このシステムの特徴は以下の通り。これらの技術により、実機を使わずに膨大な量のトレーニングデータを生成し、ロボットの開発期間を大幅に短縮している:

高精度な物理シミュレーション:PhysXによる高度な物理シミュレーションにより、現実世界に近い動作検証が可能

フォトリアリスティックな映像:RTX GPUによるリアルタイムレイトレーシングとパストレーシングにより、視覚的に正確なシミュレーションを実現

実物ベースのレンダリング:MDLマテリアル定義による実物ベースのレンダリングで、センサーデータの精度を向上

Project GR00T:ヒューマノイド用基盤モデルの提供
 2024年3月にNVIDIAが公開した「Project GR00T」は、ヒューマノイドロボット開発の基盤モデルとして注目を集めている。これは、ChatGPTがテキスト生成の基盤モデルであるのに対し、GR00Tは人型ロボットに関する基盤モデルとなるもの。GR00Tはシミュレーション環境と実社会で学習し、短時間でスキルを習得する能力を持ち、仮想社会で階段やでこぼこ道での歩行訓練など、様々なスキルを学習する。

AI開発ツールとクラウドサービスの提供
 NVIDIAは2024年7月、ヒューマノイド開発を加速するための新しいサービスやモデルを発表。これらのツールにより、ロボット開発の展開と開発のサイクルを「数か月から1週間未満に短縮」することが可能になった:

「MimicGen NIM」:Apple Vision Proなどから記録された遠隔操作データに基づいて合成モーションデータを生成

「Robocasa NIM」:OpenUSDでロボットタスクとシミュレーション対応環境を生成

「NVIDIA OSMO」:複雑なロボット開発ワークフローをオーケストレーションする、クラウドネイティブなマネージドサービス

ハードウェアの提供
 NVIDIAは人型ロボット用コンピューター「Jetson Thor」も提供しており、このデバイスには「Blackwell」ベースの次世代GPUが搭載されている。これにより、高度なAI処理をロボット本体で実行することが可能になり、リアルタイムの意思決定を実現している。

人型ロボットが「人型」をしている理由

 Amazonは2023年10月、物流拠点に人型ロボット「Digit」を試験導入すると明らかにした。ロボットは、同社が投資するスタートアップのAgility Roboticsが開発したもの。二足歩行し、両腕を使って物を持ち上げたり、移動させたりすることができる。

 物流拠点や工場ではロボットアームが導入されるケースが多い。Amazonは人型ロボットを試験する理由について、「サイズと形状が人間向けに設計された建物によく適している」「作業員との協業型ロボットであるDigitのようなソリューションを拡張する大きなチャンスがある」と説明している。

 このように、人型ロボットが「人型」をしている理由は、人間が働いている場所での協業や代用を想定しているケースが最も一般的。2023年3月にステルスモードから脱したスタートアップのFigureの自律型汎用ロボット「Figure 01」や、Apptronikの二足歩行ロボット「Apollo」などもその例だ。別のケースとしては、Engineered Artsが開発する人型ロボット「Ameca」に代表される娯楽目的のロボットのように、用途が人との交流である場合が挙げられる。

「Ameca」は表情豊かで、OpenAIのGPT-3を利用して会話内容を生成する(Engineered Arts提供)

TECHBLITZが選ぶ、人型ロボット関連スタートアップ5選

人型ロボット開発は各種作業を想定した汎用型ロボットを筆頭に、物の移動により特化したもの、病院での業務支援ができるものなどさまざま。また、サブ技術ではあるがロボットのグリッパーに「触覚」を与えるような技術を開発するスタートアップもある。TECHBLITZ編集部が選ぶ、人型ロボット関連のスタートアップ5社はこちら。

1. 1X

1X
労働力不足を補う人型アンドロイド
設立年 2014年
所在地 ノルウェー モス
 1Xのロボットは、人間のような動きや行動が可能な、安全性と実用性を重視したアンドロイド。世界中での労働力不足を緩和する目的で人間と共存可能な実用アンドロイドの開発を行っている。特徴は、ギアを排除し人工筋肉と独自開発したモーターを使用して、より自然かつ安全な駆動を実現している点。OpenAIが出資している。
image: 1X

2. Agility Robotics

Agility Robotics
二足歩行の人型デリバリーロボ
設立年 2015年
所在地 米国オレゴン州コーバリス
 Agility Roboticsのロボットは、二足歩行の人型デリバリーロボット。最大約18kgの荷物を持ち上げ、指定された場所まで配送。高度な自立性を有し、最小限のプログラミングで利用できることが特徴。Amazonが出資している。
image: Agility Robotics

3. Sanctuary Cognitive Systems Corporation (Sanctuary AI)

Sanctuary Cognitive Systems Corporation (Sanctuary AI)
汎用動作を行うヒューマノイドロボット
設立年 2018年
所在地 カナダ ブリティシュコロンビア州バンクーバー
 Sanctuary Cognitive Systems Corporation (Sanctuary AI)のロボットは、汎用的に活用できるヒューマノイドロボット。ドアの開閉 / 物を持ち上げる / ごみを捨てるなどの基本的動作を始めとする数百のタスクを行え、サービス業などの人手不足解消に貢献。最終的には、自然言語で指示を受けることができるよう目指す。
image: Sanctuary Cognitive Systems Corporation (Sanctuary AI)

4. Diligent Robotics

Diligent Robotics
自律型の病院ロボットアシスタント
設立年 2016年
所在地 米国テキサス州オースティン
 Diligent Roboticsのロボットは、病院スタッフが患者のケアに専念できるように、日常業務を支援するロボット。消耗品 / 医薬品 / 検体の院内配送など、患者とは直接接しない日常的な雑用を引き受け、活動範囲は特定の科やフロアにとどまらず、病院の建物全域で臨床スタッフを支援。
image: Diligent Robotics

5. PowerON

PowerON
ロボットグリッパーに触感を与える
設立年 2019年
所在地 ニュージーランド オークランド
 PowerONの製品は、誘電エラストマー (DE) 技術を活用した「人工筋肉」とロボットフィンガーチップ用の触覚アレイ。DEスイッチにより、ロボットのグリッパーに「触覚」を持たせ、把持力の調整、物体や掴むべき位置、滑り具合などを識別することが可能。ロボットの他にも、オートメーション、Eコマース、アグリテック、医療などの分野で、様々なアプリケーションの可能性が考えられる。
image: PowerON

\紹介企業5社の詳細はこちら/



RELATED ARTICLES
シリコンバレー在住・出張者必見、4月のおすすめイベント5選
シリコンバレー在住・出張者必見、4月のおすすめイベント5選
シリコンバレー在住・出張者必見、4月のおすすめイベント5選の詳細を見る
シリコンバレー在住・出張者必見、3月のおすすめイベント5選
シリコンバレー在住・出張者必見、3月のおすすめイベント5選
シリコンバレー在住・出張者必見、3月のおすすめイベント5選の詳細を見る
リテールメディアが急成長している理由 │ TECHBLITZが選ぶスタートアップ5選
リテールメディアが急成長している理由 │ TECHBLITZが選ぶスタートアップ5選
リテールメディアが急成長している理由 │ TECHBLITZが選ぶスタートアップ5選の詳細を見る
培養肉、「規制」と「技術革新」で地域差鮮明│TECHBLITZが選ぶスタートアップ5選
培養肉、「規制」と「技術革新」で地域差鮮明│TECHBLITZが選ぶスタートアップ5選
培養肉、「規制」と「技術革新」で地域差鮮明│TECHBLITZが選ぶスタートアップ5選の詳細を見る
「配車」だけじゃない、ライドシェアの派生ビジネス │ TECHBLITZが選ぶ海外スタートアップ5選
「配車」だけじゃない、ライドシェアの派生ビジネス │ TECHBLITZが選ぶ海外スタートアップ5選
「配車」だけじゃない、ライドシェアの派生ビジネス │ TECHBLITZが選ぶ海外スタートアップ5選の詳細を見る
シリコンバレー在住・出張者必見、2月のおすすめイベント5選
シリコンバレー在住・出張者必見、2月のおすすめイベント5選
シリコンバレー在住・出張者必見、2月のおすすめイベント5選の詳細を見る

NEWSLETTER

TECHBLITZの情報を逃さずチェック!
ニュースレター登録で
「イノベーション創出のための本質的思考・戦略論・実践論」
を今すぐ入手!

Follow

探すのは、
日本のスタートアップだけじゃない
成長産業に特化した調査プラットフォーム
BLITZ Portal

Copyright © 2025 Ishin Co., Ltd. All Rights Reserved.