メイン画像

AI・ロボティクスが生み出す新成長領域「汎用ロボット」

特化ロボットから汎用ロボットへ 進化と課題
2024.10.1
ドヴォークロワ ニコラス

ビジネス&データ・アナリティクス本部ドヴォークロワ ニコラス

SHARE
X
PRINT

INSIGHT

AIブームに伴い、人間と同じように幅広いタスクを実現する「汎用ロボット」への関心が高まっている。特にビッグテックからの投資が集まっているのが、ヒト型ロボットを開発しているスタートアップである。このヒト型の汎用ロボットが実現すれば、ビジネスインパクトも社会的なインパクトも極めて大きい。しかし自動運転の事例を見る限りでは、より複雑で高度なタスクや周辺環境への対応が求められる汎用ロボットの実現は容易ではない。資金などのリソースのさらなる投入と時間が今後もさらに必要になると思われる。ここではAI・ロボティクスの中の「汎用ロボット」に注目し、開発の最新動向と実用化へ向けた課題について検証する。

ビッグテックの期待が集まる汎用ロボット

産業や用途別に特化したロボットはすでに世界中で導入され、大きな価値を生み出している。ただし、人間のような幅広いタスクを、複雑な環境下で実施できるロボット=汎用ロボットはまだ実現できていない。しかし、ビッグテックは開発が成功した際のインパクトの大きさから、これに注目し、AI・ロボティクスのスタートアップへの投資を積極的に行っている。最近でも、ロボット開発をしているFigure AI社がMicrosoft、OpenAI、NVIDIAなどから数億ドル規模の資金を調達している。このFigure AIのロボットは、OpenAIの生成AIを用いたロボットが人の言葉を理解して食器を動かすなどをしている。またAgility Robotics社はAmazonの倉庫内でヒト型ロボットによって16キロ程度の荷物を運ぶ実験を開始している。

これらのロボットスタートアップやビッグテックは、時間はかかっても最終的にはヒト型の汎用ロボットが実用化できるはずであり、そこに挑戦し、他社に先駆けて最初に実用化することが企業の価値向上になるものと考えている。

ロボティクス進化におけるAIの役割

ロボティクスの進展において、AIの役割が重視されている。目下のAIブームの中で最も企業価値を生み出したとされるNVIDIAは、ロボティクス開発を支援するプラットフォームIsaacを開発した。これによって学習データの生成や取得、AIの学習やソフト開発などがサポートできるようになった。また現在、注目を集めているAIスタートアップの中には、言語に加えて、画像、音声、さまざまなデータ形式(モード)を扱える生成AI、マルチモーダルな大規模言語モデル(以下、MLLM)を組み込んだロボットに挑戦している例もある。これが実現すれば、人間と同じように、音声や動作による指示を適切に捉えてアクションプランを作成し、そのアクションプランに従って自ら作業をするような高度な汎用ロボットを開発することが可能になるだろう。

このMLLMへの期待が高まる一方で、NVIDIAが最近発表したフレームワークや、すでに実用化しているロボット、自動運転向けAIは、伝統的な特化型モデル(画像認識、計画、制御:伝統的な制御手法)をパイプライン構成でつないだもので、期待とはギャップがある。しかし現時点では、上記のようなMLLMを取り込んだ複雑な制御システムにはさらなる投資や時間が必要であり、実用レベルまでは時間がかかると考えられる。

自動運転開発との比較が示唆するもの

広い意味ではAI・ロボティクス分野の一部ともいえる自動車の自動運転は、20年以上前から研究が進められてきたが、最近ようやく、米サンフランシスコでロボタクシーが実用化される段階まで到達した。

自動運転は2次元の、限定された道路上という環境で実現されたが、それでもここまでの時間とリソースを必要とした。一方で、汎用ロボットは3次元の、より複雑な環境での動作が必要になる。

マッキンゼーの調査※1によると、自動運転システムに2010年以降投資された額は1,000億ドル以上とされている。これに対し、現在AI・ロボティクスで最も投資を集めているFigure AI社でも20億ドル規模である。自動運転と比べるとAI・ロボティクスに投じられたリソースは限定的であり、さらなる資金、時間が必要と思われる。

汎用ロボットへの進化のカギを握るMLLM

今後、人間の音声や動作による指示を直接理解して動く汎用ロボットの実現のためには、次の2つをクリアする必要がある。「(1)動作のアクションプランの生成」と、「(2)ロボット操作情報の生成」である。

前者は、環境情報と人間の指示を統合したMLLMによる生成ができるようになりつつある。一方、後者は実現が難しく、現時点では多くのロボットにおいてルールベース、または特化型AIを用いている。これらをMLLMに統合することにより、汎用化を狙う動きはある。しかし、ブラックボックスであるMLLMをシステムに取り入れて、精度よく狙いの動作を実行させることが難しい。

このほかにも、実用化に向けては、実社会ではノイズ情報の多い環境下での動作が求められること、各種の法規制・ガイドラインへの対応なども含め、これからも多数のハードルがある。

図表は既存の特化型AIを用いた自動運転システムのようなロボットと、MLLMを用いたAIロボットを比較している。生成AI、MLLMを自動運転ではまだ使用できておらず、特化型モデルでセンサーのインプットを処理し、ルールベースで操作を行っている。

自動運転はAIの進化により、容易に問題解決されると思われていたが、現在のロボタクシーでもAIを画像認識以外ではほぼ使っておらず、複雑にプログラミングされたシステムを使って自動運転を行っている。より複雑な3次元空間で、AIによる高度な制御が求められる汎用ロボットの、実用化へ向けたハードルはさらに高いと考えられる。
図表 構成別AIロボットの比較(既存の特化型/MLLMを用いた汎用型)
構成別AIロボットの比較(既存の特化型/MLLMを用いた汎用型)
三菱総合研究所作成
このように汎用ロボットへの期待は大きく、成功すれば大きな果実を得ることができるのも間違いないため、ビッグテックやスタートアップは果敢にチャレンジを続けている。しかし、その実現にはさまざまな技術的ハードルがある。特に今回紹介した汎用ロボットのシステム設計は難しく、まだ多くの時間と資金を要するであろう。

日本は産業用ロボットのプロダクト・システム設計においてすでに十分な優位性を有している。この有意性を汎用ロボットに展開し、まだ誰も実現できていない汎用ロボットの未来を切り開いていってほしい。

※1:McKinsey & Company「Mobility’s future: An investment reality check」
https://www.mckinsey.com/industries/automotive-and-assembly/our-insights/mobilitys-future-an-investment-reality-check(閲覧日:2024年9月27日)

関連するナレッジ・コラム

トレンドのサービス・ソリューション

ナレッジ・コラムに関するお問い合わせや、取材のお申し込み、
寄稿や講演の依頼などその他のお問い合わせにつきましても
フォームよりお問い合わせいただけます。