AI・ロボティクス研究の最新動向と課題を探る

AI研究とロボット研究の融合が最大のカギ
2024.10.1
山田 賢杜

政策・経済センター山田賢杜

SHARE
X
PRINT

INSIGHT

AI・ロボティクスはその名のとおり、AI研究とロボット研究が融合することで実現する。しかし従来、AI研究は何でもできる「汎用化」を、ロボット研究は特定の作業への「特化」を目指してきたこともあって、融合が十分に進んでいないのが実情だ。期待されるヒューマノイド(ヒト型ロボット)の分野で、ブレークスルーとなるような研究の進展が生まれない一因でもある。研究アプローチの差異を乗り越えて、双方が歩み寄りながら研究を進めていくことをぜひ提案したい。

AI研究とロボット研究の融合が不可欠

AI・ロボティクスは、AI研究とロボット研究が融合することで成立する。両者の研究開発の成果や技術の融合が進み、高度なAIを搭載した革新的なロボットが実現されることで、従来よりも生産性が向上することや、新たなサービスが創出されることを期待されている。

この融合は、内閣府のムーンショット型研究開発制度※1や戦略的イノベーション創造プログラム(SIP)※2などでも言及されており、AI側とロボット側の2方向から、まるで互いに競争するかのようにAI・ロボティクスの研究が進められている。しかし、両者の研究成果を真の意味で融合させるには、じつは高い障壁が存在している。現在のAIがこの分野でできることは、ロボットの行動計画や動作生成の一部にとどまり、力制御などの繊細なロボット制御までは実現に至っていない※3。融合が進まない要因として、分野間で使用する言葉が異なるためお互いの理解が進まないといったこともあるが、より根本的な要因は、両者の「研究アプローチが違う」ことである(図表)。
図表 「汎用化」に向かうAI研究、「特化」に向かうロボット研究
「汎用化」に向かうAI研究、「特化」に向かうロボット研究
三菱総合研究所作成

「汎用化」と「特化」、異なる研究アプローチ

AI研究とロボット研究のアプローチのあり方をそれぞれ一言で表すと、「汎用化」と「特化」がふさわしい。

AI研究では、何でもできる「汎用化」のアプローチがとられている。その背景には、学習モデルやアルゴリズムの多様化、計算処理を支える集積回路の指数関数的な性能向上がある。特に昨今、存在感を増す生成AI「マルチモーダルLLM※4」は、まさに汎用化のアプローチを体現している。マルチモーダルLLMとは、モデルや計算処理能力の進化により、テキストだけではなく、画像や音声も自動的に認識し生成できるようになったLLMである。認識・学習・生成できる情報が多様になればなるほど、AIはさまざまな用途で汎用的に活用することが可能となる。ロボットにマルチモーダルLLMを搭載することで、人のさまざまな指示や周囲の環境を理解し、行動計画や動作生成できるようなロボットを創り出す研究が進んでいる。

AI研究とは対照的に、ロボット研究は、特定作業への「特化」のアプローチがとられている。ロボットはAIと異なり実体が伴うため、物理制約の影響が大きい。ロボットを構成する機構や材料により、実行可能な動きが限られてしまう。また一般的にAIなどのソフトウエアに比べて、研究開発のために多額の資金を要する。このような物理制約やコスト制約により、ロボットの研究アプローチは、万能型ではない、限られた分野に特化するものになったと考えられる。

ヒューマノイド研究に表れる両者の違い

AI研究とロボット研究の研究アプローチの違いは、例えばヒューマノイド※5研究にも表れている。

汎用化に向かうAI側の取り組みの一例として、Google DeepMind社の学習モデル「Robotics Transformer 2(RT-2)」を挙げる※6。RT-2はVLA(Vision-language-Action)モデルと呼ばれるAIモデルの一種で、画像や音声を認識して、ロボットの行動・動作を計画することができる。特にRT-2は、インターネット上の膨大なデータを学習することにより汎化性能を高め、未知の環境下でもさまざまな作業を実行することが可能である。

これに対し、特化に向かうロボット側の取り組みとしては、早稲田大学菅野重樹教授が研究を手掛けるヒューマノイド「Dry-AIREC」がある※7。Dry-AIRECは将来的に一般生活への活用も考えられているが、現状では超音波医療検査や家庭での調理作業など、AI研究側に比べると用途を絞った、特化に向かう研究アプローチが反映されたヒューマノイドであるといえる。

AI・ロボティクスの中でも特に実用化が期待されるヒューマノイドの分野で、研究の融合が遅れているのは大きな課題といえるのではないだろうか。今後は研究アプローチの差異にとらわれず、柔軟な思考でのヒューマノイド研究への挑戦が広がっていくことを期待したい。

違いを乗り越え、融合に向けた挑戦を

以上述べたように、AI側とロボット側の研究アプローチは異なっているが、融合に向けた事例もある。

例えば協働ロボットを開発する「東京ロボティクス」社の力制御技術(衝撃吸収技術)は、ソフトウエアが生成したロボットの動作と、実際の動きのずれを吸収する技術である※8。本来ロボットは事故防止などのために、物理法則から算出された一意の結果をもとに駆動するが、同社の力制御技術を用いることで、AIが学習データから算出した、確率的に多少のばらつきを含む結果でも受け入れることができる。AIを活用した力制御技術を取り入れた結果、同社のロボットは、ハンド部分に仮に想定より重い荷物を載せても、瞬時にその衝撃を吸収し、落下させることなく運ぶことが可能になっている。

紹介したように、まずはAI研究とロボット研究がお互いに歩み寄り、それぞれの知見を融合させるような挑戦をしていくことが重要であろう。その結果、「汎用」と「特化」というアプローチスタイルの障壁を超え、魅力的なAI・ロボティクスを生み出すヒントが見つかるかもしれない。そのためには、自領域のみにとらわれず、他領域の研究課題をまずは理解することが有効ではないだろうか。

※1:内閣府「ムーンショット目標3 2050年までに、AIとロボットの共進化により、自ら学習・行動し人と共生するロボットを実現」
https://www8.cao.go.jp/cstp/moonshot/sub3.html(閲覧日:2024年9月5日)

※2:内閣府「戦略的イノベーション創造プログラム(SIP)第3期(令和5年~)課題一覧」
https://www8.cao.go.jp/cstp/gaiyo/sip/sip3rd_list.html(閲覧日:2024年9月5日)

※3:文部科学省「基礎研究振興部会(第14回) 配布資料 【資料2-2】AIロボットの研究開発動向(米欧中)」
https://www.mext.go.jp/content/20240516-mxt_kiso-000035946_8.pdf(閲覧日:2024年9月5日)

※4:LLM:Large Language Models(大規模言語モデル)とは、膨大な計算量やデータ量、パラメータ数により構築された、自然言語処理モデルのことである。

※5:ヒューマノイドとは、人間に近い形態や機能をもつロボットのことである。

※6:Google DeepMind「RT-2: New model translates vision and language into action」
https://deepmind.google/discover/blog/rt-2-new-model-translates-vision-and-language-into-action/(閲覧日:2024年9月5日)

※7:早稲田大学「一人に一台一生寄り添うスマートロボット」
https://airec-waseda.jp/(閲覧日:2024年9月5日)

※8:東京ロボティクス株式会社「Torobo」
https://robotics.tokyo/ja/products/torobo/(閲覧日:2024年9月5日)

関連するナレッジ・コラム

トレンドのサービス・ソリューション

ナレッジ・コラムに関するお問い合わせや、取材のお申し込み、
寄稿や講演の依頼などその他のお問い合わせにつきましても
フォームよりお問い合わせいただけます。