コラム

3Xによる行動変容の未来2030最先端技術

V-Tec/メタバースの活用に向けて 第2回:コミュニケーションを豊かにするデジタルヒューマン

タグから探す

2023.8.8

先進技術センター飯田正仁

3Xによる行動変容の未来2030

POINT

  •  パーソナルバースのメインコンテンツ:デジタルヒューマン。
  • ヒトらしい自然なコミュニケーションをいかに実装できるかがポイント。
  • デジタルヒューマンの要素技術は、メタバース全般への応用にも期待。

デジタルヒューマンとは

当社は、未来のコミュニケーションを実現する要素技術として「バーチャル・テクノロジー(V-tec)」に注目しています。具体的には、バーチャルリアリティ(VR)、オーギュメンテッド・リアリティ(AR)、ミックスド・リアリティ(MR)などの総称であるxR技術と、その関連技術です。

当社は、V-tecの活用領域として、3つのバース(場)と5つの利用形態を提唱しています※1

このコラムでは、3つのバースの1つ「パーソナルバース」のメインコンテンツである「デジタルヒューマン」の技術動向を報告します。後段でも述べますが、デジタルヒューマンは3つのバース全般での活用が期待され、普及した際の効果が非常に高い技術です。

デジタルヒューマンは、AIやCG技術を用いて、ヒトのような外見をもち、対話・感情表現などのコミュニケーションを再現した技術です。ピークが近い技術と想定されており※2、市場規模は世界全体で約70兆円にも及ぶと期待※3されています。

デジタルヒューマンの特長は、AI・CGベースの仮想的なエージェント(アバターなど)であり、ヒトにとってしみやすいコミュニケーションが可能なことにあります。いつでもどこでもどれだけでも、欲しい機能や役割に応じて、コミュニケーションができます。エージェントとコミュニケーションするヒトの側も心理的・認知的に受け入れやすく、パーソナライズ化が進む現代社会と非常に親和性が高い技術といえます。

このような特長を活かして、コミュニケーションが求められるさまざまな分野で、すでに活用が進展しています。例えば、情報提供系のデジタルヒューマンは円滑な会話力を活かして、アナウンサーや受付・窓口の担当者として活躍しています。インフルエンサー系のデジタルヒューマンは、SNS上でヒトの代わりに活動するバーチャルモデルや企業のブランドモデルが知られています。

その他にも、アパレルなどの分野でマネキン代わりに利用される試着系のデジタルヒューマン、ゲームキャラクターなどの用途で利用されるNPC(Non Player Character)系のデジタルヒューマン、実在の人物や故人を再現してコミュニケーションを行うライフログ系のデジタルヒューマンなどの活用事例があります。
表1 デジタルヒューマンの主な活用事例※4
デジタルヒューマンの主な活用事例※4
出所:三菱総合研究所作成
以降は、ヒトとのコミュニケーション機能をもつデジタルヒューマンの要素技術などについて解説します。

自然なコミュニケーションの実装技術

デジタルヒューマンが、実社会で親しみや愛着をもって用いられるためには、ヒトが行うような自然なコミュニケーションを、どの程度実装できるかがポイントとなります。

デジタルヒューマンのコミュニケーションは、主に対話と感情表現で構成されます。言語的な情報である対話をベースとして、非言語的な情報である感情表現を加えることによって、高度なコミュニケーションを可能とします。
図1 ヒトとデジタルヒューマンのコミュニケーション
ヒトとデジタルヒューマンのコミュニケーション
出所:三菱総合研究所
対話の部分は、大規模言語モデル(Large Language Models:LLM)や音声モデルから構成される対話システムで実装します。対話時は、ヒトからの入力情報をもとに、大規模言語モデルが出力となる応答を生成します。音声の入出力でコミュニケーションを行う場合は、音声モデルも利用します。一部不正確な応答をしてしまうケースがあるなど技術課題はあるものの、すでにヒトのような自然な対話が可能な技術レベルに到達しています。

感情表現の部分は、「Affective Computing」と呼ばれる技術で実装します。表情などの見た目、声のトーンやリズムといった話し方などを、ヒトのように表現することが可能な技術です。デジタルヒューマンがパーソナライズされた場合の個性の反映や、状況に応じた柔軟な対応など、幾つかの技術課題が改善できるとすればよりリアルな感情表現が可能になります。

なお、デジタルヒューマンは意図・欲求や自律性をもち合わせていません。あたかも自律性をもっているかのように反応を設定されたモデル(リバースエンジニアリング)などの事例はあるものの※5、基本的にはリアクティブ(受動的)な反応をヒトが設定します。技術が進展して、プロアクティブ(能動的)に見えるような反応が可能になると、さらにリアルなコミュニケーションになると想定されます。
表2 デジタルヒューマンの現在の技術レベルと主な課題
デジタルヒューマンの現在の技術レベルと主な課題
出所:三菱総合研究所

要素技術のメタバース全体への応用にも期待

今後のさらなる技術進展で、多種多様なデジタルヒューマンが登場すると想定されます。デジタルヒューマンを作成可能なソフトウエア開発キット(SDK)※6や、自分の音声に合わせて表情を生成するようなクロスモーダル生成技術※7なども、この流れを加速すると考えられます。誰でも簡単にデジタルヒューマンを作成できる環境が整いつつあります。

デジタルヒューマン技術は、これまで紹介したようなエージェントを生成するための技術として利用されるだけでなく、要素技術をエージェント機能の高度化へ応用することも有用と考えられます。例えば、対話システムやAffective Computingの出力時の技術は、それぞれ、対話や感情表現の高度化の実現に寄与します。

デジタルヒューマン技術の応用範囲は広く、多様なエージェントを生成するだけにとどまりません。例えば、対話の高度化や感情表現の高度化によって、医療、介護などの分野では、患者など対話相手の感情を推察して応対するとともに、日本語を話すことができないケースでは同時通訳まで可能——そんな道が開ける可能性も秘めているのです。
表3 デジタルヒューマンの応用の方向性
デジタルヒューマンの応用の方向性
出所:三菱総合研究所
一方で、リアルな外見とコミュニケーションが可能なデジタルヒューマンが増えるにつれて、実在の本人と区別が難しくなる状況が増えるかもしれません。フェイク情報への対応、デジタルヒューマンの発言内容に対する責任など、これまでになかった技術的課題への対応も必要になると考えられます。デジタルヒューマンが3つのバース全般で活用されるためには、これらの課題をクリアしつつ、デジタルヒューマンに適切な役割と機能を設定することが大切なのです。

※1:バーチャル・テクノロジーによる2030年代のCX(CX:コミュニケーション・トランスフォーメーション)に関する研究成果を発表(MRIトレンドレビュー 2021.10.29)

※2:Gartner、「先進テクノロジのハイプ・サイクル:2022年」を発表(ガートナー社プレスリリース、2022年8月16日)
https://www.gartner.co.jp/ja/newsroom/press-releases/pr-20220816(閲覧日:2023年7月13日)

※3:2030年に5,275億8000万米ドルに達するデジタルヒューマンアバターの市場規模(Emergen Research(PRTIMES)、2022年1月24日)
https://prtimes.jp/main/html/rd/p/000000109.000082259.html(閲覧日:2023年7月13日)

※4:参考事例(いずれも閲覧日:2023年7月13日)
「バーチャルヒューマン」(rinna) https://rinna.co.jp/products/business/virtualhuman/
「coh(コウ)」(KDDI) https://time-space.kddi.com/au-kddi/20210607/3118
「YU(ユウ)」(GU) https://www.watch.impress.co.jp/docs/news/1239637.html
「AI NPC」(Inworld AI) https://www.inworld.ai/solutions/gaming
「デジタルクローンP.A.I.」(オルツ) https://alt.ai/pai/

※5:Mitsubishi Estate Co., Ltd. XTECH, 2020.8.7
https://xtech.mec.co.jp/articles/3614/(閲覧日:2023年7月13日)

※6:Epic Games Unreal Engine MetaHuman Creator
https://www.unrealengine.com/ja/metahuman(閲覧日:2023年7月13日)

※7:家事をしながらでもAIで音声を自分の外見に変換してZoom会議などができる「xpression camera Voice2Face」がリリース(EmbodyMe(PRTIMES)、2022年10月26日)
https://prtimes.jp/main/html/rd/p/000000008.000024788.html(閲覧日:2023年7月13日)

著者紹介