株式会社ヘッドウォータースは、NVIDIA NIM ACEマイクロサービスを活用した対話型AIサービスの開始を発表した。
デジタルヒューマンの開発は、外観のリアルティやユーザの意図を汲むインタラクション能力が求められる分野で、人間の精細な感情の表現も重要とされている。
これらを実現するためには、高精細な顔や体の表現、発話映像と音声の同期、そしてパーソナライズするための膨大なパターンのコンテンツ生成が必要だ。
そこで今回、NVIDIAのAIプラットフォーム「NVIDIA NeMo」「NVIDIA NIM」「NVIDIA NIM Agent Blueprints」などを活用し、デジタルヒューマンのアバターや自然な音声の作成を開発者がサポートする。
さらに、リアルなデジタルヒューマンとの対話は、マルチモーダルAIにより拡張する。
これまでヘッドウォータースは、ロボティクスやAIを活用した音声対話型のロボティクスやIoT、音声対話と生成AIを活用したソリューションの提供を行っている。
今回これに、デジタルヒューマンUIと視覚情報、画像認識、聴覚情報、音声認識を組み合わせ、バックエンドにマルチモーダルAIを配備することで、話しかけに対して対話内容を自動的に変化させることを可能とした。
また、NVIDIA NIMマイクロサービスを扱うことで、顧客の要望に合わせてLLM、VLM、SLM、Retrieval、Speech、Visual Designと、NVIDIAが構築したモデルを即座にデプロイ可能になる。
さらに、プロンプトエンジニアリング、ファインチューニング、RAG(外部検索拡張)に加え、クラウドロボティクスで対話内容の制御を行うことで、生成AIを活用した企業独自の業務活用シナリオに沿った対話フローもカスタム可能だ。
これにより、「バーチャル店員」「バーチャル案内係」と対話することが可能になる。
ヘッドウォータースは今後、NVIDIAとの連携を強化・拡大し、NVIDIA Omniverseプラットフォームを利用したデジタルヒューマンテクノロジーやCloud XR、デジタルツインならびに車載などのエッジLLMを推進するべく、AIを活用した新たなイノベーションを創出することを目指すとしている。
また、「NVIDIA NeMo」「NVIDIA RTX」を活用し、NVIDIAの小規模言語モデルである「Nemotron-4」を使用したファインチューニングやRAGサービスを提供する予定だ。
さらに、SyncLectとの連携を強化・拡大し、Microsoft Azureや Unreal Engine Metahumanのナレッジを活用し、デジタルヒューマンAIソリューションの提供を加速・拡張する意向だ。