株式会社電通総研は、企業向け生成AIソリューション「Know Narrator(ノウナレーター)」に、マルチモーダルRAGを搭載し、2024年11月8日より提供を開始する。
マルチモーダルRAGとは、生成AIから社内情報を参照し、回答文を生成するRAGがさらに進化し、テキストだけでなく図やグラフ、写真などからも情報を取得し、回答を生成できる技術だ。
ユースケースとしては、社内の申請手続きに関する質問に対し、マニュアル内のワークフロー図を「Know Narrator」が理解し、次のアクションや申請者など適切な回答を生成する。
また、製造現場で使用されるCAE等の解析データを読み込ませることで、グラフや画像を含む解析結果を理解し、質問に対してより適切な回答を提供する。
さらに、調査結果のグラフも読み取ることが可能で、レポート全体としての内容の総括や、ポイント抽出を行うことができる。
今後電通総研は、2024年内に生成AIの最新モデルで複雑な思考プロセスを経て回答を生成する「o1-preview」を「Know Narrator」に搭載することも計画しているとのことだ。