DeepLは、音声翻訳ソリューション「DeepL Voice」の提供開始を発表した。
「DeepL Voice」は、DeepLの言語AIプラットフォームを通じて利用できる、言語およびコミュニケーションツールとして、製品ラインナップを拡充するものだ。
このソリューションでは、「Voice for Meetings」と「Voice for Conversations」の2つのモデルが提供され、複数の異なる言語間でのオンライン会議、または対面での会話のリアルタイム翻訳を可能にする。
また、DeepLが高い品質と精度を確保するため、新しい音声技術は、さまざまなアクセントや環境を考慮した、多様なデータセットで訓練されたAIモデルを搭載している。
発表時点では英語、ドイツ語、日本語、韓国語、スウェーデン語、オランダ語、フランス語、トルコ語、ポーランド語、ポルトガル語、ロシア語、スペイン語、イタリア語の音声入力が利用でき、今後対応言語を拡大する予定だ。また、翻訳されるキャプションは、DeepL翻訳がサポートする33の言語すべてで利用可能だ。
DeepLの創業者兼CEOのヤロスワフ・クテロフスキー氏は、「新たな挑戦であったリアルタイムの音声翻訳の実現が、会社の専門知識と言語モデルを活用して顧客と緊密に連携し、企業が直面する現実の課題を解決するソリューションを提供することができた」と述べている。
さらに、「DeepLの音声翻訳では不完全な入力や発音の問題、遅延など、さまざまな問題に対処する必要がある」とも述べ、それらが不正確な翻訳やユーザー体験の低下につながる可能性をはらんでいると指摘。
それらの問題を初期段階から考慮に入れたソリューションを構築し、企業が必要に応じて複数の言語でコミュニケーションを取ることができ、言語の壁を打破できるようにしたと説明した。
なお、「DeepL Voice」は、2024年11月13日にドイツ・ベルリンで開催されたDeepLの旗艦イベント「DeepL Dialogues」のハイライトとして発表されたとのことだ。