アプリケーションにAIによるリアルタイム声質変換を実装可能
サービス詳細
声質学習システムが、ターゲット・ボイス(キャラクターの音声)とナレーター・ボイス(使用者の音声)の対から時間的マッチング、特徴量の抽出を行い、機械学習して声質を変換するためのボイスモデルをあらかじめ構築します。
声質変換システムが、このボイスモデルから声質を変換するためのフィルターを形成し、音声変換を行います。変換処理は、およそ100msecのレイテンシーとリアルタイムでの動作が可能です。
変換エンジンはSNSやゲーム、業務用アプリケーションで利用可能なSDKを用意しています。