ポスト

OpenAIは15秒の音声サンプルから話者に似た声を生成可能なVoice Engineを開発してるので、会話して声を学習させたり、音声あげたらそれを真似ると言うことは可能になると思いますね。

メニューを開く
深津 貴之 / THE GUILD@fladdict

いまAIVtuberを新規設計するのが、すごい難しいタイミング。「Whisper→GPT→T2S」方式では、「マルチモーダル一発エンド2エンド」方式に、レスポンンスで勝てないことが確定しちまった。このタイミングでWhisperで行くか、マルチモーダル待つか… は、けっこう悩ましい技術選定が必要ぽさ

佐藤拓哉@生成AI活用ならAROUSAL Tech.@satotaku_ai

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ