ポスト

いまAIVtuberを新規設計するのが、すごい難しいタイミング。「Whisper→GPT→T2S」方式では、「マルチモーダル一発エンド2エンド」方式に、レスポンンスで勝てないことが確定しちまった。このタイミングでWhisperで行くか、マルチモーダル待つか… は、けっこう悩ましい技術選定が必要ぽさ

メニューを開く

深津 貴之 / THE GUILD@fladdict

みんなのコメント

メニューを開く

一方でエンド2エンドほうしきh、まだボイスカスタマイズが封印されてる。発話中有に別の発話をさしこんだ場合の挙動もまだ制御できん。 この辺りどうするのがいいのか

深津 貴之 / THE GUILD@fladdict

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ