ポスト

GPT-4o (Omni) ●音声理解: - Whisper large v3よりも優れた音声の文字起こし機能 - 音声の話者分離(会議メモ)も可能 - 音声を別の言語に翻訳 - 音声の要約も可能 ●音声合成: - 音声の話す速度、感情などを指定できる - 音声タイプの合成ができる - 長文および短文の音声合成が可能

メニューを開く
Vaibhav (VB) Srivastav@reach_vb

Okay, GPT4 Omni is pretty rad! 🔥 From an audio-understanding standpoint, it can: 1. Transcribe audio better than Whisper large v3 2. It can diarise audio (meeting notes) 3. Can translate audio from one language to another 4. Summarise audio All of this zero/ few shot. From an…

みんなのコメント

メニューを開く

●視覚 - 画像を生成する忠実度が改善 - 動画の要約も可能 - 3Dアセットの作成が可能 - 光学文字認識(OCR)も可能 ●その他 - GPT-4 Turboの2倍の速度 - コストは50%安い - レート制限は5倍高い

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ