ポスト

起きたらGPT-4oが発表されてました。やはりオーディオも含めend-to-endで扱えリアルタイム対話可能なモデルとのこと。 "With GPT-4o, we trained a single new model end-to-end across text, vision, and audio, meaning that all inputs and outputs are processed by the same neural network."

メニューを開く
OpenAI@OpenAI

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: openai.com/index/hello-gp… Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks.

Shohei Hido 比戸将平@sla

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ