ポスト
LLama3.1よりこっちがきになった。価格30分の1のモデルなのに、性能良すぎない?GPT-4o-mini chat.lmsys.org pic.twitter.com/tBujgZ8X7D
メニューを開くみんなのコメント
メニューを開く
GPT-4o miniは、GPT-4oを教師として育てた蒸留モデルっぽい。同じ学習データを使って1桁小さなモデルを作ったとき、これだけ高い性能は実現できないだろう。(価格が30分の1なので、モデルサイズは10分の1以下だと考えています)
LLama3.1よりこっちがきになった。価格30分の1のモデルなのに、性能良すぎない?GPT-4o-mini chat.lmsys.org pic.twitter.com/tBujgZ8X7D
メニューを開くGPT-4o miniは、GPT-4oを教師として育てた蒸留モデルっぽい。同じ学習データを使って1桁小さなモデルを作ったとき、これだけ高い性能は実現できないだろう。(価格が30分の1なので、モデルサイズは10分の1以下だと考えています)