ポスト

正直Chat ArenaのランキングはLLMの性能評価の中で1番信用してる ただ気をつけなければいけないのはハルシネーションの多さはこのランキングに反映しづらい点だ

メニューを開く
すぐる | ChatGPTガチ勢 𝕏@SuguruKun_ai

【速報】Llama3、Claude Opusを抜きランキング2位へ ㅤ ✅英語圏ランキングにて、速攻で高順位を獲得! (ただし、総合ではSonnetと同じ5位) ㅤ 日本語の出力の様子や、他言語でのランキングを見るに、英語での会話に特化したモデルの可能性も? ㅤ またGPT-4レベル or それ以上のモデルが出てきた...

さとけい @生成AIビジネスの最前線@AIBizNavigator

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ