ポスト
正直Chat ArenaのランキングはLLMの性能評価の中で1番信用してる ただ気をつけなければいけないのはハルシネーションの多さはこのランキングに反映しづらい点だ
メニューを開くすぐる | ChatGPTガチ勢 𝕏@SuguruKun_ai
【速報】Llama3、Claude Opusを抜きランキング2位へ ㅤ ✅英語圏ランキングにて、速攻で高順位を獲得! (ただし、総合ではSonnetと同じ5位) ㅤ 日本語の出力の様子や、他言語でのランキングを見るに、英語での会話に特化したモデルの可能性も? ㅤ またGPT-4レベル or それ以上のモデルが出てきた...