人気ポスト
テキストのベンチマークはこれまでMMLUが比較に用いられてきたが、既にサチりつつありGPQA(Diamond)に移り競い合うが、画像のマルチモーダルは伸びしろがあり性能比較では今後注目がMMMUに移るであろうところ。ここはGPT-4oに迫る性能をClaude 3.5 Sonnetは出している。 pic.twitter.com/EeLmZlqhGt
メニューを開くみんなのコメント
メニューを開く![](https://rts-pctr.c.yimg.jp/BgIFgYJGVIVv8u0nVJvw8B2FauAYMF4jOP5zFJAV4i5e72TLbER0xQeK1l8ZZ0OLgpqGMitG1BXApEgxajE3oBUQL_irUrU_Lxv8ARjo7x0RADo0vZEwCBloJ5f-Pvu3Imxfs7PDV6oq0D4XPRkgC0q6A5i2dDZjrEs18lSJKFG_AEVBaunbR6-TLGKkKHCmHGgMJNuEiATQMMSUtMxGjxMi3pSr8bxtdJNy282KzJBjzcN3x8KzQQHcdeN4bDv1XGKXFe8qtmgj_bONAJpKbA==)
LLM的なモデルは確率的に次に来る語を予測し、生成するため、入力の途中に書かれていたことなどを忘れやすい問題がある。忘れにくさを測るためのNIAHも200k tokensあたりの性能で物忘れしにくくなっている様子が伺える。ただ、コンテキストウインドウのサイズはGeminiに大きく劣っている。 pic.twitter.com/3gZZKVKIaP
ほかの人気ポスト
幼稚園から送られてきた写真が可愛すぎる
ずぶ濡れになった僕を見て中国のお客さんが「雨ゴメンネ〜コレ着テクダサイ」と高そうなスウェットを頂いて恐縮してたんですが読めないなコレ。
うちの中3が生意気過ぎてツボってる
【指摘】「じいじ危ない」Mr.マリック、孫の言葉で免許返納を決断「自分ではよくわからない」 news.livedoor.com/article/detail… 「孫から『まっすぐ走ってない』と。妻からも『危ない』と声をかけられた」と話し「『危ない』と他人に言われたら、返納も1つの手だと一度よく考えていただきたい」と呼びかけた。
順位は変わったけど私自身の学力は変わってないことを親に訴えた図
あと1週間で新弾やんけ! トップレア渋沢栄一狙うわ
え?ちょっと待って
大久保利通が莫大な借金を残して亡くなった話
BIG納車 速すぎてこわくて泣きながら東京帰ってきた 動画は後日
トレンド18:40更新
- 1
ITビジネス
Microsoftアカウント
- microsoft アカウント
- メールアドレス
- Microsoft
- KADOKAWA
- 2
ブルートフォース
- パスワード変更
- 3
いれいすとあ
- いれいす
- たくさんあるから
- 4
ニュース
都民投票
- 明治神宮外苑
- 民間事業
- 再開発計画
- 都民の声
- 世界最大の
- 神宮外苑
- 明治神宮
- 5
エンタメ
ベテルギウス
- TOMORROW X TOGETHER
- Snow Man
- 6
エンタメ
kenちゃん
- DEAD POP FESTiVAL
- HONEY
- HYDEさん
- HYDE
- ken
- ラルク
- 7
スポーツ
中村憲剛
- SHISHAMO
- 引退試合
- sumika
- かわさき100フェス
- かわさき100
- 100フェス
- 8
アニメ・ゲーム
重大告知
- 三枝明那
- 5周年
- にじさんじ
- 9
アニメ・ゲーム
耳郎
- 常闇くん
- 耳郎ちゃん
- エンデヴァー
- 耳郎響香
- オールフォーワン
- ホークス
- AFO
- 新ビジュアル
- 10
スポーツ
サーフィン
- 好きだった