ポスト

LLM的なモデルは確率的に次に来る語を予測し、生成するため、入力の途中に書かれていたことなどを忘れやすい問題がある。忘れにくさを測るためのNIAHも200k tokensあたりの性能で物忘れしにくくなっている様子が伺える。ただ、コンテキストウインドウのサイズはGeminiに大きく劣っている。 pic.twitter.com/3gZZKVKIaP

メニューを開く

オスマン帝国買うて@4niruddha

みんなのコメント

メニューを開く

発表では速度は2倍、推論コストも安くなったと発表には合ったが、Claude 3.5 Sonnetのモデルカードの方には詳細が書かれていない。理由が知りたいところ。Gemini 1.5 Flashのように蒸留や量子化などで軽量化しているのかもしれないが、はたして。 anthropic.com/news/claude-3-…

オスマン帝国買うて@4niruddha

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ