ポスト

・どのようにRetrieval headを特定するか? -> Needle-in-a-Haystack - long contextに特定の文章(needle, key-sentence)を挿入し、そこを強く(scoreが高い)参照しているheadをRetrieval head ・各Rhはkey-sentenceの一部にしか反応していないので、Rhにも種類がありそう

メニューを開く

村山 理@sam_murayama

みんなのコメント

メニューを開く

・ベースモデルも事後学習後も同じところにRhは存在する(Intrinsic) ・Rhは発火するだけでなく、本当に機能しているのか? -> Rhをマスクすると、ランダムにマスクするより顕著にスコアが下がる(CoTありの場合が、なしより顕著) youtube.com/watch?v=AlRLp1…

村山 理@sam_murayama

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ