ポスト

実験的にlightblue/suzume-llama-3-8B-japaneseの差分をMeta-Llama-3-70B-Instructに適用したモデルを作成してみました 差分を拡張して前後8Layer外の中間Layerを70Bに合わせて引き延ばして適用しています 差がわかりませんでしたが供養の為公開いたします ipynbもあります huggingface.co/mmnga/Llama-3-…

メニューを開く

ぱぷりか炒め@WMjjRpISUEt2QZZ

Yahoo!リアルタイム検索アプリ