ポスト
実験的にlightblue/suzume-llama-3-8B-japaneseの差分をMeta-Llama-3-70B-Instructに適用したモデルを作成してみました 差分を拡張して前後8Layer外の中間Layerを70Bに合わせて引き延ばして適用しています 差がわかりませんでしたが供養の為公開いたします ipynbもあります huggingface.co/mmnga/Llama-3-…
メニューを開く実験的にlightblue/suzume-llama-3-8B-japaneseの差分をMeta-Llama-3-70B-Instructに適用したモデルを作成してみました 差分を拡張して前後8Layer外の中間Layerを70Bに合わせて引き延ばして適用しています 差がわかりませんでしたが供養の為公開いたします ipynbもあります huggingface.co/mmnga/Llama-3-…
メニューを開く