ポスト

日本語大規模言語モデルの事前学習モデルを公開しました。大人の都合で世に出せなそうな気配もあったので少々強引に出した面があり、宣伝がきちんとできていませんでしたが、Sarashina2-7B、13Bは質の高い事前学習モデルだと思います。言語モデルの研究開発にご活用ください。 huggingface.co/sbintuitions

メニューを開く

Sho Takase@shot4410

みんなのコメント

メニューを開く

フルスクラッチの日本語言語モデルだと公開されているものの中では日本語性能は最も良いです。Sarashina-2は7B、13B程度のパラメータでは追加事前学習モデルを含めても日本語性能が最も良いモデルです。

Sho Takase@shot4410

Yahoo!リアルタイム検索アプリ