ポスト

産総研xストックマーク共同研究の成果、フルスクラッチで学習した100B級日本語LLMを公開しました。他の継続学習型のLLMと多様なタスクで比較すると、それぞれの特徴が分析できて良いです。13b級と合わせ、ベースラインの一つとして使ってもらえると嬉しいです: huggingface.co/stockmark/stoc…

メニューを開く
有馬幸介/Stockmark@kosukearima

ストックマークは、1000億パラメータの日本語LLMモデル「Stockmark-100b」を公開しました。 既存のモデルにデータ追加を行いチューニングしたものではなく、ゼロからフルスクラッチで開発したモデルであり、国内では(現状はダントツで)最大、グローバルでも最大級サイズのOSSモデルとなります。…

イバドラ@ibadora

みんなのコメント

人気ポスト

もっと見る
Yahoo!リアルタイム検索アプリ